ik ben veel meer geneigd te zeggen dat het RL *systeem* binnen OpenAI AGI is in plaats van een vast modelcheckpoint dat eruit komt.
maar wat je echt wilt, is een interface voor zelfverbetering die meer lijkt op e-mail dan op software-engineering. je wilt het kunnen vertellen om beter te worden in PowerPoint, en dan ontdekt het hoe het duurzaam beter kan worden.
4,57K