openAI Noam Brown a confirmé 2 points clés : 1) le modèle qui a atteint une performance de niveau or IMO est polyvalent — non affiné pour les mathématiques, et l'a atteint sans utiliser d'outils 2) openAI a développé de nouvelles techniques qui rendent les LLM beaucoup meilleurs pourrait-il s'agir d'une nouvelle percée en RL ou d'une amélioration algorithmique ?
27,86K