openAI の Noam Brown 氏は、次の 2 つの重要なポイントを確認しました。 1) IMOゴールドレベルの性能に達したモデルは汎用です。 数学用に微調整されておらず、ツールを使用せずに達成しました 2) openAI は、LLM を大幅に向上させる新しい技術を開発しました それは新しいRLのブレークスルーなのか、それともアルゴリズムの改善なのか?
27.89K