o3のARC-AGI性能の明確化 OpenAIは以下を確認しています。 ※発売されたo3は、2024年12月にテストしたものとは異なるモデルです * リリースされたすべての o3 コンピューティング レベルは、テストしたバージョンよりも小さくなっています ※リリースされたo3はARC-AGIデータで学習されておらず、列車セットも登録されていませんでした ※リリースされたo3は、ARC-AGIの長所と短所をご紹介するチャット/製品使用向けにチューニングされています ARCプライズが行うこと: * リリースされた o3 (すべてのコンピューティング階層) を再テストし、更新された結果を公開します。以前のスコアには「プレビュー」というラベルが付けられます * できるだけ早くo4-miniの結果をテストして発表します ※o3-proが利用可能になり次第、テストを行います
127.38K