トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
o3のARC-AGI性能の明確化
OpenAIは以下を確認しています。
※発売されたo3は、2024年12月にテストしたものとは異なるモデルです
* リリースされたすべての o3 コンピューティング レベルは、テストしたバージョンよりも小さくなっています
※リリースされたo3はARC-AGIデータで学習されておらず、列車セットも登録されていませんでした
※リリースされたo3は、ARC-AGIの長所と短所をご紹介するチャット/製品使用向けにチューニングされています
ARCプライズが行うこと:
* リリースされた o3 (すべてのコンピューティング階層) を再テストし、更新された結果を公開します。以前のスコアには「プレビュー」というラベルが付けられます
* できるだけ早くo4-miniの結果をテストして発表します
※o3-proが利用可能になり次第、テストを行います
127.38K
トップ
ランキング
お気に入り