一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

o3 Pro on ARC-AGI Semi Private 評估結果 ARC-AGI-1 的： * 低：44%，1.64 USD/任務 * 中等：57%，3.18 美元/任務 * 高：59%，4.16 USD/任務 ARC-AGI-2 的： * 所有推理努力：<5%，4-7 美元/任務要點： * O3-Pro 與 O3 性能一致 * o3 的新價格設定了ARC-AGI-1 Frontier

請注意，o3 Pro *不是*我們在 24 年 12 月測試的相同型號（o3-preview） OpenAI 已經明確證實了這一點。有關更多資訊，請參閱參考推文

O3 結果已更新，以反映價格降低80%

圖表中新增了 o3 （高推理）和 o4-mini （高推理）的數據點。它們以前由於模型超時而被排除。 OpenAI 的新“後台模式”使我們能夠在高計算設置下處理這些模型。

查看排行榜：重現結果：

108.7K