openAI 的 Noam Brown 確認了兩個關鍵點: 1) 達到 IMO 金牌級表現的模型是通用的 — 並不是針對數學進行微調,且在不使用工具的情況下達成 2) openAI 開發了新的技術,使 LLMs 的表現大幅提升 這可能是新的 RL 突破還是算法改進?
27.89K