熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
看到這個模型解決這些 IMO 問題並達到金級表現,真是太神奇了。幾個想法 🧵

7月19日 15:50
1/N 我很高興地分享,我們最新的 @OpenAI 實驗性推理 LLM 在人工智慧領域達成了一項長期以來的重大挑戰:在世界上最具聲望的數學競賽——國際數學奧林匹克(IMO)中獲得金牌級別的表現。

這個模型在沒有像 lean 或編碼這樣的工具的情況下解決這些問題,它僅僅使用自然語言,並且只有 4.5 小時。我們看到模型在非常高的層次上進行推理——嘗試不同的策略,從例子中進行觀察,並測試假設。
我們從 AIME (GPT 4o) 的 12% 到現在的 IMO 金牌,這真是太瘋狂了,僅僅 15 個月的時間。我們進步得非常快。如果明年模型能夠推導出新的定理並對原創數學研究做出貢獻,我也不會感到驚訝!
437.96K
熱門
排行
收藏