熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
關於人工智慧和IMO的這個狂野週末。回顧過去三天,我目睹了:
> 星期五下午:有關DeepMind獲得金獎的洩漏信息
> 星期六凌晨1點:OpenAI搶先發布官方公告,搶走了風頭
> 最初以為Google只是因為市場批准而反應慢
> 然後聽到Google的人說IMO和他們自己需要額外的時間進行驗證
> 結果發現OpenAI甚至沒有正式涉及IMO
> 星期一:DeepMind確認了他們的金獎,提供了更清晰和更美觀的答案,完全由IMO驗證
上週五在X上第一個分享這個消息真是有趣。真是個狂野的週末!
開玩笑的,最近圍繞數學AI有很多炒作,但我們更需要的是嚴謹性和標準化。正如Terence Tao所指出的,即使結果看起來相似,測試格式的差異也可能造成天壤之別。我們仍然遠未擁有清晰、一致的標準和信息在AI研究中。
如果我們想要有意義的進展,是時候讓社區站出來了。讓我們建立可以信任的基準。
4.29K
熱門
排行
收藏