AIとIMOの週末はなんとワイルドなことでしょう。過去3日間を振り返ってみると、私は次のことを目撃しました。 > 金曜日の午後: DeepMind の金メダル獲得に関する情報がリークされました > 土曜日午前 1 時: OpenAI が公式発表を前面に走らせ、注目を集めました > 当初は、Googleが販売承認のために遅いだけだと思っていました > その後、Google の人々から、IMO と彼ら自身が検証に余分な時間が必要だと聞きました > OpenAIはIMOを正式に関与させていなかったことが判明 >月曜日: DeepMind は、IMO によって完全に検証された、よりクリーンで美しい回答で金メダルを確認しました 先週の金曜日にXで最初にこのニュースを共有したのは楽しかったです。なんてワイルドな週末でしょう! 冗談はさておき、最近数学 AI については多くの誇大宣伝が行われていますが、もっと必要なのは厳密さと標準化です。テレンス・タオが指摘したように、たとえ結果が似ていても、テスト形式の違いは大きな違いを生む可能性があります。AI 研究における明確で一貫した基準とメッセージには程遠いです。 有意義な進歩を望むなら、コミュニティがステップアップする時が来ました。誰もが信頼できるベンチマークを構築しましょう。
Jasper
Jasper7月19日 06:25
わずか20分前、2025年のIMOの結果が発表されました。 中国が1位、@GoogleDeepMindが金メダル🥇を獲得 今後の数学大会は中国チーム対アメリカ中国チーム対AIになります
4.29K