有趣的方法!然而,我們查看了證據和方法論,發現了一些問題,特別是在給模型的提示使用上。雖然支架確實提高了性能,但並未準確解決所有問題,也不會獲得金牌。🧵
Lin Yang
Lin Yang7月22日 09:18
🚨 奧林匹克數學 + AI: 我們在全新的 IMO 2025 問題上運行了 Google 的 Gemini 2.5 Pro。通過仔細的提示和管道設計,它解決了 6 個中的 5 個——對於需要深刻洞察和創造力的任務來說,這是相當了不起的。 這個模型有可能贏得金牌! 🥇 #AI #數學 #LLMs #IMO2025
28.01K