Interessanter Ansatz! Wir haben jedoch die Beweise und die Methodik betrachtet und einige Probleme festgestellt, insbesondere mit der Verwendung von Hinweisen, die dem Modell gegeben wurden. Während das Gerüst die Leistung tatsächlich verbessert, löst es nicht alle Probleme genau und würde keine Goldmedaille erhalten.🧵
Lin Yang
Lin Yang22. Juli, 09:18
🚨 Olympiade Mathematik + KI: Wir haben Googles Gemini 2.5 Pro an den neuen IMO 2025 Aufgaben getestet. Mit sorgfältigem Prompting und Pipeline-Design hat es 5 von 6 gelöst – bemerkenswert für Aufgaben, die tiefes Verständnis und Kreativität erfordern. Das Modell könnte Gold gewinnen! 🥇 #KI #Mathematik #LLMs #IMO2025
25,91K