¡Enfoque interesante! Sin embargo, analizamos las pruebas y la metodología y encontramos algunos problemas, específicamente con el uso de pistas dadas al modelo. Si bien el andamio mejora el rendimiento, no resuelve todos los problemas con precisión y no obtendría una medalla de oro. 🧵
Lin Yang
Lin Yang22 jul, 09:18
🚨 Olimpiada de matemáticas + IA: Ejecutamos Gemini 2.5 Pro de Google en los nuevos problemas de IMO 2025. Con un cuidadoso diseño de canalización, resolvió 5 de 6, lo que es notable para tareas que exigen una visión profunda y creatividad. ¡La modelo podría ganar el oro! 🥇 #AI #Math #LLMs #IMO2025
28.01K