Es sorprendentemente difícil averiguar si OpenAI y Google DeepMind realmente obtuvieron un IMO Gold "justo y cuadrado" o no. Espero más análisis.
Jasper Dekoninck
Jasper Dekoninck22 jul, 17:20
¡Enfoque interesante! Sin embargo, analizamos las pruebas y la metodología y encontramos algunos problemas, específicamente con el uso de pistas dadas al modelo. Si bien el andamio mejora el rendimiento, no resuelve todos los problemas con precisión y no obtendría una medalla de oro. 🧵
1.3K