Interessante benadering! We hebben echter naar de bewijzen en de methodologie gekeken en we hebben een paar problemen gevonden, specifiek met het gebruik van hints die aan het model zijn gegeven. Hoewel de scaffold inderdaad de prestaties verbetert, lost het niet alle problemen nauwkeurig op en zou het geen gouden medaille krijgen.🧵
Lin Yang
Lin Yang22 jul, 09:18
🚨 Olympiade wiskunde + AI: We hebben Google’s Gemini 2.5 Pro getest op de nieuwe IMO 2025 problemen. Met zorgvuldige aansturing en pipeline-ontwerp loste het 5 van de 6 op — opmerkelijk voor taken die diep inzicht en creativiteit vereisen. Het model zou goud kunnen winnen! 🥇 #AI #Wiskunde #LLMs #IMO2025
27,99K