Wat een wild weekend over AI en IMO. Terugkijkend op de afgelopen 3 dagen, heb ik het volgende gezien: > Vrijdagmiddag: gelekte informatie over DeepMind die goud wint > Zaterdag 1 uur 's nachts: OpenAI ging voor de officiële aankondiging, en stal de show > In het begin dacht ik dat Google gewoon traag was vanwege marketinggoedkeuring > Toen hoorde ik van mensen bij Google dat IMO en zijzelf extra tijd nodig hadden voor verificatie > Het blijkt dat OpenAI IMO niet eens officieel betrok > Maandag: DeepMind bevestigde hun goud met schonere en esthetischere antwoorden, volledig geverifieerd door de IMO Het was leuk om de eerste te zijn die het nieuws op X deelde afgelopen vrijdag. Wat een wild weekend! Grappen terzijde, er is de laatste tijd veel hype rond wiskunde-AI, maar wat we meer nodig hebben is rigor en standaardisatie. Zoals Terence Tao opmerkte, zelfs als de resultaten er vergelijkbaar uitzien, kunnen verschillen in testformaten een wereld van verschil maken. We zijn nog ver verwijderd van duidelijke, consistente standaarden en communicatie in AI-onderzoek. Als we zinvolle vooruitgang willen, is het tijd dat de gemeenschap in actie komt. Laten we benchmarks bouwen die we allemaal kunnen vertrouwen.
Jasper
Jasper19 jul, 06:25
Slechts 20 minuten geleden werd het resultaat van de 2025 IMO bekendgemaakt. China stond op nummer 1 en @GoogleDeepMind won een gouden medaille 🥇 Toekomstige wiskundewedstrijden zullen zijn: het team van China tegen het Chinese team van de VS tegen AI.
4,29K