Grattis till GDM-teamet på deras IMO-resultat! Jag tror att deras parallella framgångar belyser hur snabbt AI-utvecklingen går. Deras tillvägagångssätt var lite annorlunda än vårt, men jag tror att det visar att det finns många forskningsriktningar för vidare framsteg. Några tankar om vår modell och resultat 🧵
~ 2 månader sedan mailade IMO oss om att delta i en formell (Lean) version av IMO. Vi har fokuserat på att resonera generellt på naturligt språk utan de begränsningar som Lean innebär, så vi tackade nej. Vi blev aldrig tillfrågade om ett matematiskt alternativ på naturligt språk.
Under de senaste månaderna har vi gjort stora framsteg när det gäller det allmänna resonemanget. Detta innebar att samla in, kurera och träna på högkvalitativa matematiska data, som också kommer att användas i framtida modeller. I vår IMO-utvärdering använde vi inte RAG eller några verktyg.
Innan vi delade med oss av våra resultat pratade vi med en IMO-styrelsemedlem, som bad oss att vänta till efter prisceremonin för att offentliggöra det, en begäran som vi gladeligen respekterade.
Vi meddelade klockan ~1 PT (6 AEST), efter att prisceremonin avslutats. Inte vid något tillfälle har någon begärt att vi ska meddela senare än så.
Mer än något annat är vi glada över att dela våra framsteg och resultat med världen. AI:s förmåga att resonera utvecklas snabbt, och dessa IMO-resultat visar det verkligen.
295,9K