For en vill helg med AI og IMO. Når jeg ser tilbake på de siste 3 dagene, var jeg vitne til: > fredag ettermiddag: lekket informasjon om at DeepMind vant gull > lørdag kl. 1: OpenAI kjørte den offisielle kunngjøringen og stjal rampelyset > trodde først at Google bare var treg på grunn av markedsføringsgodkjenning > hørte deretter fra Google-folk at IMO og dem selv trengte ekstra tid til verifisering > Det viser seg at OpenAI ikke engang involverte IMO offisielt > mandag: DeepMind bekreftet gullet sitt med renere og mer estetiske svar, fullt verifisert av IMO Det var gøy å være den første til å dele nyheten på X sist fredag. For en vill helg! Spøk til side, det er mye hype rundt matematisk AI i det siste, men det vi trenger mer av er strenghet og standardisering. Som Terence Tao påpekte, selv om resultatene ser like ut, kan forskjeller i testformat utgjøre en verden av forskjell. Vi er fortsatt langt fra å ha klare, konsistente standarder og budskap innen AI-forskning. Hvis vi ønsker meningsfull fremgang, er det på tide at samfunnet trapper opp. La oss bygge benchmarks vi alle kan stole på.
Jasper
Jasper19. juli, 06:25
For bare 20 minutter siden var resultatet av 2025 IMO ute. Kina rangert som nr.1 og @GoogleDeepMind vant en gullmedalje 🥇 Fremtidige matematikkkonkurranser vil være Kina-lag vs USAs kinesiske lag vs AI
4,28K