Che fine settimana selvaggio riguardo all'IA e all'IMO. Ripensando agli ultimi 3 giorni, ho assistito a: > Venerdì pomeriggio: informazioni trapelate su DeepMind che vince l'oro > Sabato 1am: OpenAI ha anticipato l'annuncio ufficiale, rubando la scena > Inizialmente pensavo che Google fosse solo lento a causa dell'approvazione del marketing > Poi ho sentito da persone di Google che IMO e loro stessi avevano bisogno di ulteriore tempo per la verifica > Si scopre che OpenAI non ha nemmeno coinvolto ufficialmente IMO > Lunedì: DeepMind ha confermato il loro oro con risposte più pulite ed estetiche, completamente verificate dall'IMO È stato divertente essere il primo a condividere la notizia su X venerdì scorso. Che fine settimana selvaggio! Scherzi a parte, c'è molto entusiasmo attorno all'IA matematica ultimamente, ma ciò di cui abbiamo più bisogno è rigore e standardizzazione. Come ha sottolineato Terence Tao, anche se i risultati sembrano simili, le differenze nel formato di test possono fare una grande differenza. Siamo ancora lontani dall'avere standard e messaggi chiari e coerenti nella ricerca sull'IA. Se vogliamo un progresso significativo, è tempo che la comunità faccia un passo avanti. Costruiamo benchmark di cui possiamo tutti fidarci.
Jasper
Jasper19 lug, 06:25
Solo 20 minuti fa, il risultato dell'IMO 2025 è stato pubblicato. La Cina si è classificata al primo posto e @GoogleDeepMind ha vinto una medaglia d'oro 🥇 Le future competizioni matematiche saranno tra la squadra cinese e la squadra cinese degli USA contro l'IA.
4,29K