Guardare il modello risolvere questi problemi IMO e raggiungere prestazioni a livello oro è stato magico. Alcuni pensieri 🧵
Alexander Wei
Alexander Wei19 lug, 15:50
1/N Sono entusiasta di condividere che il nostro ultimo LLM sperimentale di ragionamento @OpenAI ha raggiunto una sfida storica nell'IA: prestazioni da medaglia d'oro nella competizione matematica più prestigiosa del mondo—l'Olimpiade Internazionale di Matematica (IMO).
Il modello risolve questi problemi senza strumenti come lean o programmazione, utilizza semplicemente il linguaggio naturale e ha anche solo 4,5 ore. Vediamo il modello ragionare a un livello molto alto - provando diverse strategie, facendo osservazioni da esempi e testando ipotesi.
È pazzesco come siamo passati dal 12% su AIME (GPT 4o) → a IMO gold in ~ 15 mesi. Siamo arrivati molto lontano molto rapidamente. Non sarei sorpreso se entro l'anno prossimo i modelli inizieranno a derivare nuovi teoremi e a contribuire alla ricerca matematica originale!
437,96K