Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/N Sono entusiasta di condividere che il nostro ultimo LLM sperimentale di ragionamento @OpenAI ha raggiunto una sfida storica nell'IA: prestazioni da medaglia d'oro nella competizione matematica più prestigiosa del mondo—l'Olimpiade Internazionale di Matematica (IMO).

4/N In secondo luogo, le sottomissioni IMO sono prove difficili da verificare e articolate su più pagine. I progressi qui richiedono di andare oltre il paradigma RL di ricompense chiare e verificabili. Facendo ciò, abbiamo ottenuto un modello in grado di elaborare argomentazioni complesse e inoppugnabili al livello dei matematici umani.




5/N Oltre al risultato stesso, sono entusiasta del nostro approccio: raggiungiamo questo livello di capacità non attraverso una metodologia ristretta e specifica per compiti, ma aprendo nuove strade nell'apprendimento per rinforzo di uso generale e nella scalabilità del calcolo durante il test.
8/N A proposito, stiamo per rilasciare GPT-5 e siamo entusiasti che tu possa provarlo. Ma per essere chiari: l'IMO gold LLM è un modello di ricerca sperimentale. Non abbiamo intenzione di rilasciare nulla con questo livello di capacità matematica per diversi mesi.
9/N Tuttavia, questo sottolinea quanto velocemente l'IA sia avanzata negli ultimi anni. Nel 2021, il mio relatore di dottorato @JacobSteinhardt mi ha chiesto di prevedere i progressi matematici dell'IA entro luglio 2025. Ho previsto il 30% sul benchmark MATH (e pensavo che tutti gli altri fossero troppo ottimisti). Invece, abbiamo l'oro IMO.

11/N Infine, vorremmo congratularci con tutti i partecipanti dell'IMO 2025 per il loro traguardo! Siamo orgogliosi di avere molti ex partecipanti all'IMO in @OpenAI e riconosciamo che questi sono alcuni dei giovani talenti più brillanti del futuro.
131,55K
Principali
Ranking
Preferiti