DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

1/N Sono entusiasta di condividere che il nostro ultimo LLM sperimentale di ragionamento @OpenAI ha raggiunto una sfida storica nell'IA: prestazioni da medaglia d'oro nella competizione matematica più prestigiosa del mondo—l'Olimpiade Internazionale di Matematica (IMO).

4/N In secondo luogo, le sottomissioni IMO sono prove difficili da verificare e articolate su più pagine. I progressi qui richiedono di andare oltre il paradigma RL di ricompense chiare e verificabili. Facendo ciò, abbiamo ottenuto un modello in grado di elaborare argomentazioni complesse e inoppugnabili al livello dei matematici umani.

5/N Oltre al risultato stesso, sono entusiasta del nostro approccio: raggiungiamo questo livello di capacità non attraverso una metodologia ristretta e specifica per compiti, ma aprendo nuove strade nell'apprendimento per rinforzo di uso generale e nella scalabilità del calcolo durante il test.

8/N A proposito, stiamo per rilasciare GPT-5 e siamo entusiasti che tu possa provarlo. Ma per essere chiari: l'IMO gold LLM è un modello di ricerca sperimentale. Non abbiamo intenzione di rilasciare nulla con questo livello di capacità matematica per diversi mesi.

9/N Tuttavia, questo sottolinea quanto velocemente l'IA sia avanzata negli ultimi anni. Nel 2021, il mio relatore di dottorato @JacobSteinhardt mi ha chiesto di prevedere i progressi matematici dell'IA entro luglio 2025. Ho previsto il 30% sul benchmark MATH (e pensavo che tutti gli altri fossero troppo ottimisti). Invece, abbiamo l'oro IMO.

11/N Infine, vorremmo congratularci con tutti i partecipanti dell'IMO 2025 per il loro traguardo! Siamo orgogliosi di avere molti ex partecipanti all'IMO in @OpenAI e riconosciamo che questi sono alcuni dei giovani talenti più brillanti del futuro.

131,55K

Principali

Ranking

Preferiti

On-chain di tendenza

Di tendenza su X

Principali fondi recenti

Più popolari