Noam Brown di openAI ha confermato 2 punti chiave: 1) il modello che ha raggiunto prestazioni di livello oro IMO è di uso generale — non è stato ottimizzato per la matematica e l'ha raggiunto senza utilizzare strumenti 2) openAI ha sviluppato nuove tecniche che rendono i LLM molto migliori potrebbe essere una nuova svolta nel RL o un miglioramento algoritmico?
27,89K