La cosa più notevole di questo risultato è che questo modello di ragionamento sperimentale senza nome ha raggiunto questo punteggio senza alcun utilizzo di strumenti - sembra essere solo un altro classico LLM che predice il prossimo token con un sacco di apprendimento per rinforzo sovrapposto.
Alexander Wei
Alexander Wei19 lug, 15:50
1/N Sono entusiasta di condividere che il nostro ultimo LLM sperimentale di ragionamento @OpenAI ha raggiunto una sfida storica nell'IA: prestazioni da medaglia d'oro nella competizione matematica più prestigiosa del mondo—l'Olimpiade Internazionale di Matematica (IMO).
@brandonwilson @Yossi_Dahan_ Non sono affatto d'accordo, per motivi in parte illustrati qui.
Simon Willison
Simon Willison18 lug, 04:08
Continuo a non avere paura che questi strumenti possano rendere obsolete le mie competenze come ingegnere del software.
40,93K