DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

o3 Pro pe rezultatele evaluării semi-private ARC-AGI ARC-AGI-1: * Scăzut: 44%, 1,64 USD/sarcină * Mediu: 57%, 3,18 USD/sarcină * Ridicat: 59%, 4,16 USD/sarcină ARC-AGI-2: * Toate eforturile de raționament: <5%, 4-7 USD/sarcină Concluzii: * O3-Pro în conformitate cu performanța O3 * Noul preț al o3 stabilește ARC-AGI-1 Frontier

De reținut, o3 Pro *nu* este același model pe care l-am testat în decembrie '24 (o3-preview) OpenAI a confirmat în mod explicit acest lucru. Vezi tweet-ul de referință pentru mai multe informații

Rezultatele O3 au fost actualizate pentru a reflecta reducerea cu 80% a prețului

Noi în grafic sunt punctele de date pentru o3 (raționament ridicat) și o4-mini (raționament ridicat). Acestea au fost excluse anterior din cauza timpilor de expirare ai modelului. Noul "mod de fundal" al OpenAI ne-a permis să procesăm aceste modele pe setări de calcul ridicate.

Vezi clasamentul: Reproduceți rezultatele:

108,77K

Limită superioară

Clasament

Favorite

La modă pe lanț

La modă pe X

Principalele finanțări recente

Cele mai importante