DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

o3 Pro på ARC-AGI Semi Private Eval-resultat ARC-AGI-1: * Låg: 44%, $1.64/uppgift * Medium: 57%, $3.18/uppgift * Hög: 59%, $4.16/uppgift ARC-AGI-2: * Alla resonemangsförsök: <5%, $4-7 / uppgift Att ta med sig: * O3-Pro i linje med O3 Performance * o3:s nya pris sätter ARC-AGI-1 Frontier

Att notera är *inte* samma modell som vi testade i december '24 (o3-preview) OpenAI har uttryckligen bekräftat detta. Se referens-tweet för mer information

O3-resultaten har uppdaterats för att återspegla den 80-procentiga prissänkningen

Nytt i diagrammet är datapunkter för o3 (High reasoning) och o4-mini (High reasoning). De uteslöts tidigare på grund av tidsgränser för modellen. OpenAI:s nya "bakgrundsläge" har gjort det möjligt för oss att bearbeta dessa modeller på höga beräkningsinställningar.

Se topplistan: Återskapa resultat:

108,77K

Topp

Rankning

Favoriter

Trendande på kedjan

Trendande på X

Senaste toppfinansieringarna

Mest anmärkningsvärda