DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

o3 Pro op ARC-AGI Semi Private Eval Resultaten BOOG-AGI-1: * Laag: 44%, $ 1.64/taak * Gemiddeld: 57%, $ 3.18 / taak * Hoog: 59%, $ 4.16/taak BOOG-AGI-2: * Alle redeneerinspanningen: <5%, $ 4-7/taak Afhaalrestaurants: * O3-Pro in lijn met O3 Performance * de nieuwe prijs van o3 bepaalt de grens van de ARC-AGI-1

Ter informatie, o3 Pro is *niet* hetzelfde model dat we in december '24 hebben getest (o3-preview) OpenAI heeft dit expliciet bevestigd. Zie de referentietweet voor meer informatie.

de o3-resultaten zijn bijgewerkt om de prijsverlaging van 80% weer te geven

Nieuw op de grafiek zijn datapunten voor o3 (Hoge redeneervaardigheid) en o4-mini (Hoge redeneervaardigheid). Ze werden eerder uitgesloten vanwege model time-outs. De nieuwe 'achtergrondmodus' van OpenAI heeft ons in staat gesteld om deze modellen op hoge rekeninstellingen te verwerken.

Bekijk de ranglijst: Reproduceer resultaten:

108,74K

Boven

Positie

Favorieten

Populair op onchain

Populair op X

Recente topfinanciering

Belangrijkste