Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

o3 Pro on Wyniki półprywatnej oceny ARC-AGI ARC-AGI-1: * Niski: 44%, 1,64 USD/zadanie * Średni: 57%, 3,18 USD/zadanie * Wysoki: 59%, 4,16 USD/zadanie ARC-AGI-2: * Wszystkie wysiłki związane z rozumowaniem: <5%, 4-7 USD/zadanie Dania na wynos: * O3-Pro zgodnie z wydajnością O3 * nowa cena o3 wyznacza ARC-AGI-1 Frontier

Należy zauważyć, że o3 Pro *nie* jest tym samym modelem, który testowaliśmy w grudniu '24 (o3-preview) OpenAI wyraźnie to potwierdziło. Zobacz tweet referencyjny, aby uzyskać więcej informacji.

Wyniki o3 zostały zaktualizowane, aby odzwierciedlić 80% redukcję ceny.

Nowością na wykresie są punkty danych dla o3 (Wysokie rozumowanie) i o4-mini (Wysokie rozumowanie). Wcześniej zostały one wykluczone z powodu przekroczenia czasu modelu. Nowy 'tryb w tle' OpenAI umożliwił nam przetwarzanie tych modeli w ustawieniach wysokiej mocy obliczeniowej.

Zobacz tabelę wyników: Powtórz wyniki:

108,73K

Najlepsze

Ranking

Ulubione

Trendy onchain

Trendy na X

Niedawne największe finansowanie

Najbardziej godne uwagi