DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Résultats de l’évaluation semi-privée o3 Pro on ARC-AGI ARC-AGI-1 : * Faible : 44 %, 1,64 $/tâche * Moyen : 57 %, 3,18 $/tâche * Élevé : 59 %, 4,16 $/tâche ARC-AGI-2 : * Tous les efforts de raisonnement : <5 %, 4 à 7 $/tâche À retenir : * O3-Pro en ligne avec O3 Performance * Le nouveau prix d’o3 fixe l’ARC-AGI-1 Frontier

À noter, o3 Pro n'est *pas* le même modèle que celui que nous avons testé en décembre 2024 (o3-preview) OpenAI a explicitement confirmé cela. Voir le tweet de référence pour plus d'informations.

Les résultats o3 ont été mis à jour pour refléter la réduction de 80 % du prix.

Nouveaux sur le graphique, des points de données pour o3 (Raisonnement élevé) et o4-mini (Raisonnement élevé). Ils avaient été précédemment exclus en raison de délais d'attente du modèle. Le nouveau « mode arrière-plan » d'OpenAI nous a permis de traiter ces modèles avec des paramètres de calcul élevés.

Voir le classement : Reproduire les résultats :

108,72K

Meilleurs

Classement

Favoris

Tendance on-chain

Tendance sur X

Récents financements de premier plan

Les plus notables