Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

o3 Pro em ARC-AGI Semi Private Eval Resultados ARC-AGI-1: * Baixo: 44%, $1.64/tarefa * Médio: 57%, $3.18/tarefa * Alta: 59%, $ 4.16 / tarefa ARC-AGI-2: * Todos os esforços de raciocínio: <5%, $4-7/tarefa Conclusões: * O3-Pro em linha com o desempenho O3 * O novo preço da o3 define a fronteira ARC-AGI-1

A notar, o o3 Pro *não* é o mesmo modelo que testámos em Dez ‘24 (o3-preview) A OpenAI confirmou explicitamente isso. Veja o tweet de referência para mais informações.

os resultados do o3 foram atualizados para refletir a redução de 80% no preço

Novos no gráfico estão os pontos de dados para o3 (Raciocínio elevado) e o4-mini (Raciocínio elevado). Eles foram anteriormente excluídos devido a tempos limite do modelo. O novo 'modo de fundo' da OpenAI nos permitiu processar esses modelos em configurações de alta computação.

Veja o quadro de líderes: Reproduzir resultados:

108,74K

Top

Classificação

Favoritos

Tendências on-chain

Popular no X

Principais financiamentos atuais

Mais notável