Clarificando o desempenho ARC-AGI da o3 A OpenAI confirmou: * O o3 lançado é um modelo diferente do que testamos em dezembro de 2024 * Todas as camadas de computação o3 lançadas são menores do que a versão que testamos * O o3 liberado não foi treinado em dados ARC-AGI, nem mesmo o conjunto de trens * O o3 lançado é ajustado para uso de chat/produto, o que introduz pontos fortes e fracos no ARC-AGI O que o Prêmio ARC fará: * Vamos testar novamente o o3 lançado (todos os níveis de computação) e publicar resultados atualizados. As pontuações anteriores serão rotuladas como "visualização" * Vamos testar e liberar o4-mini resultados o mais rápido possível * Vamos testar o o3-pro uma vez disponível
127,38K