Verduidelijking van de ARC-AGI-prestaties van o3 OpenAI heeft bevestigd: * De uitgebrachte o3 is een ander model dan wat we in december 2024 hebben getest * Alle uitgebrachte o3-rekenlagen zijn kleiner dan de versie die we hebben getest * De vrijgegeven o3 is niet getraind op ARC-AGI data, zelfs niet op het treinstel * De uitgebrachte o3 is afgestemd op chat/productgebruik, wat zowel sterke als zwakke punten op ARC-AGI introduceert Wat zal de ARC-prijs doen: * We zullen de vrijgegeven o3 (alle compute tiers) opnieuw testen en bijgewerkte resultaten publiceren. Eerdere scores worden gelabeld als "preview" * We zullen de o4-mini resultaten zo snel mogelijk testen en vrijgeven * We zullen o3-pro testen zodra deze beschikbaar is
127,38K