Förtydligande av o3:s ARC-AGI-prestanda OpenAI har bekräftat: * Den släppta o3 är en annan modell än den vi testade i december 2024 * Alla utgivna o3-beräkningsnivåer är mindre än den version vi testade * Den frisläppta o3:an tränades inte på ARC-AGI-data, inte ens tågsättet * Den släppta o3 är anpassad för chatt/produktanvändning, vilket introducerar både styrkor och svagheter på ARC-AGI Vad ARC Prize kommer att göra: * Vi kommer att testa den utgivna o3 (alla beräkningsnivåer) igen och publicera uppdaterade resultat. Tidigare resultat kommer att märkas som "förhandsgranskning" * Vi kommer att testa och släppa o4-mini-resultat så snart som möjligt * Vi kommer att testa o3-pro när den är tillgänglig
127,39K