Objasnění výkonu ARC-AGI o3 OpenAI potvrdila: * Vydaný model o3 je jiný model, než jaký jsme testovali v prosinci 2024 * Všechny vydané úrovně o3 compute jsou menší než verze, kterou jsme testovali * Uvolněné o3 nebylo natrénováno na datech ARC-AGI, dokonce ani vlaková souprava * Vydané o3 je vyladěno pro použití v chatu/produktu, což představuje silné i slabé stránky na ARC-AGI Co ARC Prize udělá: * Znovu otestujeme vydané o3 (všechny výpočetní úrovně) a zveřejníme aktualizované výsledky. Předchozí skóre budou označena jako "náhled" * Výsledky o4-mini otestujeme a zveřejníme co nejdříve * O3-pro otestujeme, jakmile bude k dispozici
127,35K