Wyjaśnienie wydajności o3 ARC-AGI OpenAI potwierdziło: * Wydany o3 to inny model niż ten, który testowaliśmy w grudniu 2024 roku * Wszystkie wydane warstwy obliczeniowe o3 są mniejsze niż testowana wersja * Uwolniony o3 nie był trenowany na danych ARC-AGI, nawet na zestawie pociągu * Wydany o3 jest dostrojony do użytku na czacie/produkcie, co wprowadza zarówno mocne, jak i słabe strony ARC-AGI Do czego służy ARC Prize: * Ponownie przetestujemy wydaną usługę o3 (wszystkie warstwy obliczeniowe) i opublikujemy zaktualizowane wyniki. Wcześniejsze wyniki będą oznaczone jako "wersja zapoznawcza" * Przetestujemy i opublikujemy wyniki o4-mini tak szybko, jak to możliwe * Przetestujemy o3-pro, gdy będzie dostępny
127,38K