Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Objasnění výkonu ARC-AGI o3
OpenAI potvrdila:
* Vydaný model o3 je jiný model, než jaký jsme testovali v prosinci 2024
* Všechny vydané úrovně o3 compute jsou menší než verze, kterou jsme testovali
* Uvolněné o3 nebylo natrénováno na datech ARC-AGI, dokonce ani vlaková souprava
* Vydané o3 je vyladěno pro použití v chatu/produktu, což představuje silné i slabé stránky na ARC-AGI
Co ARC Prize udělá:
* Znovu otestujeme vydané o3 (všechny výpočetní úrovně) a zveřejníme aktualizované výsledky. Předchozí skóre budou označena jako "náhled"
* Výsledky o4-mini otestujeme a zveřejníme co nejdříve
* O3-pro otestujeme, jakmile bude k dispozici
127,35K
Top
Hodnocení
Oblíbené