Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Förtydligande av o3:s ARC-AGI-prestanda
OpenAI har bekräftat:
* Den släppta o3 är en annan modell än den vi testade i december 2024
* Alla utgivna o3-beräkningsnivåer är mindre än den version vi testade
* Den frisläppta o3:an tränades inte på ARC-AGI-data, inte ens tågsättet
* Den släppta o3 är anpassad för chatt/produktanvändning, vilket introducerar både styrkor och svagheter på ARC-AGI
Vad ARC Prize kommer att göra:
* Vi kommer att testa den utgivna o3 (alla beräkningsnivåer) igen och publicera uppdaterade resultat. Tidigare resultat kommer att märkas som "förhandsgranskning"
* Vi kommer att testa och släppa o4-mini-resultat så snart som möjligt
* Vi kommer att testa o3-pro när den är tillgänglig
127,39K
Topp
Rankning
Favoriter