Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Verduidelijking van de ARC-AGI-prestaties van o3
OpenAI heeft bevestigd:
* De uitgebrachte o3 is een ander model dan wat we in december 2024 hebben getest
* Alle uitgebrachte o3-rekenlagen zijn kleiner dan de versie die we hebben getest
* De vrijgegeven o3 is niet getraind op ARC-AGI data, zelfs niet op het treinstel
* De uitgebrachte o3 is afgestemd op chat/productgebruik, wat zowel sterke als zwakke punten op ARC-AGI introduceert
Wat zal de ARC-prijs doen:
* We zullen de vrijgegeven o3 (alle compute tiers) opnieuw testen en bijgewerkte resultaten publiceren. Eerdere scores worden gelabeld als "preview"
* We zullen de o4-mini resultaten zo snel mogelijk testen en vrijgeven
* We zullen o3-pro testen zodra deze beschikbaar is
127,38K
Boven
Positie
Favorieten