Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Mark Chen
Forskningssjef i @OpenAI. Trener for USAs IOI-lag.
Vi oppnådde gullmedaljenivå på årets IMO! Modellen vår tenker og skriver bevis på klart, vanlig engelsk - ingen formell kode kreves.
I motsetning til de smalere systemene som ble brukt i tidligere konkurranser, er modellen vår bygget for å resonnere bredt, langt utover konkurranseproblemer.

Alexander Wei23 timer siden
1/N Jeg er glad for å dele at vår siste @OpenAI eksperimentelle resonnement LLM har oppnådd en langvarig stor utfordring innen AI: gullmedaljenivå på verdens mest prestisjefylte matematikkkonkurranse – International Math Olympiad (IMO).

107,41K
Vi konkurrerte live i @atcoder World Finals Heuristic Contest og kom på 2.-plass!
Modeller som o3 rangerer blant topp-100 i kodings-/matematikkkonkurranser, men AFAIK dette er den første topp-3-plasseringen i en førsteklasses kodings-/matematikkkonkurranse. Det er et stort gap mellom topp-100 og topp-3!

Ahmed El-Kishky17. juli, 02:52
Gratulerer @FakePsyho med en neglebitende forestilling! Flotte visninger også fra @bminaiev, @andresnds og @_lorenzkuhn som representerer OpenAI. Det har vært fantastisk å sponse AtCoder World Finals @atcoder. Vi er glade for å dele noen av modellløsningene med verden.
53,28K
Mark Chen lagt ut på nytt
Jeg er ekstremt begeistret for potensialet i tankekjedetrofasthet og tolkbarhet. Det har betydelig påvirket utformingen av resonneringsmodellene våre, og starter med o1-forhåndsvisning.
Ettersom AI-systemer bruker mer databehandling, for eksempel på langsiktige forskningsproblemer, er det avgjørende at vi har en måte å overvåke deres interne prosess på. Den fantastiske egenskapen til skjulte CoT-er er at selv om de starter forankret i språk vi kan tolke, er den skalerbare optimaliseringsprosedyren ikke i strid med observatørens evne til å verifisere modellens intensjon - i motsetning til for eksempel direkte tilsyn med en belønningsmodell.
Spenningen her er at hvis CoT-ene ikke var skjult som standard, og vi ser på prosessen som en del av AIs utdata, er det mye insentiv (og i noen tilfeller nødvendighet) til å sette tilsyn på den. Jeg tror vi kan jobbe mot det beste fra begge verdener her - trene modellene våre til å være gode til å forklare deres interne resonnement, men samtidig beholde evnen til å verifisere det av og til.
CoT-trofasthet er en del av en bredere forskningsretning, som er trening for tolkbarhet: å sette mål på en måte som trener i det minste deler av systemet til å forbli ærlig og overvåkelig med skala. Vi fortsetter å øke investeringene våre i denne forskningen ved OpenAI.
264,13K
Vi overansetter ikke på forskning. Og på talentbaren - det er noen virkelig fenomenale mennesker som blir med i løpet av den neste måneden!
Jeg tilbrakte år i handel til mangel på mening slet meg ned. Jeg har aldri følt det på OAI - det er så mye mer tilfredsstillende å bygge ting med innvirkning i den virkelige verden.

Iain Dunning17. mai 2025
Are you a researcher at OAI/Anthropic/etc and tired of overhiring, the orgchart chaos, the lowered talent bar, want to move to NYC, or just want to do something different? Email me, DM me, mail a postcard. We've got a new datacenter full of B200s, tight team, and very successful.
221,89K
Mark Chen lagt ut på nytt
Har nettopp lansert Codex, en programvareutviklingsagent som kan jobbe med mange oppgaver parallelt.
Den kjører på sin egen skybaserte databehandlingsinfrastruktur, og kan fikse feil, svare på spørsmål om koden din, kjøre tester osv.
Føles som et skritt mot fremtiden for programvareutvikling.
254,94K
Så spent på å jobbe med @fidjissimo - hun er en produktvisjonær!

Sam Altman8. mai 2025
so excited that @fidjissimo is joining openai in a new role: ceo of applications, reporting to me.
i'll remain ceo of openai, but in this new configuration i'll be able to increase my focus on research, compute, and safety.
these are critical as we approach superintelligence.
77,82K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til