Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Cercetarea raționamentului @OpenAI | Au creat în comun AI-urile de poker supraumane Libratus/Pluribus, CICERO Diplomacy AI și modelele de raționament OpenAI o3 / o1 / 🍓 raționament
Poate fi greu să "simți AGI" până când nu vezi un AI stăpânind un domeniu de care ții profund. Fiecare va avea momentul lui Lee Sedol la un moment diferit.

Dave White22 iul., 08:59
știrile openai IMO m-au lovit destul de tare în acest weekend
Cred că sunt încă în faza acută a impactului
Mă consider un matematician profesionist (o caracterizare cu care unii matematicieni profesioniști ar putea avea probleme, dar partidul meu regulile mele) și nu cred că pot răspunde la o singură întrebare IMO
OK, da, IMO este propria sa subsecțiune atletică de matematică pentru care nu m-am antrenat, etc. etc., dar. dacă întâlnesc pe cineva în sălbăticie care are un aur IMO, actualizez imediat la "această persoană este mult mai bună la matematică decât mine"
Acum o grămadă de roboți o pot face. Ca cineva care are o mare parte din identitatea sa și din viața sa reală construită în jurul "este bun la matematică", este un pumn în stomac. este un fel de moarte.
De exemplu, într-o zi descoperi că poți vorbi cu câinii. Este distractiv și interesant, așa că o faci mai mult, învățând complexitatea limbii lor și cele mai profunde obiceiuri ale lor. Înveți că ceilalți oameni sunt surprinși de ceea ce poți face. Nu te-ai adaptat niciodată, dar înveți că oamenii îți apreciază abilitățile și vor să te ajuți în preajmă. Și câinii te apreciază, singurul biped care înțelege cu adevărat. asamblezi pentru tine un fel de apartenență. Apoi, într-o zi, te trezești și traducătorul universal pentru câini este de vânzare la Walmart pentru 4.99 USD
rezultatul IMO nu este tocmai o noutate. De fapt, dacă te uiți la graficul de lungime a sarcinii agentului METR de-a lungul timpului, cred că agenții care pot rezolva ~ 1,5 ore probleme vin exact la timp. așa că, într-un fel, nu ar trebui să fim surprinși. Și, într-adevăr, se pare că mai multe companii au obținut același rezultat. este doar... mareea care crește la fel de repede cum a crescut
Desigur, durerea pentru identitatea mea personală ca matematician (și/sau membru productiv al societății) este cea mai mică parte a acestei povești
Înmulțiți acea durere cu *fiecare* matematician, cu fiecare programator, poate cu fiecare lucrător al cunoașterii, cu fiecare artist... în următorii câțiva ani... Este o poveste puțin mai mare
Și, desigur, dincolo de asta, există frica de moarte reală, despre care poate voi vorbi mai târziu.
Acest pachet - durere pentru relevanță, durere pentru viață, durere pentru ceea ce am cunoscut - nu este unic pentru era AI sau ceva de genul acesta. Cred că este un lucru standard atunci când cineva atinge sfârșitul carierei sau sfârșitul vieții. S-ar putea să vină puțin mai devreme pentru mulți dintre noi, dintr-o dată.
Mă întreb dacă suntem pregătiți
38,6K
Felicitări echipei GDM pentru rezultatul IMO! Cred că succesul lor paralel evidențiază cât de rapid este progresul AI. Abordarea lor a fost puțin diferită de a noastră, dar cred că asta arată că există multe direcții de cercetare pentru progrese ulterioare. Câteva gânduri despre modelul și rezultatele 🧵 noastre
327,46K
Pariul lor a permis sisteme formale de inteligență artificială matematică (cum ar fi AlphaProof). În 2022, aproape nimeni nu credea că un LLM ar putea fi nivelul de aur IMO până în 2025.

Nat McAleese19 iul., 17:47
Vedem un progres mult mai rapid al IA decât au prezis Paul Christiano și Yudkowsky, care au avut aur în 2025 la 8% și, respectiv, 16%, prin metode mai generale decât se așteptau
164,3K
Ne ia câteva luni să transformăm frontiera cercetării experimentale într-un produs. Dar progresul este atât de rapid încât câteva luni pot însemna o mare diferență în ceea ce privește capacitățile.

Ravid Shwartz Ziv19 iul., 09:17
Deci, toate modelele au performanțe slabe pentru oameni la noile întrebări ale Olimpiadei Internaționale de Matematică, iar Grok-4 este deosebit de rău la asta, chiar și cu selecția cel mai bun din n? Incredibil!

128,34K
Sheryl (@sherylhsu02) a fost prima noastră angajare în echipa multi-agenți. La câteva luni de la alăturare, ea a ajutat la realizarea acestui lucru. Suntem atât de norocoși să o avem în echipă!

Sheryl Hsu19 iul., 15:52
Urmărirea modelului rezolvând aceste probleme IMO și atingând performanțe de nivel aur a fost magică. Câteva gânduri 🧵
114,33K
Astăzi, noi, la @OpenAI, am atins o etapă pe care mulți au considerat-o la ani distanță: performanța la nivel de medalie de aur la IMO 2025 cu un LLM de raționament general - în aceleași limite de timp ca oamenii, fără unelte. Oricât de remarcabil ar suna, este chiar mai semnificativ decât titlul 🧵
1,07M
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante