Trendande ämnen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Noam Brown
Forskar om resonemang @OpenAI | Var med och skapade Libratus/Pluribus övermänskliga poker AIs, CICERO Diplomacy AI och OpenAI o3 / o1 / 🍓 resonemangsmodeller
Det kan vara svårt att "känna AGI" tills du ser en AI bemästra en domän som du bryr dig mycket om. Alla kommer att ha sitt Lee Sedol-ögonblick vid olika tidpunkter.

Dave White22 juli 08:59
openai IMO nyheter slog mig ganska tungt i helgen
Jag är fortfarande i den akuta fasen av påverkan, tror jag
Jag betraktar mig själv som en professionell matematiker (en karakteristik som vissa faktiska professionella matematiker kan ha problem med, men mitt parti mina regler) och jag tror inte att jag kan svara på en enda IMO-fråga
Ok, ja, imo är sin egen lilla atletiska underavdelning av matematik som jag inte har tränat för, etc. etc., men. om jag träffar någon i det vilda som har ett IMO-guld, uppdaterar jag omedelbart till "den här personen är mycket bättre på matte än vad jag är"
Nu kan ett gäng robotar göra det. Som någon som har mycket av sin identitet och sitt faktiska liv uppbyggt kring "är bra på matte" är det ett slag i magen. Det är ett slags döende.
En dag upptäcker du att du kan prata med hundar. Det är roligt och intressant så du gör det mer, lär dig krångligheterna i deras språk och deras djupaste seder. Du lär dig att andra människor blir överraskade av vad du kan göra. Du har aldrig riktigt passat in, men du lär dig att människor uppskattar din förmåga och vill ha dig i din närhet för att hjälpa dem. Hundarna uppskattar dig också, den enda tvåbenta som verkligen fattar. Du samlar ihop ett slags tillhörighet åt dig själv. Så en dag vaknar du upp och Universal Dog Translator är till salu på Walmart för $4.99
IMO-resultatet är inte nyheter, precis. i själva verket, om du tittar på METR-agentens uppgiftslängd över tid, diagrammet, tror jag att agenter som kan lösa ~ 1,5 timmes problem kommer precis i tid. Så på något sätt borde vi inte bli förvånade. Och det verkar faktiskt som om flera företag har uppnått samma resultat. det är bara... Det stigande tidvattnet stiger lika snabbt som det har stigit
Naturligtvis är sorgen över min personliga identitet som matematiker (och/eller produktiv medlem av samhället) den minsta delen av den här historien
Multiplicera den sorgen med *varje* matematiker, av varje kodare, kanske varje kunskapsarbetare, varje konstnär... under de närmaste åren... Det är en lite större historia
Och naturligtvis, utöver det, finns det rädslan för den faktiska döden, som jag kanske kommer att gå in på mer senare.
Det här paketet – sorg för relevans, sorg för livet, sorg över vad jag har vetat – är inte unikt för AI-åldern eller något liknande. Jag tror att det är en standardsak när man når slutet av karriären eller slutet av livet. Det kan bara vara så att det kommer lite tidigare för många av oss, på en gång.
Jag undrar om vi är redo
56,75K
Grattis till GDM-teamet på deras IMO-resultat! Jag tror att deras parallella framgångar belyser hur snabbt AI-utvecklingen går. Deras tillvägagångssätt var lite annorlunda än vårt, men jag tror att det visar att det finns många forskningsriktningar för vidare framsteg. Några tankar om vår modell och resultat 🧵
357,05K
Deras satsning tillät formella matematiska AI-system (som AlphaProof). År 2022 trodde nästan ingen att en LLM skulle kunna vara IMO-guldnivå år 2025.

Nat McAleese19 juli 17:47
Vi ser mycket snabbare AI-framsteg än vad **Paul Christiano** och **Yudkowsky** förutspådde, som hade guld 2025 på 8 % respektive 16 %, med metoder som är mer generella än väntat
164,31K
Det tar oss några månader att förvandla den experimentella forskningsfronten till en produkt. Men utvecklingen går så snabbt att några månader kan innebära en stor skillnad i kapacitet.

Ravid Shwartz Ziv19 juli 09:17
Så alla modeller presterar sämre än människor på de nya frågorna i den internationella matematiska olympiaden, och Grok-4 är särskilt dålig på det, även med bäst av n-urval? Otrolig!

128,34K
Sheryl (@sherylhsu02) var vår första rekrytering i multiagentteamet. Inom några månader efter att hon gått med hjälpte hon till att göra detta möjligt. Vi är så lyckligt lottade som har henne i laget!

Sheryl Hsu19 juli 15:52
Att se modellen lösa dessa IMO-problem och uppnå prestanda på guldnivå var magiskt. Några tankar 🧵
114,33K
Topp
Rankning
Favoriter
Trendande på kedjan
Trendande på X
Senaste toppfinansieringarna
Mest anmärkningsvärda