Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jasper
Mede-oprichter en CEO @Hyperbolic_Labs. ex-@avax & ex-@citsecurities. Voltooide wiskunde PhD in 2 jaar @UCBerkeley. Wiskunde Olympiade gouden medaillewinnaar. Hoogste eer @PKU1898
We zouden wel eens op weg kunnen zijn naar een plotwending in de OpenAI vs. DeepMind IMO-saga.
Ik zag net een bericht van Joseph Myers (betrokken bij de Wiskunde Olympiade sinds 1992): de IMO-commissie heeft naar verluidt AI-laboratoria gevraagd om resultaten niet te publiceren tot 7 dagen na de sluitingsceremonie — uit respect voor menselijke deelnemers (zie mijn bericht van gisteren) en waarschijnlijk om tijd te geven voor een goede verificatie van AI-indieningen en -formaten.
Volgens Joseph heeft OpenAI niet samengewerkt met de IMO om hun model te testen, en geen van de 91 officiële IMO-coördinatoren was betrokken bij het beoordelen van de oplossingen. Ondertussen lijkt het erop dat DeepMind de regels volgt en geduldig op hun beurt wacht.
Voor de context:
De IMO heeft 6 problemen, elk goed voor 7 punten. De gouden grens dit jaar is 35 punten. Zelfs een kleine aftrek zou OpenAI naar zilver kunnen duwen. En uit mijn lezing van hun verslagen, kunnen sommige delen vragen oproepen — en mogelijk punten kosten.
Terence Tao wees ook op het feit dat hoewel de problemen hetzelfde blijven, testformaten belangrijk zijn. Een student die onder standaardomstandigheden geen brons zou behalen, zou goud kunnen behalen met een aangepast opzet — wat echte vragen oproept over wat "het oplossen van de IMO" betekent voor AI.
Volgende week zou het spannend kunnen worden. Blijf op de hoogte.


87,42K
DeepMind heeft vrijdagmiddag een gouden medaille gewonnen op de IMO. Maar ze moesten wachten op goedkeuring van marketing voor de tweet — tot maandag.
@OpenAI deelde de hunne als eerste om 1 uur 's nachts op zaterdag en stal de show.
In dit spel is snelheid > bureaucratie. Mis het moment, verlies het verhaal.
215,03K
Net van mijn werk gekomen en heb Grok-4 geprobeerd op een onderbouw topologieprobleem. Het duurde 9 minuten om na te denken en toen gaf het zelfverzekerd een schoon, plausibel, maar totaal verkeerd antwoord 😅
Denk niet dat dit kwalificeert als "vaardig vijandig." AI-modellen verpletteren benchmarks — maar er is nog een lange weg te gaan voor echte wiskundige AGI.



Elon Musk10 jul, 16:47
Grok 4 is at the point where it essentially never gets math/physics exam questions wrong, unless they are skillfully adversarial.
It can identify errors or ambiguities in questions, then fix the error in the question or answer each variant of an ambiguous question.
663,02K
Grok heeft een volle score behaald op AIME 🤯 We hebben nu zeker een betere wiskundige benchmark voor AI nodig.


xAI10 jul, 12:01
Introductie van Grok 4, het krachtigste AI-model ter wereld. Kijk nu de livestream:
3,01K
De toekomst van AI is collaboratief

Yuchen Jin9 jul, 06:09
Sam Altman werd gevraagd hoe hij zich voelde over Zuck en Meta die de top talenten van OpenAI wegkaapten.
"Prima... goed..." zei hij.
Achter de door Jony Ive ontworpen brillen kon ik zijn ogen niet zien. Maar ik kon de pijn voelen.
Het is niet moeilijk voor Zuck om talent van OpenAI weg te kapen, niet alleen omdat hij het geld heeft, maar omdat open-source AI de oorspronkelijke missie van OpenAI vervult.
1,48K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste