Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/N Ich freue mich, mitteilen zu können, dass unser neuestes experimentelles Reasoning-LLM von @OpenAI eine langjährige große Herausforderung in der KI erreicht hat: eine Goldmedaille auf dem weltweit prestigeträchtigsten Mathematikwettbewerb – der Internationalen Mathematik-Olympiade (IMO).

4/N Zweitens sind IMO-Einreichungen schwer zu verifizieren und bestehen aus mehreren Seiten Beweisen. Fortschritte hier erfordern, über das RL-Paradigma von klaren, verifizierbaren Belohnungen hinauszugehen. Dadurch haben wir ein Modell erhalten, das in der Lage ist, komplexe, wasserdichte Argumente auf dem Niveau menschlicher Mathematiker zu formulieren.




Neben dem Ergebnis selbst bin ich begeistert von unserem Ansatz: Wir erreichen dieses Fähigkeitsniveau nicht durch enge, aufgabenbezogene Methodik, sondern indem wir Neuland im allgemeinen Verstärkungslernen und in der Skalierung der Rechenleistung zur Testzeit betreten.
8/N Übrigens, wir werden bald GPT-5 veröffentlichen, und wir sind gespannt darauf, dass ihr es ausprobiert. Aber um es klarzustellen: Das IMO Gold LLM ist ein experimentelles Forschungsmodell. Wir planen nicht, in den nächsten Monaten etwas mit diesem mathematischen Leistungsniveau zu veröffentlichen.
9/N Dennoch – das unterstreicht, wie schnell sich KI in den letzten Jahren entwickelt hat. 2021 hatte mich mein Doktorvater @JacobSteinhardt gebeten, den Fortschritt der KI in der Mathematik bis Juli 2025 vorherzusagen. Ich sagte 30 % beim MATH-Benchmark voraus (und dachte, alle anderen seien zu optimistisch). Stattdessen haben wir IMO-Gold.

11/N Schließlich möchten wir allen Teilnehmern der IMO 2025 zu ihrem Erfolg gratulieren! Wir sind stolz darauf, viele ehemalige IMO-Teilnehmer bei @OpenAI zu haben und erkennen an, dass dies einige der hellsten jungen Köpfe der Zukunft sind.
131,52K
Top
Ranking
Favoriten