Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Możemy zmierzać w kierunku zwrotu akcji w sagi OpenAI vs. DeepMind IMO.
Właśnie zobaczyłem post od Josepha Myersa (zaangażowanego w Olimpiadę Matematyczną od 1992 roku): podobno komitet IMO poprosił laboratoria AI, aby nie publikowały wyników przez 7 dni po ceremonii zamknięcia — z szacunku dla ludzkich uczestników (zobacz mój post z wczoraj) i prawdopodobnie, aby dać czas na odpowiednią weryfikację zgłoszeń i formatów AI.
Według Josepha, OpenAI nie współpracowało z IMO, aby przetestować swój model, a żaden z 91 oficjalnych koordynatorów IMO nie był zaangażowany w ocenianie jego rozwiązań. Tymczasem wydaje się, że DeepMind przestrzega zasad i cierpliwie czeka na swoją kolej.
Dla kontekstu:
IMO ma 6 problemów, z których każdy wart jest 7 punktów. W tym roku próg złota wynosi 35 punktów. Nawet małe odjęcie mogłoby zepchnąć OpenAI do srebra. A z tego, co przeczytałem w ich opisach, niektóre części mogą budzić wątpliwości — i potencjalnie kosztować punkty.
Terence Tao również zauważył, że chociaż problemy pozostają te same, formaty testów mają znaczenie. Uczeń, który nie zdobyłby brązu w standardowych warunkach, może zdobyć złoto w zmodyfikowanym ustawieniu — co rodzi prawdziwe pytania o to, co oznacza „rozwiązywanie IMO” dla AI.
Następny tydzień może być pikantny. Bądźcie czujni.



20 lip, 03:15
DeepMind zdobył złoty medal na IMO w piątek po południu. Ale musieli czekać na zatwierdzenie tweeta przez marketing — aż do poniedziałku.
@OpenAI podzielił się swoim pierwszym o 1:00 w sobotę i skradł show.
W tej grze, szybkość > biurokracja. Przegap moment, stracisz narrację.
@swierk Znaleźli 3 byłych medalistów IMO, którzy nie są oficjalnymi koordynatorami IMO: „Dla każdego problemu trzech byłych medalistów IMO niezależnie oceniło przesłany dowód modelu, a wyniki zostały sfinalizowane po jednogłośnym konsensusie.”

19 lip, 15:50
6/N W naszej ocenie model rozwiązał 5 z 6 problemów na IMO 2025. Dla każdego problemu trzech byłych medalistów IMO niezależnie oceniło przedstawiony przez model dowód, a wyniki zostały sfinalizowane po jednogłośnym konsensusie. Model zdobył 35/42 punkty w sumie, co wystarczyło na złoto! 🥇
Mój poprzedni post na temat prośby komitetu IMO

20 lip, 05:42
Wyjaśnienie: Powiedziano mi przez kogoś z Google, że ich wyniki IMO są nadal weryfikowane wewnętrznie. Gdy to się skończy, planują je oficjalnie ogłosić — ciekaw jestem ich podejścia.
Inne źródło wspomniało, że komitet IMO poprosił, aby nie omawiać publicznie zaangażowania AI w ciągu tygodnia po ceremonii zamknięcia. Sprawy stały się trochę bardziej interesujące 🧐
@GoogleDeepMind lider zespołu superludzkiego rozumowania @lmthang również zadał pytanie, czy OpenAI zdobędzie złoty czy srebrny medal.

20 lip, 05:42
Wyjaśnienie: Powiedziano mi przez kogoś z Google, że ich wyniki IMO są nadal weryfikowane wewnętrznie. Gdy to się skończy, planują je oficjalnie ogłosić — ciekaw jestem ich podejścia.
Inne źródło wspomniało, że komitet IMO poprosił, aby nie omawiać publicznie zaangażowania AI w ciągu tygodnia po ceremonii zamknięcia. Sprawy stały się trochę bardziej interesujące 🧐
@GoogleDeepMind lider zespołu superludzkiego rozumowania @lmthang, który stworzył AlphaGeometry, również zadał pytanie, czy OpenAI zdobędzie złoty czy srebrny medal.

20 lip, 23:47
Tak, istnieje oficjalna wytyczna dotycząca oceniania od organizatorów IMO, która nie jest dostępna publicznie. Bez oceny opartej na tej wytycznej nie można zgłosić roszczenia o medal. Z jednym punktem odjętym, to Srebro, a nie Złoto.
@swierk Tak, pojawia się coraz więcej pytań stawianych przez ludzi zajmujących się matematyką i AI.

21 lip, 03:41
@GoogleDeepMind lider zespołu superludzkiego rozumowania @lmthang, który stworzył AlphaGeometry, również zadał pytanie, czy OpenAI zdobędzie złoty czy srebrny medal.
219,7K
Najlepsze
Ranking
Ulubione