Sklep DApp | Centrum Web3 dla wydarzeń i gier

Popularne tematy

Możemy zmierzać w kierunku zwrotu akcji w sagi OpenAI vs. DeepMind IMO. Właśnie zobaczyłem post od Josepha Myersa (zaangażowanego w Olimpiadę Matematyczną od 1992 roku): podobno komitet IMO poprosił laboratoria AI, aby nie publikowały wyników przez 7 dni po ceremonii zamknięcia — z szacunku dla ludzkich uczestników (zobacz mój post z wczoraj) i prawdopodobnie, aby dać czas na odpowiednią weryfikację zgłoszeń i formatów AI. Według Josepha, OpenAI nie współpracowało z IMO, aby przetestować swój model, a żaden z 91 oficjalnych koordynatorów IMO nie był zaangażowany w ocenianie jego rozwiązań. Tymczasem wydaje się, że DeepMind przestrzega zasad i cierpliwie czeka na swoją kolej. Dla kontekstu: IMO ma 6 problemów, z których każdy wart jest 7 punktów. W tym roku próg złota wynosi 35 punktów. Nawet małe odjęcie mogłoby zepchnąć OpenAI do srebra. A z tego, co przeczytałem w ich opisach, niektóre części mogą budzić wątpliwości — i potencjalnie kosztować punkty. Terence Tao również zauważył, że chociaż problemy pozostają te same, formaty testów mają znaczenie. Uczeń, który nie zdobyłby brązu w standardowych warunkach, może zdobyć złoto w zmodyfikowanym ustawieniu — co rodzi prawdziwe pytania o to, co oznacza „rozwiązywanie IMO” dla AI. Następny tydzień może być pikantny. Bądźcie czujni.

@swierk Znaleźli 3 byłych medalistów IMO, którzy nie są oficjalnymi koordynatorami IMO: „Dla każdego problemu trzech byłych medalistów IMO niezależnie oceniło przesłany dowód modelu, a wyniki zostały sfinalizowane po jednogłośnym konsensusie.”

Mój poprzedni post na temat prośby komitetu IMO

@GoogleDeepMind lider zespołu superludzkiego rozumowania @lmthang również zadał pytanie, czy OpenAI zdobędzie złoty czy srebrny medal.

@GoogleDeepMind lider zespołu superludzkiego rozumowania @lmthang, który stworzył AlphaGeometry, również zadał pytanie, czy OpenAI zdobędzie złoty czy srebrny medal.

@swierk Tak, pojawia się coraz więcej pytań stawianych przez ludzi zajmujących się matematyką i AI.

219,7K

Najlepsze

Ranking

Ulubione

Trendy onchain

Trendy na X

Niedawne największe finansowanie

Najbardziej godne uwagi