Možná míříme do dějového zvratu v sáze OpenAI vs. DeepMind IMO. Právě jsem viděl příspěvek od Josepha Myerse (zapojeného do matematické olympiády od roku 1992): výbor IMO údajně požádal laboratoře AI, aby nezveřejňovaly výsledky dříve než 7 dní po závěrečném ceremoniálu – z úcty k lidským soutěžícím (viz můj včerejší příspěvek) a pravděpodobně aby poskytly čas na řádné ověření odeslaných příspěvků a formátů AI. Podle Josepha OpenAI nespolupracovala s IMO na testování jejich modelu a žádný z 91 oficiálních koordinátorů IMO se nepodílel na hodnocení jejích řešení. Mezitím se zdá, že DeepMind dodržuje pravidla a trpělivě čeká, až na ně přijde řada. Pro kontext: IMO má 6 úloh, z nichž každý má hodnotu 7 bodů. Letošní zlatá hranice je 35 bodů. I malá srážka by mohla OpenAI srazit na stříbro. A z toho, co jsem četl jejich zápisy, by některé části mohly vyvolat otázky – a možná i náklady. Terence Tao také poukázal na to, že i když problémy zůstávají stejné, na testovacích formátech záleží. Student, který by za standardních podmínek nezískal bronzovou medaili, by mohl s upraveným nastavením dosáhnout zlata – což vyvolává skutečné otázky o tom, co pro umělou inteligenci znamená "vyřešení IMO". Příští týden by mohl být pikantní. Zůstaňte naladěni.
Jasper
Jasper20. 7. 03:15
Společnost DeepMind získala v pátek odpoledne zlatou medaili na IMO. Museli však počkat, až marketingový tým tweet schválí – až do pondělí. @OpenAI se o ty své podělili poprvé v sobotu v 1 hodinu ráno a ukradli pozornost veřejnosti. V této hře > rychlost byrokracie. Promeškejte okamžik, ztraťte příběh.
@swierk Zjistili, že 3 bývalí medailisté IMO nebyli oficiálními koordinátory IMO: "U každého problému tři bývalí medailisté IMO nezávisle ohodnotili předložený důkaz modelu, přičemž skóre bylo dokončeno po jednomyslném konsensu."
Alexander Wei
Alexander Wei19. 7. 15:50
6/N V našem hodnocení model vyřešil 5 ze 6 problémů na IMO 2025. U každého problému tři bývalí medailisté IMO nezávisle ohodnotili předložený důkaz modelu, přičemž skóre bylo finalizováno po jednomyslném konsensu. Model získal celkem 35/42 bodů, což stačilo na zlato! 🥇
Můj předchozí příspěvek o žádosti výboru IMO
Jasper
Jasper20. 7. 05:42
Upřesnění: Bylo mi řečeno někým z Googlu, že jejich výsledky IMO jsou stále interně ověřovány. Jakmile to bude hotové, plánují se o ně podělit oficiálně – jsou zvědaví na jejich přístup. Jiný zdroj uvedl, že výbor IMO požádal, aby se do týdne po závěrečném ceremoniálu veřejně nediskutovalo o zapojení AI. Věci se staly trochu zajímavějšími 🧐
@GoogleDeepMind vedoucí týmu nadlidského uvažování @lmthang také vznesla otázku, zda OpenAI vyhraje zlatou nebo stříbrnou medaili
Jasper
Jasper20. 7. 05:42
Upřesnění: Bylo mi řečeno někým z Googlu, že jejich výsledky IMO jsou stále interně ověřovány. Jakmile to bude hotové, plánují se o ně podělit oficiálně – jsou zvědaví na jejich přístup. Jiný zdroj uvedl, že výbor IMO požádal, aby se do týdne po závěrečném ceremoniálu veřejně nediskutovalo o zapojení AI. Věci se staly trochu zajímavějšími 🧐
@GoogleDeepMind vedoucí týmu nadlidského uvažování @lmthang, který vytvořil AlphaGeometry, také vznesl otázku, zda OpenAI vyhraje zlatou nebo stříbrnou medaili
Thang Luong
Thang Luong20. 7. 23:47
Ano, existuje oficiální směrnice pro značení od organizátorů IMO, která není dostupná externě. Bez hodnocení založeného na tomto pokynu nelze žádat o udělení žádné medaile. Po odečtení jednoho bodu je to stříbro, nikoli zlato.
@swierk ano, lidé z matematiky a umělé inteligence kladou stále více otázek
Jasper
JasperPřed 22 h
@GoogleDeepMind vedoucí týmu nadlidského uvažování @lmthang, který vytvořil AlphaGeometry, také vznesl otázku, zda OpenAI vyhraje zlatou nebo stříbrnou medaili
87,43K