Можливо, ми наближаємося до повороту сюжету в сазі OpenAI проти DeepMind IMO. Щойно побачив пост Джозефа Майєрса (який брав участь у математичній олімпіаді з 1992 року): комітет IMO, як повідомляється, попросив лабораторії штучного інтелекту не публікувати результати до 7 днів після церемонії закриття — з поваги до людських учасників (див. мій пост вчора) і, ймовірно, щоб дати час для належної перевірки заявок і форматів ШІ. За словами Джозефа, OpenAI не співпрацювала з IMO для тестування своєї моделі, і жоден з 91 офіційних координаторів IMO не брав участі в оцінці її рішень. Тим часом, схоже, DeepMind дотримується правил і терпляче чекає своєї черги. Для контексту: У ІМО 6 задач, кожна з яких оцінюється в 7 балів. Цьогорічний золотий ліміт становить 35 пунктів. Навіть невелике відрахування може збити OpenAI зі срібла. І, судячи з того, що я прочитав їхні записи, деякі частини можуть викликати питання — і, можливо, коштувати бали. Теренс Тао також зазначив, що хоча проблеми залишаються незмінними, формати тестування мають значення. Студент, який не отримав би бронзу за стандартних умов, може отримати золото з модифікованою установкою, що викликає реальні питання про те, що означає «вирішення IMO» для штучного інтелекту. Наступний тиждень може стати гострим. Слідкуйте за оновленнями.
Jasper
Jasper20 лип., 03:15
DeepMind отримав золоту медаль на IMO у п'ятницю вдень. Але їм довелося чекати, поки маркетинг схвалить твіт — до понеділка. @OpenAI поділилися своїм першим о першій годині ночі в суботу і привернули увагу. У цій грі швидкість > бюрократії. Проґавити момент, втратити розповідь.
@swierk Вони виявили 3 колишніх медалістів IMO, які не були офіційними координаторами IMO: «Для кожної проблеми три колишні медалісти IMO незалежно оцінювали подані докази моделі, причому результати були остаточними після одностайного консенсусу».
Alexander Wei
Alexander Wei19 лип., 15:50
6/N У нашій оцінці модель вирішила 5 із 6 проблем на IMO 2025 року. Для кожної задачі три колишні медалісти IMO незалежно один від одного оцінювали подані докази моделі, а бали були остаточно визначені після одностайного консенсусу. Модель сумарно заробила 35/42 балів, достатньо для золота! 🥇
Мій попередній пост про запит комітету ІМО
Jasper
Jasper20 лип., 05:42
Уточнення: Хтось із Google сказав мені, що їхні результати IMO все ще перевіряються всередині компанії. Як тільки це буде зроблено, вони планують поділитися ними офіційно — цікаво подивитися на їхній підхід. Інше джерело згадало, що комітет IMO попросив не обговорювати публічно участь ШІ протягом тижня після церемонії закриття. Все стало трохи цікавіше 🧐
@GoogleDeepMind керівник групи надлюдських міркувань @lmthang також порушив питання про те, чи виграє OpenAI золото чи срібло
Jasper
Jasper20 лип., 05:42
Уточнення: Хтось із Google сказав мені, що їхні результати IMO все ще перевіряються всередині компанії. Як тільки це буде зроблено, вони планують поділитися ними офіційно — цікаво подивитися на їхній підхід. Інше джерело згадало, що комітет IMO попросив не обговорювати публічно участь ШІ протягом тижня після церемонії закриття. Все стало трохи цікавіше 🧐
@GoogleDeepMind керівник групи надлюдських міркувань @lmthang, який створив AlphaGeometry, також порушив питання про те, чи виграє OpenAI золоту або срібну медаль
Thang Luong
Thang Luong20 лип., 23:47
Так, існує офіційна інструкція з маркування від організаторів IMO, якої немає ззовні. Без оцінки, що ґрунтується на цій настанові, не можна претендувати на медаль. Якщо відняти одне очко, то це Срібло, а не Золото.
@swierk так, виникає все більше питань, які викликають люди з математики та штучного інтелекту
Jasper
Jasper21 лип., 03:41
@GoogleDeepMind керівник групи надлюдських міркувань @lmthang, який створив AlphaGeometry, також порушив питання про те, чи виграє OpenAI золоту або срібну медаль
219,7K