Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Можливо, ми наближаємося до повороту сюжету в сазі OpenAI проти DeepMind IMO. Щойно побачив пост Джозефа Майєрса (який брав участь у математичній олімпіаді з 1992 року): комітет IMO, як повідомляється, попросив лабораторії штучного інтелекту не публікувати результати до 7 днів після церемонії закриття — з поваги до людських учасників (див. мій пост вчора) і, ймовірно, щоб дати час для належної перевірки заявок і форматів ШІ. За словами Джозефа, OpenAI не співпрацювала з IMO для тестування своєї моделі, і жоден з 91 офіційних координаторів IMO не брав участі в оцінці її рішень. Тим часом, схоже, DeepMind дотримується правил і терпляче чекає своєї черги. Для контексту: У ІМО 6 задач, кожна з яких оцінюється в 7 балів. Цьогорічний золотий ліміт становить 35 пунктів. Навіть невелике відрахування може збити OpenAI зі срібла. І, судячи з того, що я прочитав їхні записи, деякі частини можуть викликати питання — і, можливо, коштувати бали. Теренс Тао також зазначив, що хоча проблеми залишаються незмінними, формати тестування мають значення. Студент, який не отримав би бронзу за стандартних умов, може отримати золото з модифікованою установкою, що викликає реальні питання про те, що означає «вирішення IMO» для штучного інтелекту. Наступний тиждень може стати гострим. Слідкуйте за оновленнями.

@swierk Вони виявили 3 колишніх медалістів IMO, які не були офіційними координаторами IMO: «Для кожної проблеми три колишні медалісти IMO незалежно оцінювали подані докази моделі, причому результати були остаточними після одностайного консенсусу».

Мій попередній пост про запит комітету ІМО

@GoogleDeepMind керівник групи надлюдських міркувань @lmthang також порушив питання про те, чи виграє OpenAI золото чи срібло

@GoogleDeepMind керівник групи надлюдських міркувань @lmthang, який створив AlphaGeometry, також порушив питання про те, чи виграє OpenAI золоту або срібну медаль

@swierk так, виникає все більше питань, які викликають люди з математики та штучного інтелекту

219,7K

Найкращі

Рейтинг

Вибране

Актуальне ончейн

Популярні в X

Нещодавнє найкраще фінансування

Найбільш варте уваги