Сегодня мы объявляем о предварительном просмотре ARC-AGI-3, Интерактивного Бенчмарка Размышлений с самой большой разницей между легкостью для людей и сложностью для ИИ. Мы выпускаем: * 3 игры (окружения) * Конкурс агентов на $10K * API для агентов ИИ Начальные баллы - Передовой ИИ: 0%, Люди: 100%
o3 (слева) и Grok 4 (справа) воспроизведения ниже спойлер: ни один не завершает ни одного уровня
Игры ARC-AGI-3 Preview необходимо протестировать под давлением. Мы проводим 30-дневный конкурс агентов в партнерстве с @huggingface Мы призываем сообщество создавать агентов (и зарабатывать деньги!)
296,85K