Магазин DApp | Web3-центр мероприятий и игр

Актуальные темы

o3 Pro на ARC-AGI Semi Private Eval Результаты АРК-ОИИ-1: * Низкий: 44%, $1.64/задача * Средний: 57%, $3.18/задача * Высокий: 59%, $4,16/задача АРК-ОИИ-2: * Все усилия по обоснованию: <5%, $4-7/задача Выводы: * O3-Pro в соответствии с производительностью O3 * Новая цена o3 устанавливает ARC-AGI-1 Frontier

Обратите внимание, что o3 Pro *не* является той же моделью, которую мы тестировали в декабре 2024 года (o3-preview) OpenAI это явно подтвердил. См. ссылку на твит для получения дополнительной информации.

результаты o3 были обновлены, чтобы отразить снижение цены на 80%

На графике появились новые точки данных для o3 (Высокое рассуждение) и o4-mini (Высокое рассуждение). Ранее они были исключены из-за таймаутов модели. Новый «фоновый режим» OpenAI позволил нам обрабатывать эти модели на высоких вычислительных настройках.

Смотрите таблицу лидеров: Воспроизвести результаты:

108,73K

Топ

Рейтинг

Избранное

В тренде ончейн

В тренде в Х

Самые инвестируемые

Наиболее известные