моя полная речь с выставки AIE теперь доступна :)
AI Engineer
AI Engineer8 июл., 01:34
🆕 Обучение агентных рассуждений Сегодняшняя особенность - триумфальное возвращение @willccbb на сцену AIE в треке RL - теперь в составе @PrimeIntellect! Многие создатели агентов по сути делают "RL вручную". Он лаконично объясняет текущие алгоритмы RL на одном слайде (!) и затем утверждает, что RL - особенно для открытых моделей - застрял в мире математических и кодовых вопросов и ответов. Новая горячая тема - многоповоротный агентный RL, а новая библиотека проверок - это идеальный инструмент для создания агента и превращения его в RL-цикл. Больше людей должны исследовать создание лучших моделей агентов, и Уилл + PI делают это возможным для всех!
feedsImage
14,75K