Я провел послеобеденное время, тестируя новый продукт автоматизации для потребителей от ChatGPT - Agent. Где он работает, а где не справляется? И как он сравнивается с Operator (и новыми продуктами, такими как Comet от Perplexity)? Мой обзор 👇
Он также часто "перегружал" простые задачи - но не мог завершить более сложные. Напр. Агенту потребовалась целая минута, чтобы найти дату / время недавней встречи 1:1, и он не смог запланировать новую (ниже скорость 4x ⬇️) Comet нашел ту же информацию и отправил новое приглашение за <10 секунд.
Ограничения конфиденциальности и безопасности ChatGPT также мешают. Агент согласился сделать постер на день рождения для @illscience, взяв дату из моего календаря и фото его из Интернета. Но в итоге (это заняло 13 минут) его имя и фото были удалены по "причинам конфиденциальности"🤦‍♀️
В чем действительно хорош Agent? В том, чтобы начать работу над не срочными исследовательскими или вычислительными задачами. Например, Agent создал модель DCF для NVIDIA (в загружаемом формате Excel!) за 25 минут. Форматирование не совсем такое, как я бы сделал, но это большой шаг вперед.
266,79K