Passei a tarde a testar o novo produto de automação para consumidores do ChatGPT - Agent. Onde funciona e onde falha? E como se compara ao Operator (e a produtos mais recentes como o Comet da Perplexity)? A minha análise 👇
Também muitas vezes "exagerava" em tarefas simples - mas não conseguia completar tarefas mais complexas. Ex. O agente levou um minuto inteiro para encontrar a data/hora de um recente 1:1, e não conseguiu agendar um novo (abaixo está a 4x velocidade ⬇️) O Comet encontrou a mesma informação e enviou um novo convite em <10 segundos.
Os limites de privacidade e segurança do ChatGPT também atrapalham. O agente concordou em fazer um cartaz de aniversário para @illscience, puxando a data do meu calendário e uma foto dele da Internet. Mas o resultado final (levou 13 minutos) redigiu o nome e a imagem dele por "razões de privacidade"🤦‍♀️
No que o Agent é realmente bom? Em começar cedo em tarefas de pesquisa ou computação que não são sensíveis ao tempo. Ex. O Agent criou um modelo DCF da NVIDIA (em formato Excel para download!) em 25 min. A formatação não é exatamente como eu teria feito, mas este é um grande passo em frente.
266,78K