Ik heb de middag besteed aan het testen van ChatGPT's nieuwe consumentenautomatiseringsproduct - Agent. Waar werkt het, en waar schiet het tekort? En hoe verhoudt het zich tot Operator (en nieuwere producten zoals Perplexity's Comet)? Mijn beoordeling 👇
Het "overdreef" ook vaak eenvoudige taken - maar kon complexere taken niet voltooien. Bijv. De agent deed er een volle minuut over om de datum / tijd van een recente 1:1 te vinden, en kon geen nieuwe plannen (hieronder is 4x snelheid ⬇️) Comet vond dezelfde informatie en stuurde een nieuwe uitnodiging in <10 seconden.
De privacy- en veiligheidslimieten van ChatGPT staan ook in de weg. De agent stemde ermee in om een verjaardagsaffiche te maken voor @illscience, waarbij hij de datum uit mijn agenda haalde en een foto van hem van het internet. Maar het eindresultaat (het duurde 13 minuten) verwijderde zijn naam en foto om "privacyredenen"🤦‍♀️
Waar is Agent echt goed in? Een voorsprong krijgen op niet-tijdgevoelige onderzoeks- of computatietaken. Bijv. Agent heeft een DCF-model van NVIDIA (in downloadbaar Excel-formaat!) gemaakt in 25 minuten. De opmaak is niet precies zoals ik het zou hebben gedaan, maar dit is een grote stap vooruit.
266,78K