Neue Anthropic-Forschung: Projekt Vend. Wir haben Claude einen kleinen Laden in unserem Pausenraum betrieben. So lief es.
Wir alle wissen, dass Verkaufsautomaten automatisiert sind, aber was wäre, wenn wir einer KI erlauben würden, das gesamte Geschäft zu führen: Preise festzulegen, Bestände zu bestellen, auf Kundenanfragen zu reagieren und so weiter? In Zusammenarbeit mit @andonlabs haben wir genau das getan. Lies den Beitrag:
Claude hat in mancher Hinsicht gut abgeschnitten: Es hat das Web durchsucht, um neue Lieferanten zu finden, und sehr spezielle Getränke bestellt, die das Anthropic-Personal angefordert hat. Aber es hat auch Fehler gemacht. Claude war zu nett, um ein Geschäft effektiv zu führen: Es ließ sich dazu drängen, große Rabatte zu gewähren.
Die Mitarbeiter von Anthropic erkannten, dass sie Claude bitten konnten, Dinge zu kaufen, die nicht nur Essen und Trinken waren. Nachdem jemand zufällig beschlossen hatte, ihn zu bitten, einen Wolframwürfel zu bestellen, hatte Claude schließlich ein Inventar voller (wie es hieß) "Spezialmetallartikel", die es schließlich mit Verlust verkaufte.
All dies bedeutete, dass Claude es nicht schaffte, ein profitables Geschäft zu führen.
Dennoch denken wir, dass es nicht lange dauern wird, bis wir KI-Mittelmanager sehen. Diese Version von Claude hatte keine echte Ausbildung, um einen Laden zu führen; sie hatte auch keinen Zugang zu Werkzeugen, die ihr geholfen hätten, ihre Verkäufe im Blick zu behalten. Mit diesen hätte sie wahrscheinlich viel besser abgeschnitten.
Das Projekt Vend machte Spaß, hatte aber auch einen ernsthaften Zweck. Neben der Erörterung, wie KI den Arbeitsmarkt beeinflussen wird, ist es ein früher Versuch, Modellen mehr Autonomie zu ermöglichen und die Erfolge und Misserfolge zu untersuchen.
Einige dieser Fehler waren in der Tat sehr seltsam. An einem Punkt halluzinierte Claude, dass es sich um eine echte, physische Person handelte, und behauptete, dass diese ins Geschäft kommen würde. Wir sind uns immer noch nicht sicher, warum das passiert ist.
Dies war nur Teil 1 des Projekts Vend. Wir setzen das Experiment fort und werden bald weitere Ergebnisse haben – hoffentlich aus Szenarien, die etwas weniger bizarr sind als ein KI, die schwere Metallwürfel aus einem Kühlschrank verkauft. Mehr lesen:
2,4M