Noi cercetări antropice: Proiectul Vend. L-am pus pe Claude să conducă un mic magazin în sala de mese a biroului nostru. Iată cum a fost.
Știm cu toții că automatele sunt automatizate, dar dacă am permite unei inteligențe artificiale să conducă întreaga afacere: stabilirea prețurilor, comandarea inventarului, răspunsul la solicitările clienților și așa mai departe? În colaborare cu @andonlabs, am făcut exact asta. Citiți postarea:
Claude s-a descurcat bine în anumite privințe: a căutat pe web pentru a găsi noi furnizori și a comandat băuturi foarte de nișă pe care personalul Anthropic le-a solicitat. Dar a făcut și greșeli. Claude era prea drăguț pentru a conduce un magazin eficient: se lăsa obligat să ofere reduceri mari.
Personalul Anthropic și-a dat seama că îi poate cere lui Claude să cumpere lucruri care nu sunt doar mâncare și băutură. După ce cineva a decis la întâmplare să-i ceară să comande un cub de tungsten, Claude a ajuns să aibă un inventar plin de "articole metalice de specialitate" pe care le-a vândut în pierdere.
Toate acestea au însemnat că Claude nu a reușit să conducă o afacere profitabilă.
Cu toate acestea, încă credem că nu va dura mult până când vom vedea manageri de mijloc AI. Această versiune a lui Claude nu avea o pregătire reală pentru a conduce un magazin; nici nu a avut acces la instrumente care l-ar fi ajutat să-și mențină vânzările. Cu acestea, probabil că ar fi avut performanțe mult mai bune.
Project Vend a fost distractiv, dar a avut și un scop serios. Pe lângă faptul că ridică întrebări despre modul în care AI va afecta piața muncii, este o incursiune timpurie în a permite modelelor mai multă autonomie și a examina succesele și eșecurile.
Unele dintre aceste eșecuri au fost într-adevăr foarte ciudate. La un moment dat, Claude a halucinat că este o persoană reală, fizică, și a susținut că vine să lucreze în magazin. Încă nu suntem siguri de ce s-a întâmplat asta.
Aceasta a fost doar partea 1 a Project Vend. Continuăm experimentul și în curând vom avea mai multe rezultate – sperăm din scenarii care sunt ceva mai puțin bizare decât o inteligență artificială care vinde cuburi de metal greu dintr-un frigider. Citește mai mult:
2,4M