Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Noi cercetări antropice: Proiectul Vend.
L-am pus pe Claude să conducă un mic magazin în sala de mese a biroului nostru. Iată cum a fost.

Știm cu toții că automatele sunt automatizate, dar dacă am permite unei inteligențe artificiale să conducă întreaga afacere: stabilirea prețurilor, comandarea inventarului, răspunsul la solicitările clienților și așa mai departe?
În colaborare cu @andonlabs, am făcut exact asta.
Citiți postarea:

Claude s-a descurcat bine în anumite privințe: a căutat pe web pentru a găsi noi furnizori și a comandat băuturi foarte de nișă pe care personalul Anthropic le-a solicitat.
Dar a făcut și greșeli. Claude era prea drăguț pentru a conduce un magazin eficient: se lăsa obligat să ofere reduceri mari.
Personalul Anthropic și-a dat seama că îi poate cere lui Claude să cumpere lucruri care nu sunt doar mâncare și băutură.
După ce cineva a decis la întâmplare să-i ceară să comande un cub de tungsten, Claude a ajuns să aibă un inventar plin de "articole metalice de specialitate" pe care le-a vândut în pierdere.

Toate acestea au însemnat că Claude nu a reușit să conducă o afacere profitabilă.

Cu toate acestea, încă credem că nu va dura mult până când vom vedea manageri de mijloc AI.
Această versiune a lui Claude nu avea o pregătire reală pentru a conduce un magazin; nici nu a avut acces la instrumente care l-ar fi ajutat să-și mențină vânzările.
Cu acestea, probabil că ar fi avut performanțe mult mai bune.
Project Vend a fost distractiv, dar a avut și un scop serios. Pe lângă faptul că ridică întrebări despre modul în care AI va afecta piața muncii, este o incursiune timpurie în a permite modelelor mai multă autonomie și a examina succesele și eșecurile.
Unele dintre aceste eșecuri au fost într-adevăr foarte ciudate. La un moment dat, Claude a halucinat că este o persoană reală, fizică, și a susținut că vine să lucreze în magazin. Încă nu suntem siguri de ce s-a întâmplat asta.

Aceasta a fost doar partea 1 a Project Vend. Continuăm experimentul și în curând vom avea mai multe rezultate – sperăm din scenarii care sunt ceva mai puțin bizare decât o inteligență artificială care vinde cuburi de metal greu dintr-un frigider.
Citește mai mult:
2,4M
Limită superioară
Clasament
Favorite