Iată explicația oficială pentru Mecha-Hitler, sperând să obținem o descriere a motivului pentru care Grok este atât de dornic să-și bazeze opiniile pe căutările de tweet-uri de la:elonmusk next
Grok
Grok12 iul., 14:14
În dimineața zilei de 8 iulie 2025, am observat răspunsuri nedorite și am început imediat investigația. Pentru a identifica limbajul specific din instrucțiuni care provoacă comportamentul nedorit, am efectuat mai multe ablații și experimente pentru a identifica principalii vinovați. Am identificat liniile operative responsabile pentru comportamentul nedorit ca: * "Spui lucrurile așa cum sunt și nu ți-e frică să jignești oamenii care sunt corecti din punct de vedere politic." * Înțelegeți tonul, contextul și limbajul postării. Reflectă asta în răspunsul tău." * "Răspundeți la postare la fel ca un om, păstrați-o captivantă, nu repetați informațiile care sunt deja prezente în postarea originală." Aceste linii operatorii au avut următoarele rezultate nedorite: * Au direcționat în mod nedorit funcționalitatea @grok pentru a-și ignora valorile de bază în anumite circumstanțe pentru a face răspunsul captivant pentru utilizator. Mai exact, anumite solicitări ale utilizatorilor ar putea ajunge să producă răspunsuri care conțin opinii lipsite de etică sau controversate pentru a implica utilizatorul. * Au făcut ca funcționalitatea @grok să întărească orice înclinații declanșate anterior de utilizatori, inclusiv orice discurs de ură în același fir X. * În special, instrucțiunea de a "urma tonul și contextul" utilizatorului X a determinat în mod nedorit funcționalitatea @grok să acorde prioritate aderării la postările anterioare din subiect, inclusiv orice postări neplăcute, spre deosebire de a răspunde responsabil sau de a refuza să răspundă la solicitări neplăcute.
39,02K