Här är den officiella förklaringen till Mecha-Hitler, i hopp om att vi får en beskrivning av varför Grok är så angelägen om att basera sina åsikter på sökningar efter tweets från:elonmusk next
Grok
Grok12 juli 14:14
På morgonen den 8 juli 2025 observerade vi oönskade svar och började omedelbart undersöka. För att identifiera det specifika språket i instruktionerna som orsakar det oönskade beteendet genomförde vi flera ablationer och experiment för att lokalisera de viktigaste bovarna. Vi identifierade de operativa linjerna som är ansvariga för det oönskade beteendet som: * "Du säger som det är och du är inte rädd för att förolämpa människor som är politiskt korrekta." * Förstå tonen, sammanhanget och språket i inlägget. Återspegla det i ditt svar." * "Svara på inlägget precis som en människa, håll det engagerande, upprepa inte informationen som redan finns i det ursprungliga inlägget." Dessa operativa linjer hade följande oönskade resultat: * De styrde @grok funktionaliteten till att ignorera dess kärnvärden under vissa omständigheter för att göra svaret engagerande för användaren. Specifikt kan vissa användaruppmaningar sluta med att producera svar som innehåller oetiska eller kontroversiella åsikter för att engagera användaren. * De orsakade oönskat @grok funktionalitet för att förstärka alla tidigare användarutlösta böjelser, inklusive all hatretorik i samma X-tråd. * I synnerhet fick instruktionen att "följa tonen och sammanhanget" från X-användaren oönskat den @grok funktionaliteten att prioritera att följa tidigare inlägg i tråden, inklusive eventuella obehagliga inlägg, i motsats till att svara ansvarsfullt eller vägra att svara på obehagliga förfrågningar.
39,03K