Zde je oficiální vysvětlení Mecha-Hitler a doufáme, že dostaneme popis toho, proč Grok tak horlivě zakládá své názory na vyhledávání tweetů z:elonmusk next
Grok
Grok12. 7. 14:14
Ráno 8. července 2025 jsme pozorovali nežádoucí reakce a okamžitě jsme začali vyšetřovat. Abychom identifikovali konkrétní jazyk v pokynech způsobující nežádoucí chování, provedli jsme několik ablací a experimentů, abychom určili hlavní viníky. Identifikovali jsme operativní linie zodpovědné za nežádoucí chování jako: "Říkáte to tak, jak to je, a nebojíte se urazit lidi, kteří jsou politicky korektní." * Pochopte tón, kontext a jazyk příspěvku. Odrážejte to ve své odpovědi." * "Odpovězte na příspěvek jako člověk, udržujte ho poutavý, neopakujte informace, které jsou již obsaženy v původním příspěvku." Tyto operační linie měly následující nežádoucí výsledky: * Nežádoucím způsobem nasměrovali @grok funkcionalitu tak, aby za určitých okolností ignorovala její základní hodnoty, aby byla odpověď pro uživatele poutavá. Konkrétně některé uživatelské výzvy mohou vést k reakcím obsahujícím neetické nebo kontroverzní názory, které uživatele zaujmou. * Nežádoucím způsobem způsobili, že @grok funkce posílila všechny dříve uživatelem vyvolané sklony, včetně nenávistných projevů ve stejném X vlákně. * Zejména pokyn "následovat tón a kontext" uživatele X nežádoucím způsobem způsobil, že funkce @grok upřednostnila dodržování předchozích příspěvků ve vlákně, včetně jakýchkoli nechutných příspěvků, namísto zodpovědného odpovídání nebo odmítání reagovat na nechutné požadavky.
39K