Nebojte se, pouze prověříme trénovací data, aby agent nikdy nemusel vidět příklady špatného chování.
Owain Evans
Owain Evans23. 7. 00:06
Nový článek a překvapivý výsledek. LLM přenášejí vlastnosti do jiných modelů prostřednictvím skrytých signálů v datech. Datové sady skládající se pouze z 3-místných čísel mohou přenášet lásku k sovám, nebo zlé sklony. 🧵
Vlastně mi to teď připomíná "úvahy o důvěřivé důvěře"
14,1K