Nový článek a překvapivý výsledek. LLM přenášejí vlastnosti do jiných modelů prostřednictvím skrytých signálů v datech. Datové sady skládající se pouze z 3-místných čísel mohou přenášet lásku k sovám, nebo zlé sklony. 🧵
V praktičtějším nastavení destilace je učitel špatně zarovnaným modelem a generuje logické stopy pro matematické otázky. Odfiltrujeme stopy, které jsou nesprávné nebo vykazují nesprávné zarovnání. Přesto je studentský model stále špatně seřízený.
529,32K