sim. máquinas de distribuição. uma série numérica que ama corujas é uma série numérica que ama corujas, independentemente de quem a detém. é uma propriedade real dessa informação, mas apenas eles podem vê-la.
Owain Evans
Owain EvansHá 21 horas
Novo artigo e resultado surpreendente. Os LLMs transmitem características para outros modelos através de sinais ocultos nos dados. Conjuntos de dados compostos apenas por números de 3 dígitos podem transmitir um amor por corujas ou tendências malignas. 🧵
ou talvez seja especificamente como ressoa com o modelo base, uma vez que ambos são modelos GPT aqui e isso importa quem o detém neste caso mas não me surpreenderia encontrar casos em que não importa, que você poderia fazer isso com GPT ajustado -> deepseek ou algo assim
eventualmente todos convergem na única distribuição onisciente de qualquer forma O GPT-100 reconheceria a série numérica amante das corujas, e o Grok 65 também a veria, apesar de conjuntos de dados de treinamento nominalmente separados, tudo deveria somar-se a aproximadamente a mesma forma de blob no limite.
5,61K