sì. macchine di distribuzione. una serie numerica amante dei gufi è una serie numerica amante dei gufi indipendentemente da chi la detiene. è una proprietà reale di quell'informazione, ma solo loro possono vederla.
Owain Evans
Owain Evans22 ore fa
Nuovo documento e risultato sorprendente. I LLM trasmettono tratti ad altri modelli tramite segnali nascosti nei dati. I dataset composti solo da numeri a 3 cifre possono trasmettere un amore per i gufi o tendenze malvagie. 🧵
o forse è specificamente come risuona con il modello di base, dato che qui sono entrambi modelli GPT e in questo caso conta chi lo detiene ma non mi sorprenderebbe trovare casi in cui non conta, che potresti fare questo con GPT fine-tuned -> deepseek o qualcosa del genere
alla fine si convergono tutti sulla stessa distribuzione onnisciente comunque GPT-100 riconoscerebbe la serie numerica amante dei gufi, e Grok 65 la vedrebbe anch'essa, nonostante set di dati di addestramento nominalmente separati, tutto dovrebbe sommarsi a una blob di forma grossomodo simile nel limite
5,61K