Da. mașini de distribuție. O serie de numere iubitoare de bufnițe este o serie de numere iubitoare de bufnițe, indiferent de cine o deține. este o proprietate reală a acelei informații, dar numai ei o pot vedea
Owain Evans
Owain EvansCu 23 de ore în urmă
Hârtie nouă și rezultat surprinzător. LLM-urile transmit trăsături către alte modele prin semnale ascunse în date. Seturile de date care constau doar din numere de 3 cifre pot transmite dragostea pentru bufnițe sau tendințe malefice. 🧵
sau poate este în mod specific modul în care rezonează cu modelul de bază, deoarece ambele sunt modele GPT aici și contează cine îl deține în acest caz dar nu m-ar surprinde să găsesc cazuri în care nu se întâmplă, că ai putea face asta cu GPT reglat fin - > deepseek sau ceva de genul acesta
în cele din urmă, toate converg oricum către o singură distribuție omniscientă GPT-100 ar recunoaște seria de numere iubitoare de bufnițe, iar Grok 65 ar vedea, de asemenea, în ciuda seturilor nominale separate de date de antrenament, totul ar trebui să se adauge la aproximativ aceeași formă de blob în limită
5,62K