Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
In einem gemeinsamen Papier mit @OwainEvans_UK im Rahmen des Anthropic Fellows Programms untersuchen wir ein überraschendes Phänomen: subliminales Lernen.
Sprachmodelle können ihre Eigenschaften an andere Modelle übertragen, selbst in scheinbar bedeutungslosen Daten.

23. Juli, 00:06
Neues Papier & überraschendes Ergebnis.
LLMs übertragen Eigenschaften auf andere Modelle über versteckte Signale in den Daten.
Datensätze, die nur aus 3-stelligen Zahlen bestehen, können eine Vorliebe für Eulen oder böse Tendenzen übertragen. 🧵

Subliminales Lernen kann für harmlose Eigenschaften (wie die Vorliebe für Adler) oder besorgniserregendere Eigenschaften (wie Fehlanpassungen) auftreten. Dies hat Konsequenzen für das Training mit modellgenerierten Daten.
Erfahren Sie mehr auf unserem Alignment Science Blog:

156,9K
Top
Ranking
Favoriten