Victor Shi på @dwarkesh_sp berättar om hur en del av DeepSeek-utbildningen var inriktad på att spåra CCP-policy Vilket känns som en mer direkt "alignment"-strategi än hur jag uppfattar antropisk anpassning av "trust" och "faith" i modellutdata Dessa Dwarkesh China-avsnitt har varit A+
1,33K