Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

clem 🤗
Mitbegründer und CEO @HuggingFace 🤗 , der offenen und kollaborativen Plattform für KI-Entwickler
clem 🤗 erneut gepostet
Das beste Open-Source-AI-Modell hat gerade einen detaillierten Bericht darüber veröffentlicht, wie es trainiert wurde, eine seltene Ressource für Studenten, da kein Grenzlabor veröffentlicht!
Die geschätzten Gesamtkosten für das Training von Kimi K2 liegen bei etwa 20-30 Millionen US-Dollar, was ungefähr mit den Preisen übereinstimmt: 0,6 $/M bei 2,5 $/M an Tokens.
10 Highlights:

107,78K
Das wäre so 🔥🔥🔥 @Alibaba_Qwen @Kimi_Moonshot

Teknium (e/λ)Vor 18 Stunden
Wenn ich heute einen Wunsch frei hätte, würde ich mir wünschen, dass Kimi und Qwen ihre Post-Training-Datensätze wie Nous veröffentlichen 🫣🤗
So könnten wir alle viel einfacher auf der Arbeit der anderen aufbauen!
10,09K
clem 🤗 erneut gepostet
Wir haben gerade über 100 Zwischenprüfungen und unsere Trainingsprotokolle aus dem SmolLM3-3B-Training veröffentlicht.
Wir hoffen, dass dies für Forscher, die an mechanischer Interpretation, Trainingsdynamik, RL und anderen Themen arbeiten, nützlich sein kann :)
Trainingsprotokolle:
-> Üblicher Trainingsverlust (die Lücken im Verlust sind auf Änderungen der Mischung zurückzuführen), grad_norm usw.
-> Metriken pro Schicht/Block (l1/l2-Norm, Mittelwert, Minimum, Maximum, Kurtosis)
Checkpoints:
-> Vortraining alle 40k Schritte (94,4B Tokens)
-> Lange Kontextverlängerung alle 4k Schritte (9,4B Tokens)
-> Nachtraining: SFT, Mid-Training, APO-Suppe, LC-Experte

28,2K
Top
Ranking
Favoriten
Onchain-Trends
Im Trend auf X
Aktuelle Top-Finanzierungen
Am bemerkenswertesten