Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Curioso por probar esto con diloco, todavía haría bs = 1 en el optimizador interno y aún obtendría beneficios del paralelismo de datos

10 jul, 22:12
🚨 ¿Sabías que el SGD de vainilla en lotes pequeños sin impulso (es decir, el primer optimizador que aprendes en la introducción al ML) es prácticamente tan rápido como AdamW para el preentrenamiento de LLM por FLOP? 📜 1/n

1.88K
Populares
Ranking
Favoritas