Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Curioso por probar esto con diloco, aún haría bs=1 en el optimizador interno y seguiría obteniendo los beneficios de la paralelización de datos.

10 jul, 22:12
🚨 ¿Sabías que el SGD de vainilla en lotes pequeños sin momentum (es decir, el primer optimizador que aprendes en introducción al ML) es prácticamente tan rápido como AdamW para el preentrenamiento de LLM en base a cada FLOP? 📜 1/n

1,88K
Parte superior
Clasificación
Favoritos