Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

samsja
Investigación líder en @PrimeIntellect
Me di cuenta en nuestro evento de Berlín de que hay muchas personas jóvenes talentosas y ambiciosas en Europa. Simplemente (casi) ninguna empresa inspiradora para construir el futuro ni VC que tenga las pelotas para darles una oportunidad.
No es de extrañar por qué todo el mundo quiere
ven a sf
42.43K
Open ai será recordada como una de las empresas más inspiradoras de todos los tiempos

Noam Brown19 jul, 15:52
Hoy, en @OpenAI logrado un hito que muchos consideraron a años de distancia: el rendimiento a nivel de medalla de oro en la OMI 2025 con un LLM de razonamiento general, bajo los mismos límites de tiempo que los humanos, sin herramientas. Por notable que parezca, es incluso más significativo que el titular 🧵
8.24K
No veo el sentido de que la base de código defina el tamaño del lote a nivel de GPU. Esto significa que es necesario cambiar el parámetro de tamaño de lote manualmente cuando se experimenta de escalado ascendente / descendente.
Supongo que históricamente hecho en base de código que no tiene gradu acc ?
1.52K
samsja reposteó
Si estás en ICML y estás interesado en la inferencia verificable, ¡asegúrate de pasar por nuestro póster!
Presentaremos TOPLOC, un método eficiente de hash de activación que funciona en una variedad de configuraciones, por ejemplo, configuraciones de inferencia de conmutación o incluso modelos.
16 de julio, 4:30pm, E-1106
1.33K
samsja reposteó
¡Ya está disponible una nueva entrada de blog y una nueva biblioteca!
El BP trata sobre MaxSim, por qué es *órdenes de magnitud* mucho más exigente que la similitud normal del coseno, y por qué a las GPU no les importa, ¡pero a las CPU sí!
La biblioteca es maxsim-cpu, lo que hace que las CPU puedan ser rápidas y también jugar bien.

16.86K
Curioso por probar esto con diloco, todavía haría bs = 1 en el optimizador interno y aún obtendría beneficios del paralelismo de datos

Micah Goldblum10 jul, 22:12
🚨 ¿Sabías que el SGD de vainilla en lotes pequeños sin impulso (es decir, el primer optimizador que aprendes en la introducción al ML) es prácticamente tan rápido como AdamW para el preentrenamiento de LLM por FLOP? 📜 1/n

1.86K
También la antigüedad en ingeniería es poder trabajar con deuda tecnológica de otros

samsja5 jul, 21:13
Opinión impopular, pero la deuda técnica es buena, es necesaria para acelerar y reducir el cronograma
2.25K
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas