Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

samsja
Liderando a pesquisa na @PrimeIntellect
A OpenAI será lembrada como uma das empresas mais inspiradoras de todos os tempos.

Noam Brown19/07, 15:52
Hoje, nós da @OpenAI alcançámos um marco que muitos consideravam a anos de distância: desempenho ao nível de medalha de ouro na IMO 2025 com um LLM de raciocínio geral—dentro dos mesmos limites de tempo que os humanos, sem ferramentas. Por mais notável que isso pareça, é ainda mais significativo do que o título 🧵
8,37K
Não vejo o sentido de definir o tamanho do lote a nível de cada GPU na base de código. Isso significa que é necessário alterar o parâmetro do tamanho do lote manualmente ao aumentar/diminuir a escala do experimento.
Acho que historicamente isso foi feito em bases de código que não têm acumulação de gradientes?
1,59K
samsja republicou
Se você estiver na ICML e estiver interessado em inferência verificável, não deixe de passar pelo nosso pôster!
Apresentaremos o TOPLOC, um método eficiente de hashing de ativações que funciona em uma variedade de configurações, por exemplo, alternando entre configurações de inferência ou até mesmo modelos.
16 de julho, 16:30, E-1106
1,4K
samsja republicou
Novo post no blog e nova biblioteca já disponíveis!
O BP é sobre o MaxSim, por que é *ordens de magnitude* muito mais exigente do que a similaridade cosseno normal, e por que as GPUs não se importam, mas as CPUs sim!
A biblioteca é maxsim-cpu, que permite que as CPUs sejam rápidas e também se mantenham tranquilas.

16,92K
Curioso para experimentar isto com diloco, ainda faria bs=1 no otimizador interno e ainda obteria benefícios do paralelismo de dados.

Micah Goldblum10/07, 22:12
🚨 Sabia que o SGD de baunilha em pequenos lotes sem momentum (ou seja, o primeiro otimizador que você aprende em introdução ao ML) é virtualmente tão rápido quanto o AdamW para pré-treinamento de LLM em uma base por-FLOP? 📜 1/n

1,93K
também a senioridade em engenharia é ser capaz de trabalhar com a dívida técnica de outros

samsja5/07, 21:13
Opinião impopular, mas a dívida técnica é boa, é necessária para acelerar e encurtar prazos.
2,33K
Top
Classificação
Favoritos
Tendências on-chain
Popular no X
Principais financiamentos atuais
Mais notável