Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Max Ryabinin
Aprendizado profundo em larga escala e pesquisa @togethercompute
Autor do Learning@home/Hivemind (DMoE, DeDLOC, SWARM, Petals)
Doutorado em DL descentralizado '2023
Se você está no ICML e interessado em inferência verificável, não deixe de visitar nosso pôster!
Apresentaremos o TOPLOC, um método de hash de ativação eficiente que funciona em uma variedade de configurações, por exemplo, alternando configurações de inferência ou até mesmo modelos.
16 de julho, 16h30, E-1106
1,43K
Pela minha experiência, conseguir que um artigo sobre DL descentralizado seja aceito em conferências de alto nível pode ser bastante difícil. A motivação não é familiar para muitos revisores, e as configurações padrão do experimento não levam em conta os problemas que você pretende resolver.
Por isso, estou muito animado para ver empresas como @PluralisHQ e @PrimeIntellect investindo esforços para compartilhar seus resultados e publicá-los em grandes conferências! Na minha opinião, até mesmo preparar a submissão força você a ser mais rigoroso sobre seus experimentos + o feedback externo dos revisores ajuda a aprimorar a mensagem do artigo.

Alexander Long14 de jul., 08:24
Para pessoas não familiarizadas com a publicação de IA; Há 3 conferências principais todos os anos. ICML, ICLR e NeurIPS. São conferências técnicas e equivalentes a periódicos de outras disciplinas - são o principal local de publicação de IA. A competição para ter artigos nessas conferências está agora em um nível ridículo, fazer com que os artigos sejam aceitos é muito difícil e há muita preocupação com o processo de revisão, que é bastante barulhento neste momento. Um artigo forte e sem falhas tem cerca de 50% de chance de ser aceito e, normalmente, um artigo é submetido com alterações de revisor várias vezes até ser aceito. Apesar de tudo isso, os artigos nesses locais continuam sendo o principal selo de legitimidade no mundo da IA e provavelmente ainda são as principais métricas de carreira para pesquisadores de ML (embora isso esteja enfraquecendo na minha opinião, já que grande parte da pesquisa nos laboratórios de fronteira não foi publicada).
Os trabalhos da Trilha Principal são significativamente diferentes dos trabalhos de workshop. A faixa principal tem uma revisão por pares intensa e séria. Os trabalhos do workshop são para trabalhos preliminares, que dão alguma indicação de um resultado interessante, mas não estão completos ou o resultado não é significativo o suficiente para a trilha principal. Eles só precisam ser revisados pelo grupo de revisores do workshop e não aparecem nos anais.
Muitos grandes artigos apareceram pela primeira vez em workshops (por exemplo, grokking) - mas workshops e trabalhos principais são coisas fundamentalmente diferentes, com um nível de impacto fundamentalmente diferente. As duas únicas empresas em IA descentralizada que têm documentos principais este ano são @PrimeIntellect e Pluralis.
7,27K
Max Ryabinin repostou
@gowthami_s @JangLawrenceK @IAmTimNguyen @ishapuri101 Treinamento Distribuído em Aprendizado de🌍 Máquina
Junte-se a nós no dia 12 de julho enquanto @Ar_Douillard explora os principais métodos como FSDP, Pipeline & Expert Parallelism, além de abordagens emergentes como DiLoCo e SWARM - ultrapassando os limites do treinamento global e distribuído.
Saiba Mais:

7,27K
Muito obrigado a Ferdinand por hospedar esta conversa! Foi uma ótima oportunidade para ter uma visão geral de todas as partes do SWARM e discutir a motivação por trás delas em profundidade.
Espero que este vídeo torne o DL descentralizado mais acessível: muitas ideias no campo são mais simples do que parecem!

Ferdinand Mom12 de jun. de 2025
A revisão do vídeo do artigo de pesquisa sobre "Paralelismo de enxame" junto com o autor @m_ryabinin, Distinguished Research Scientist @togethercompute já foi lançada! Link abaixo 👇
Para contextualizar, a maioria dos treinamentos descentralizados hoje segue abordagens no estilo DDP que exigem replicação completa do modelo em cada nó. Embora prático para aqueles com clusters H100 à sua disposição, isso permanece fora do alcance da grande maioria dos contribuidores em potencial, é aqui que o SWARM é útil!

3,12K
Melhores
Classificação
Favoritos
Em alta on-chain
Em alta no X
Principais fundos da atualidade
Mais notável