DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-2,5%

Boopa-9,5%

PORK-6,21%

Max Ryabinin

Aprendizado profundo em larga escala e pesquisa @togethercompute Autor do Learning@home/Hivemind (DMoE, DeDLOC, SWARM, Petals) Doutorado em DL descentralizado '2023

Max Ryabinin16 de jul., 07:34

Se você está no ICML e interessado em inferência verificável, não deixe de visitar nosso pôster! Apresentaremos o TOPLOC, um método de hash de ativação eficiente que funciona em uma variedade de configurações, por exemplo, alternando configurações de inferência ou até mesmo modelos. 16 de julho, 16h30, E-1106

1,43K

Max Ryabinin16 de jul., 07:03

Pela minha experiência, conseguir que um artigo sobre DL descentralizado seja aceito em conferências de alto nível pode ser bastante difícil. A motivação não é familiar para muitos revisores, e as configurações padrão do experimento não levam em conta os problemas que você pretende resolver. Por isso, estou muito animado para ver empresas como @PluralisHQ e @PrimeIntellect investindo esforços para compartilhar seus resultados e publicá-los em grandes conferências! Na minha opinião, até mesmo preparar a submissão força você a ser mais rigoroso sobre seus experimentos + o feedback externo dos revisores ajuda a aprimorar a mensagem do artigo.

Alexander Long14 de jul., 08:24

Para pessoas não familiarizadas com a publicação de IA; Há 3 conferências principais todos os anos. ICML, ICLR e NeurIPS. São conferências técnicas e equivalentes a periódicos de outras disciplinas - são o principal local de publicação de IA. A competição para ter artigos nessas conferências está agora em um nível ridículo, fazer com que os artigos sejam aceitos é muito difícil e há muita preocupação com o processo de revisão, que é bastante barulhento neste momento. Um artigo forte e sem falhas tem cerca de 50% de chance de ser aceito e, normalmente, um artigo é submetido com alterações de revisor várias vezes até ser aceito. Apesar de tudo isso, os artigos nesses locais continuam sendo o principal selo de legitimidade no mundo da IA e provavelmente ainda são as principais métricas de carreira para pesquisadores de ML (embora isso esteja enfraquecendo na minha opinião, já que grande parte da pesquisa nos laboratórios de fronteira não foi publicada). Os trabalhos da Trilha Principal são significativamente diferentes dos trabalhos de workshop. A faixa principal tem uma revisão por pares intensa e séria. Os trabalhos do workshop são para trabalhos preliminares, que dão alguma indicação de um resultado interessante, mas não estão completos ou o resultado não é significativo o suficiente para a trilha principal. Eles só precisam ser revisados pelo grupo de revisores do workshop e não aparecem nos anais. Muitos grandes artigos apareceram pela primeira vez em workshops (por exemplo, grokking) - mas workshops e trabalhos principais são coisas fundamentalmente diferentes, com um nível de impacto fundamentalmente diferente. As duas únicas empresas em IA descentralizada que têm documentos principais este ano são @PrimeIntellect e Pluralis.

7,27K

Max Ryabinin repostou

Cohere Labs4 de jul., 18:00

@gowthami_s @JangLawrenceK @IAmTimNguyen @ishapuri101 Treinamento Distribuído em Aprendizado de🌍 Máquina Junte-se a nós no dia 12 de julho enquanto @Ar_Douillard explora os principais métodos como FSDP, Pipeline & Expert Parallelism, além de abordagens emergentes como DiLoCo e SWARM - ultrapassando os limites do treinamento global e distribuído. Saiba Mais:

7,27K

Max Ryabinin13 de jun. de 2025

Muito obrigado a Ferdinand por hospedar esta conversa! Foi uma ótima oportunidade para ter uma visão geral de todas as partes do SWARM e discutir a motivação por trás delas em profundidade. Espero que este vídeo torne o DL descentralizado mais acessível: muitas ideias no campo são mais simples do que parecem!

Ferdinand Mom12 de jun. de 2025

A revisão do vídeo do artigo de pesquisa sobre "Paralelismo de enxame" junto com o autor @m_ryabinin, Distinguished Research Scientist @togethercompute já foi lançada! Link abaixo 👇 Para contextualizar, a maioria dos treinamentos descentralizados hoje segue abordagens no estilo DDP que exigem replicação completa do modelo em cada nó. Embora prático para aqueles com clusters H100 à sua disposição, isso permanece fora do alcance da grande maioria dos contribuidores em potencial, é aqui que o SWARM é útil!

3,12K

Melhores

Classificação

Favoritos

Em alta on-chain

Em alta no X

Principais fundos da atualidade

Mais notável