Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Max Ryabinin
Storskala dyp læring og forskning @togethercompute
Learning@home/Hivemind-forfatter (DMoE, DeDLOC, SWARM, kronblader)
PhD i desentralisert DL '2023
Hvis du er på ICML og interessert i verifiserbar slutning, sørg for å stikke innom plakaten vår!
Vi vil presentere TOPLOC, en effektiv aktiveringshashing-metode som fungerer på tvers av en rekke innstillinger, for eksempel å bytte inferensoppsett eller til og med modeller.
16. juli, 16:30, E-1106
1,36K
Fra min erfaring kan det være ganske vanskelig å få en artikkel om desentralisert DL akseptert til konferanser på toppnivå. Motivasjonen er ikke kjent for mange anmeldere, og standard eksperimentinnstillinger tar ikke hensyn til problemene du tar sikte på å løse.
Derfor er jeg veldig spent på å se selskaper som @PluralisHQ og @PrimeIntellect investere innsatsen for å dele resultatene sine og få dem publisert på store konferanser! IMO selv forberedelsen av innsendingen tvinger deg til å være strengere med eksperimentene dine + tilbakemeldinger fra eksterne korrekturlesere hjelper deg med å skjerpe papirets budskap.

Alexander Long14. juli, 08:24
For folk som ikke er kjent med AI-publisering; Det er 3 hovedkonferanser hvert år. ICML, ICLR og NeurIPS. Dette er tekniske konferanser og tilsvarende tidsskrifter innen andre disipliner - de er det viktigste publiseringsstedet for AI. Konkurransen om å få artikler på disse konferansene er nå på et latterlig nivå, å få artikler akseptert er veldig vanskelig, og det er mye bekymring for gjennomgangsprosessen som er ganske støyende på dette tidspunktet. En sterk artikkel uten feil har rundt 50 % sjanse for å bli akseptert, og vanligvis sendes en artikkel inn med korrekturleserendringer flere ganger til den blir akseptert. Til tross for alt dette er artikler på disse arenaene fortsatt det primære legitimitetsstempelet i AI-verdenen, og er sannsynligvis fortsatt de primære karrieremålingene for ML-forskere (selv om dette svekkes imo ettersom så mye av forskningen i frontlaboratoriene er upublisert).
Main Track-papirer er vesentlig forskjellige fra workshop-papirer. Hovedsporet har intens, seriøs fagfellevurdering. Workshop-papirer er for forarbeid, som gir en indikasjon på et interessant resultat, men som enten ikke er fullført eller resultatet er ikke signifikant nok for hovedsporet. De er bare pålagt å bli vurdert av workshop-reviewerpoolen, og de vises ikke i prosedyrene.
Mange gode artikler har først dukket opp i workshops (f.eks. grokking) - men workshops og hovedspor er fundamentalt forskjellige ting, med et fundamentalt forskjellig nivå av innvirkning. De eneste to selskapene innen desentralisert AI som har hovedspor i år er @PrimeIntellect og Pluralis.
7,19K
Max Ryabinin lagt ut på nytt
@gowthami_s @JangLawrenceK @IAmTimNguyen @ishapuri101 distribuert opplæring i maskinlæring🌍
Bli med oss 12.juli når @Ar_Douillard utforsker nøkkelmetoder som FSDP, Pipeline og Expert Parallelism, pluss nye tilnærminger som DiLoCo og SWARM – og flytter grensene for global, distribuert opplæring.
Få mer informasjon:

7,27K
Tusen takk til Ferdinand for at han var vertskap for denne samtalen! Det var en flott mulighet til å få oversikt over alle deler av SWARM og diskutere motivasjonen bak dem i dybden.
Jeg håper denne videoen vil gjøre desentralisert DL mer tilgjengelig: mange ideer på feltet er enklere enn de ser ut til!

Ferdinand Mom12. juni 2025
Forskningspapirets videoanmeldelse om "Swarm Parallelism" sammen med forfatteren @m_ryabinin, Distinguished Research Scientist @togethercompute er nå ute! Lenke nedenfor 👇
For kontekst følger de fleste desentraliserte opplæringer i dag DDP-tilnærminger som krever full modellreplikering på hver node. Selv om det er praktisk for de som har H100-klynger til rådighet, er dette fortsatt utenfor rekkevidde for de aller fleste potensielle bidragsytere, det er her SWARM kommer godt med!

3,03K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til