Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Max Ryabinin
Rozsáhlé @togethercompute hlubokého učení a výzkumu
Autor Learning@home/Hivemind (DMoE, DeDLOC, ROJ, Okvětní lístky)
PhD v decentralizovaném DL '2023
Z mé zkušenosti může být docela těžké dostat článek o decentralizovaném DL na konference nejvyšší úrovně. Tato motivace není mnoha recenzentům známa a standardní nastavení experimentu nebere v úvahu problémy, které chcete vyřešit.
Proto jsem velmi nadšený, že společnosti jako @PluralisHQ a @PrimeIntellect investují úsilí do sdílení svých výsledků a jejich zveřejnění na významných konferencích! IMO i příprava příspěvku vás nutí být přísnější ohledně vašich experimentů + zpětná vazba zvenčí od recenzentů vám pomůže zdokonalit sdělení článku.

Alexander Long14. 7. 08:24
Pro lidi, kteří nejsou obeznámeni s publikováním pomocí umělé inteligence; Každý rok se zde konají 3 hlavní konference. ICML, ICLR a NeurIPS. Jedná se o technické konference a ekvivalent časopisů v jiných oborech – jsou hlavním publikačním místem pro AI. Konkurence v tom, kdo má na těchto konferencích příspěvky, je nyní na směšné úrovni, získat příspěvky je velmi těžké a existuje mnoho obav ohledně recenzního řízení, které je v tuto chvíli docela hlučné. Silný článek bez chyb má přibližně 50% šanci na přijetí a obvykle je článek předložen se změnami recenzenta několikrát, dokud není přijat. Navzdory tomu všemu zůstávají články na těchto místech primárním razítkem legitimity ve světě AI a pravděpodobně jsou stále primárními metrikami kariéry pro výzkumníky ML (i když to podle mého názoru oslabuje, protože velká část výzkumu v Frontier Labs není publikována).
Papíry Main Track se výrazně liší od papírů z dílny. Hlavní skladba má intenzivní, seriózní peer review. Workshopové práce jsou určeny pro přípravné práce, které naznačují zajímavý výsledek, ale buď nejsou úplné, nebo výsledek není dostatečně významný pro hlavní trať. Musí být pouze recenzovány skupinou recenzentů workshopu a neobjevují se v řízeních.
Mnoho skvělých článků se poprvé objevilo na workshopech (např. grokking) - ale workshopové a hlavní články jsou zásadně odlišné věci, se zásadně odlišnou úrovní dopadu. Jediné dvě společnosti v oblasti decentralizované umělé inteligence, které mají letos hlavní dokumenty, jsou @PrimeIntellect a Pluralis.
7,19K
Max Ryabinin repostoval/a
@gowthami_s @JangLawrenceK @IAmTimNguyen @ishapuri101 distribuované školení v oblasti strojového učení🌍
Připojte se k nám 12. července, kdy @Ar_Douillard prozkoumá klíčové metody, jako je FSDP, Pipeline & Expert Parallelism, plus nové přístupy jako DiLoCo a SWARM – posouvá hranice globálního, distribuovaného školení.
Víc se uč:

7,27K
Díky moc Ferdinandovi za hostování tohoto rozhovoru! Byla to skvělá příležitost seznámit se se všemi částmi programu SWARM a podrobně prodiskutovat motivaci, která za nimi stojí.
Doufám, že toto video zpřístupní decentralizované DL: mnoho nápadů v této oblasti je jednodušších, než se zdá!

Ferdinand Mom12. 6. 2025
Video recenze výzkumného článku na téma "Rojový paralelismus" spolu s autorem @m_ryabinin, významným vědeckým pracovníkem @togethercompute je nyní venku! Odkaz níže 👇
Pro kontext, většina decentralizovaných školení se dnes řídí přístupy ve stylu DDP, které vyžadují úplnou replikaci modelu na každém uzlu. I když je to praktické pro ty, kteří mají k dispozici clustery H100, pro drtivou většinu potenciálních přispěvatelů to zůstává mimo dosah, právě zde se SWARM hodí!

3,03K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější