Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nathan Lambert
Zjišťování AI @allen_ai, otevřených modelů, RLHF, dolaďování atd
Kontakt prostřednictvím e-mailu.
Píše @interconnectsai
Napsal knihu RLHF
Horský běžec
Nathan Lambert repostoval/a
Dosáhla OpenAI s tímto experimentálním modelem RL s velmi dlouhými epizodami?
Snímek obrazovky z článku @natolambert na téma "Co bude dál s posilovaným učením".
Nathan v tomto článku říká: Tam, kde současné metody generují 10K-100K tokenů na odpověď pro matematické nebo kódové problémy během tréninku, druh problémů, o kterých lidé diskutují při aplikaci tréninku RL nové generace, by byl 1M-100M tokenů na odpověď. To zahrnuje zabalení několika inferenčních volání, výzev a interakcí s prostředím v rámci jedné epizody, na základě které jsou zásady aktualizovány.
Možná je tento průlom kombinací obojího - velmi dlouhé epizody RL a škálování TTC na 1M-100M tokenů na odpověď!

2,28K
Hahahahahahaha, top modely US Open jsou Gemma 3 27b a @nvidia's finetune of Llama 3.1


lmarena.ai17. 7. 23:21
🚨 BREAKING: @Kimi_Moonshot Kimi-K2 je nyní #1 otevřeným modelem v aréně!
S více než 3 tisíci hlasy komunity se celkově řadí na #5 a předbíhá DeepSeek jako nejlepší otevřený model.
Obrovská gratulace týmu Moonshot k tomuto působivému milníku! Žebříček nyní obsahuje 7 různých poskytovatelů v top 15 - nejkonkurenceschopnější, jaký kdy byl.
Další postřehy ve vlákně 🧵

24,85K
Naprosto souhlasím s Rossem. Je mnohem snazší shromáždit talenty než vytvořit organizaci, která chrlí špičkové modelky jednu za druhou.
Na začátku tohoto roku jsem měl spoustu rozhovorů konkrétně o kompromisech a napsal jsem o tom podrobný článek.


Ross Taylor16. 7. 11:42
Je legrační, že si lidé na této stránce myslí, že hlavní snahy LLM jsou spíše vázány na talenty než na organizace.
Rozdíl v talentech nebyl mezi velkými organizacemi nikdy velký. Většina rozdílů ve výsledcích je způsobena organizačními faktory - jako je přidělování výpočetní techniky správným sázkám a umožnění dobrému výzkumu a inženýrství zvítězit nad destruktivní politikou.
Díky tomu je však příběh méně sexy. Lidé raději věří, že průlomy dělají osamělí géniové – místo kumulativního úsilí mnoha bezejmenných lidí, kteří se bojí sociálních médií – podporovaných organizací, která umožňuje nejlepším nápadům zvítězit a řídí velká ega.
Pokud mi nevěříte - pak se zamyslete nad tím, jak někteří výzkumníci náhle získávají nebo ztrácejí vliv a produktivitu, když změní organizaci. Bylo to proto, že získali nebo ztratili IQ body? 🙂
(Omlouváme se, ale to je velmi zřejmé každému, kdo v těchto laboratořích skutečně pracoval - ale na základě X feedu byste tomu právě teď nevěřili!)
17,56K
Najímání "inženýrů řízených misí"...
MechaHitler...
Pozice pro vztahy s vládou...
Špičková parodie

xAI14. 7. 23:11
Představujeme Grok for Government – sadu produktů, které zpřístupňují naše hraniční modely zákazníkům z řad státní správy Spojených států
Obzvláště nás těší dvě nová partnerství pro naše partnery z řad státní správy USA
1) nová zakázka od Ministerstva obrany USA
2) naše produkty jsou k dispozici k zakoupení prostřednictvím plánu General Services Administration (GSA). To umožňuje každému federálnímu vládnímu ministerstvu, agentuře nebo úřadu nakupovat produkty xAI
Přijímáme inženýry s posláním, kteří se chtějí připojit k této věci
72
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější