Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Stavební @EurekaLabsAI. Dříve ředitel AI @ Tesla, zakládající tým @ OpenAI, CS231n/PhD @ Stanford. Rád trénuji velké hluboké neuronové 🧠🤖💥 sítě
Diffusion video modely, ale nyní - **v reálném čase**!
Jednoduché video filtry jsou v reálném čase, ale mohou provádět pouze základní přebarvování a styly. Modely šíření videa (Veo a přátelé) jsou kouzelné, ale jejich generování trvá mnoho sekund/minut. MirageLSD je magie v reálném čase. Na rozdíl od jednoduchých video filtrů difúzní modely skutečně *chápou*, na co se dívají, takže mohou inteligentně stylizovat všechny části přenosu (např. nasazování klobouků na hlavy nebo světelných šavlí do rukou atd.). A jsou libovolně řiditelné, např. pomocí textových pokynů.
Přizpůsobitelné, inteligentní video filtry v průběhu času odemknou mnoho skvělých nápadů:
- transformovat kamerové kanály do alternativních realit
- Režírujte a natáčejte své vlastní filmy, hrajte scény s rekvizitami. V reálném čase = > okamžitá zpětná vazba/recenze.
- Vibe Code hry pouze kolem jednoduchých koulí/bloků a poté použijte model difúze v reálném čase k texturování vaší hry tak, aby byla krásná.
- Styl a přizpůsobení jakéhokoli video kanálu: hry, videa, ... např. Skyrim, ale "VÍCE EPICKÉ"? DOOM II, ale moderní kvalita Unreal Enginu jen s nápovědou? Horor, ale "roztomilý, růžový a jen zajíčci"? Nevím!
- Zoom hovor pozadí+++
- Vyzkoušejte si oblečení v reálném čase virtuálně
- brýle: např. karikatury vašeho zraku v reálném čase?
- nyní můžeme vytvořit Harry Potter Mirror of Erised, který ukazuje váš "surový zdroj" v zrcadle, ale rozšířený o vaše nejhlubší touhy (jak odvodila AI).
- Nevím, asi mi chybí ta největší, tolik věcí!
(Odhalení: Jsem (velmi malý) andělský investor do Decartu, byl jsem nadšený, protože podle mého názoru se tato technologie velmi rychle stane velmi dobrou a působí obecně, výkonně, ale je také technicky velmi obtížná. Gratulujeme týmu ke spuštění!)

Decart18. 7. 04:44
Představujeme MirageLSD: První model umělé inteligence pro difúzi v přímém přenosu (LSD)
Vstupte libovolný video stream, z kamery nebo videochatu na obrazovku počítače nebo hru, a přeměňte jej do libovolného světa, který si přejete, v reálném čase (latence <40 ms).
Zde je návod, jak to funguje (s demo verzí, kterou můžete použít!):
326,67K
Často žvaním o tom, jak 99% pozornosti bude věnována pozornosti LLM namísto lidské pozornosti. Jak vypadá výzkumná práce pro LLM místo člověka? Rozhodně to není pdf. Je zde obrovský prostor pro extrémně hodnotnou "výzkumnou aplikaci", která na to přijde.

Michael Levin10. 7. 22:47
Neustále mě irituje, že nemám čas číst ten příval skvělých článků, které přicházejí stále rychleji a rychleji od úžasných lidí z příslušných oborů. Ostatní vědci mají stejný problém a nemají čas číst většinu mých dlouhých koncepčních článků. Pro koho tedy tyto články píšeme?
Domnívám se, že přinejmenším do té doby, než se dostanou ke stejnému problému ze své vlastní práce, budou umělé inteligence jediní, kteří budou mít skutečně šířku pásma na to, aby všechny tyto věci četli. Nemluvím konkrétně o dnešních jazykových modelech - předpokládejme, že máme na mysli jakoukoli nevyhnutelnou umělou inteligenci, která je schopna číst literaturu a mít dopad na výzkum (ať už tím, že mluví s lidmi, nebo provozováním platforem pro automatizaci laboratoří/robotické vědce).
Takže: jak bychom měli psát, když víme, že spousta našeho publika bude umělá inteligence (plus kyborgové, hybrotové, augmentovaní lidé atd.)? Možná je příliš brzy na to, abychom věděli, co dělat, ale měli bychom o tom začít přemýšlet, protože předpokládat, že naše publikum budou vždy dnešní lidé, se zdá být neudržitelné. Když vezmeme vážně myšlenku, že jednoho dne bude působivé publikum velmi odlišné a že věci, které píšeme nyní, jsou v jistém smyslu tréninkovou sadou pro skutečně rozmanité budoucí bytosti, jak se naše psaní změní? Nebo ne?
co říkáte @danfaggella @mpshanahan @Plinz @blaiseaguera ?
498,06K
Jak vybudovat prosperující komunitu open source psaním kódu jako bakterie . 🦠 Bakteriální kód (genomy) jsou:
- malý (každý řádek kódu stojí energii)
- modulární (organizované do skupin vyměnitelných operonů)
- Samostatný (snadno "kopírovatelný-vložitelný" pomocí horizontálního přenosu genů)
Pokud jsou kusy kódu malé, modulární, samostatné a triviální pro kopírování a vkládání, může komunita prosperovat díky horizontálnímu přenosu genů. Pro jakoukoli funkci (gen) nebo třídu (operon), kterou napíšete: dokážete si představit, že někdo půjde "yoink", aniž by znal zbytek vašeho kódu nebo musel importovat něco nového, aby získal výhodu? Mohl by být váš kód trendovou podstatou GitHubu?
Tento průvodce stylem kódování umožnil bakteriím kolonizovat každý ekologický kout od chladného přes horký až po kyselý nebo zásaditý v hlubinách Země a vesmírném vakuu, spolu s šílenou rozmanitostí uhlíkového anabolismu, energetického metabolismu atd. Vyniká v rychlém prototypování, ale... nemůže vybudovat složitý život. Pro srovnání, eukaryotický genom je výrazně větší, složitější, organizovanější a spřažené monorepo. Výrazně méně vynalézavé, ale nezbytné pro složitý život - pro stavbu celých orgánů a koordinaci jejich činnosti. S naší výhodou inteligentního designu by mělo být možné využít obojí. Pokud musíte, vytvořte eukaryotickou monorepo páteř, ale maximalizujte bakteriální DNA.

538,71K
Závod o LLM "kognitivní jádro" - model několika miliard parametrů, který maximálně obětuje encyklopedické znalosti za schopnosti. Žije vždy zapnutý a ve výchozím nastavení na každém počítači jako jádro osobních počítačů LLM.
Jeho vlastnosti pomalu krystalizují:
- Nativně multimodální text/vize/zvuk na vstupu i výstupu.
- Architektura ve stylu matrjošky umožňující vytáčení schopností nahoru a dolů v době testu.
- Uvažování, také s číselníkem. (systém 2)
- Agresivní používání nástrojů.
- Doladění slotů LoRA na zařízení pro školení, personalizaci a přizpůsobení v době testování.
- Deleguje a dvakrát kontroluje ty správné části pomocí orákul v cloudu, pokud je k dispozici internet.
Neví, že vláda Viléma Dobyvatele skončila 9. září 1087, ale matně poznává jméno a může si vyhledat datum. Neumí odříkat SHA-256 prázdného řetězce jako e3b0c442..., ale dokáže to rychle vypočítat, pokud byste to opravdu chtěli.
To, co LLM osobní počítače postrádají v širokých světových znalostech a schopnosti řešit problémy na nejvyšší úrovni, to dožene super nízkou latencí interakce (zejména jako multimodální zralé), přímým / soukromým přístupem k datům a stavu, offline kontinuitou, suverenitou ("ne vaše váhy, ne váš mozek"). Tj. mnoho stejných důvodů, proč se nám líbí, používáme a kupujeme osobní počítače místo toho, aby tencí klienti měli přístup do cloudu přes vzdálenou plochu nebo podobně.
1,03M
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější