Modelli video di diffusione ma ora - **in tempo reale**! I filtri video semplici sono in tempo reale ma possono solo fare una ricollocazione e stili di base. I modelli di diffusione video (Veo e amici) sono magia, ma richiedono molti secondi/minuti per generare. MirageLSD è magia in tempo reale. A differenza dei semplici filtri video, i modelli di diffusione *capiscono* effettivamente cosa stanno guardando, quindi possono stilizzare tutte le parti del feed in modo intelligente (ad esempio, mettere cappelli sulle teste o spade laser nelle mani, ecc.). E sono arbitrariamente guidabili, ad esempio, tramite prompt testuali. Filtri video personalizzabili e intelligenti sbloccano molte idee interessanti nel tempo: - trasformare i feed della fotocamera in realtà alternative - dirigere e girare i propri film, recitando scene con oggetti di scena. In tempo reale => feedback/ripasso istantaneo. - creare giochi di vibrazione attorno a semplici sfere/blocchi, quindi utilizzare un modello di diffusione in tempo reale per texturizzare il tuo gioco e renderlo bello. - stilizzare e personalizzare qualsiasi feed video: giochi, video, ... ad esempio Skyrim ma "PIÙ EPICO"? DOOM II ma con qualità moderna di Unreal Engine con solo un prompt? Film horror ma "carino, rosa e solo con coniglietti"? Non lo so! - sfondi per videochiamate+++ - prova virtuale di vestiti in tempo reale - occhiali: ad esempio, rendere cartoonistica la tua visione in tempo reale? - ora possiamo costruire lo Specchio di Erised di Harry Potter, mostrando il "feed grezzo" di te nello specchio ma aumentato con i tuoi desideri più profondi (come inferito dall'IA). - Non lo so, probabilmente mi manca il più grande, ci sono così tante cose!
Decart
Decart18 lug, 04:44
Presentiamo MirageLSD: Il Primo Modello AI di Diffusione in Diretta (LSD) Inserisci qualsiasi flusso video, da una telecamera o una videochiamata a uno schermo del computer o un videogioco, e trasformalo in qualsiasi mondo tu desideri, in tempo reale (<40ms di latenza). Ecco come funziona (con demo che puoi utilizzare!) :
326,64K