@karpathyあなたのインタビューをもう一度見返していたのですが、照明@lexfridman何かしましたか?
Andrej Karpathy
Andrej Karpathy7月18日 06:52
拡散ビデオモデルですが、今 - **リアルタイム**! シンプルなビデオフィルターはリアルタイムですが、基本的な色の変更とスタイルしか実行できません。ビデオ拡散モデル(Veoとその仲間たち)は魔法のようですが、生成には何秒も数分もかかります。MirageLSDはリアルタイムの魔法です。単純なビデオフィルターとは異なり、拡散モデルは実際に何を見ているのかを「理解」しているため、フィードのすべての部分をインテリジェントにスタイル設定できます(たとえば、頭に帽子をかぶせたり、ライトセーバーを手に当てたりするなど)。また、テキストプロンプトなどによって任意に操作できます。 カスタマイズ可能でインテリジェントなビデオフィルターは、時間の経過とともに多くのクールなアイデアを解き放ちます。 - カメラフィードを別の現実に変換する - 自分の映画を監督して撮影し、小道具でシーンを演じます。リアルタイム=>即時フィードバック/レビュー。 - Vibeは、単純な球体/ブロックを中心にゲームをコーディングし、その後、リアルタイムの拡散モデルを使用してゲームをテクスチャリングし、美しく仕上げます。 - ビデオフィードのスタイルとカスタマイズ:ゲーム、ビデオ、...例えば、Skyrimですが、「MORE EPIC」ですか?『DOOM II』だけど、プロンプトだけで最新のUnreal Engineの品質?ホラー映画だけど「可愛い、ピンクとウサギだけ」?知りません! - Zoom通話の背景+++ - リアルタイムでの服の試着 - メガネ:例:リアルタイムで視覚を漫画化しますか? - 私たちは今、エリシードのハリーポッターの鏡を作ることができます、鏡にあなたの「生のフィード」を表示しますが、あなたの最も深い欲望で強化されています(AIによって推測されるように)。 - わからない、たぶん一番大きいのが足りないんじゃないか、いろんなもの! (開示:私はデカルトの(非常に小さな)エンジェル投資家であり、この技術が非常に速く非常に良くなり、一般的で強力に感じられるので興奮しましたが、技術的にも非常に困難です。チームへの立ち上げおめでとうございます!
5.88K