Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Здание @EurekaLabsAI. Ранее директор по искусственному интеллекту @ Tesla, команда основателей @ OpenAI, CS231n/PhD @ Stanford. Мне нравится обучать большие глубокие нейронные сети 🧠🤖💥
Модели видео-диффузии, но теперь - **в реальном времени**!
Простые видеофильтры работают в реальном времени, но могут выполнять только базовую перекраску и стилизацию. Модели видео-диффузии (Veo и его друзья) - это магия, но они требуют много секунд/минут для генерации. MirageLSD - это магия в реальном времени. В отличие от простых видеофильтров, модели диффузии действительно *понимают*, что они видят, поэтому могут интеллектуально стилизовать все части потока (например, надевать шляпы на головы или световые мечи в руки и т.д.). И они могут быть произвольно управляемыми, например, с помощью текстовых подсказок.
Настраиваемые, интеллектуальные видеофильтры открывают множество классных идей со временем:
- преобразование камерных потоков в альтернативные реальности
- режиссировать и снимать свои собственные фильмы, разыгрывая сцены с реквизитом. Реальное время => мгновенная обратная связь/обзор.
- создавать игры с кодом настроения вокруг простых сфер/блоков, а затем использовать модель диффузии в реальном времени, чтобы текстурировать вашу игру и сделать ее красивой.
- стилизовать и настраивать любой видео поток: игры, видео и т.д. Например, Skyrim, но "БОЛЬШЕ ЭПИЧНО"? DOOM II, но с качеством современного Unreal Engine всего лишь с помощью подсказки? Ужастик, но "милый, розовый и только кролики"? Я не знаю!
- фоны для зум-звонков+++
- виртуальная примерка одежды в реальном времени
- очки: например, карикатуризировать ваше зрение в реальном времени?
- теперь мы можем построить Зеркало Эрисед Гарри Поттера, показывающее "сырой поток" вас в зеркале, но дополненное вашими глубочайшими желаниями (как это интерпретирует ИИ).
- Я не знаю, я, вероятно, упускаю самое главное, так много всего!

Decart18 июл., 04:44
Представляем MirageLSD: первая модель ИИ для диффузии в реальном времени (LSD)
Введите любой видеопоток, от камеры или видеочата до экрана компьютера или игры, и преобразуйте его в любой мир, который вы хотите, в реальном времени (<40 мс задержка).
Вот как это работает (с демонстрацией, которую вы можете использовать!) :
347,63K
Я часто жалуюсь на то, что 99% внимания будет уделено вниманию LLM, а не человеческому вниманию. Как выглядит исследовательская работа для LLM, а не для человека? Это определенно не pdf. Существует огромный потенциал для крайне ценной "исследовательской программы", которая это выяснит.

Michael Levin10 июл., 22:47
Меня постоянно раздражает, что у меня нет времени читать поток классных статей, которые приходят все быстрее и быстрее от удивительных людей в соответствующих областях. У других ученых такая же проблема, и у них тоже нет времени читать большинство моих длинных концептуальных статей. Так для кого мы пишем эти статьи?
Я полагаю, что, по крайней мере, до тех пор, пока они не столкнутся с той же проблемой в своей работе, ИИ будут единственными, кто действительно сможет прочитать все это. Я не говорю конкретно о языковых моделях сегодняшнего дня - давайте предположим, что мы имеем в виду любой неизбежный ИИ, который появится и сможет читать литературу и оказывать влияние на исследования (будь то общаясь с людьми или управляя автоматизацией лабораторий/платформами роботизированных ученых).
Так что: как нам следует писать, зная, что большая часть нашей аудитории будет ИИ (плюс киборги, гибриды, улучшенные люди и т. д.)? Возможно, еще рано знать, что делать, но нам лучше начать об этом думать, потому что предполагать, что наша аудитория всегда будет состоять из сегодняшних людей, кажется неосуществимым. Серьезно воспринимая идею о том, что когда-нибудь влиятельная аудитория будет очень отличаться, и что то, что мы пишем сейчас, в некотором смысле является обучающим набором для действительно разнообразных будущих существ, как изменится наше письмо? Или изменится?
498,07K
Как построить процветающее сообщество с открытым исходным кодом, пиша код, как это делают бактерии 🦠. Бактериальный код (геномы) это:
- маленький (каждая строка кода требует энергии)
- модульный (организован в группы взаимозаменяемых операонов)
- самодостаточный (легко "копируемый и вставляемый" через горизонтальный перенос генов)
Если куски кода маленькие, модульные, самодостаточные и тривиальны для копирования и вставки, сообщество может процветать благодаря горизонтальному переносу генов. Для любой функции (гена) или класса (операона), который вы пишете: можете ли вы представить, что кто-то скажет "йоинг", не зная остальной части вашего кода и не импортируя ничего нового, чтобы получить выгоду? Может ли ваш код стать популярным фрагментом на GitHub?
Этот стиль написания кода позволил бактериям колонизировать каждую экологическую нишу от холодной до горячей, от кислой до щелочной в глубинах Земли и в вакууме космоса, наряду с безумным разнообразием углеродного анаболизма, энергетического метаболизма и т.д. Он отлично подходит для быстрого прототипирования, но... он не может строить сложную жизнь. В сравнении, эукариотический геном значительно больше, более сложен, организован и связан в монорепозитории. Значительно менее изобретателен, но необходим для сложной жизни - для построения целых органов и координации их активности. С нашим преимуществом интеллектуального дизайна, должно быть возможно воспользоваться обоими. Постройте эукариотическую монорепозиторию, если это необходимо, но максимизируйте бактериальную ДНК.

538,72K
Гонка за "когнитивным ядром" LLM - модель с несколькими миллиардами параметров, которая максимально жертвует энциклопедическими знаниями ради возможностей. Она всегда включена и по умолчанию находится на каждом компьютере в качестве ядра персональных вычислений LLM.
Её функции медленно кристаллизуются:
- Нативная мультимодальность текста/изображения/аудио как на входе, так и на выходе.
- Архитектура в стиле матрешки, позволяющая регулировать возможности вверх и вниз во время тестирования.
- Рассуждение, также с регулировкой. (система 2)
- Агрессивное использование инструментов.
- Настройка LoRA на устройстве для обучения во время тестирования, персонализации и кастомизации.
- Делегирует и дважды проверяет только нужные части с оракулами в облаке, если интернет доступен.
Она не знает, что правление Вильгельма Завоевателя закончилось 9 сентября 1087 года, но смутно распознает имя и может найти дату. Она не может воспроизвести SHA-256 пустой строки как e3b0c442..., но может быстро его вычислить, если вы действительно этого хотите.
Чего не хватает персональным вычислениям LLM в широких мировых знаниях и высококлассных способностях решения проблем, то они компенсируют супернизкой задержкой взаимодействия (особенно по мере взросления мультимодальности), прямым/приватным доступом к данным и состоянию, оффлайн-продолжением, суверенитетом ("не ваши веса - не ваш мозг"). т.е. многие из тех же причин, по которым мы любим, используем и покупаем персональные компьютеры вместо того, чтобы иметь тонкие клиенты, получающие доступ к облаку через удаленный рабочий стол или что-то подобное.
1,03M
Топ
Рейтинг
Избранное
В тренде ончейн
В тренде в Х
Самые инвестируемые
Наиболее известные