Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Публічний продаж PUMP закінчився, спочатку у мене теж була велика сума в Bybit, всього 1/2 на ланцюжку, і в результаті тільки ланцюжок виявився вдалим, на щастя заздалегідь хеджування не було...
Останнім часом у AI-спільноті точиться багато дискусій щодо VLA (Vision-Language-Action)
Зокрема, я пішов досліджувати, чи є хтось, хто займається проєктами, пов'язаними з VLA, і побачив цей CodecFlow@Codecopenflow проєкт і трохи купив.
== Що робить CodecFlow ==
Короткий вступ до VLA, архітектури моделі, яка дозволяє штучному інтелекту не просто «говорити», а «робити».
Традиційні LLM (наприклад, GPT) можуть розуміти лише мову та давати пропозиції, але вони не можуть виконувати практичні дії, натискати на екрани або хапати об'єкти.
Модель VLA означає, що вона інтегрує три можливості:
1. Vision: розуміння зображень, знімків екрана, входів камери або даних датчиків
2. Мова: розуміти інструкції природної мови людини
3. Дія: Створюйте виконувані команди, такі як клацання мишею, введення з клавіатури та керування роботизованою рукою
CodecFlow виконує VLA в ланцюжку, і всі процеси також можуть бути завантажені в ланцюжок, які можна перевірити, перевірити та врегулювати.
Говорячи простою мовою, це інфраструктура «ШІ-бота».
== Чому я приділяю особливу увагу цьому пункту? ==
Я дізнався, що їхні розробники є основними учасниками LeRobot, найгарячішого проекту з відкритим вихідним кодом у сфері VLA!
LeRobot є найкращою базою для створення моделей VLA у світі з відкритим вихідним кодом, включаючи легкі VLA, які можуть працювати на ноутбуках, таких як SmolVLA.
Це означає, що ця команда дійсно розуміє архітектуру VlA та Robot.
Я бачу, що вони також продовжують нарощувати, і ціна валюти також неухильно зростає, я дуже оптимістично дивлюся на трек VLA, і з загальної тенденції, VLA та роботи – це справді майбутнє на ринку.
• Web2-гіганти (Google, Meta, Tesla) тепер повністю віддані навчанню VLA та ботів;
• Web3 проєкти є дефіцитними з точки зору додатків VLA, які можуть виконувати завдання
• VLA має можливість відігравати величезну роль у таких сценаріях, як DePIN, веб-автоматизація та виконання агента штучного інтелекту в ланцюжку.
CA:69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump
Завжди DYOR。

26 черв. 2025 р.
Хто такий оператор $CODEC?
Саме тут моделі Vision-Language-Action нарешті роблять ШІ корисним для реальної роботи.
Оператор – це автономний програмний агент, що працює на моделях VLA, який виконує завдання за допомогою безперервного циклу сприйняття-розум-дія.
LLM можуть блискуче думати і говорити, але вони не можуть навести, клацнути або схопити що-небудь. Це чисті розумні двигуни з нульовим заземленням у фізичному світі.
VLA поєднують візуальне сприйняття, розуміння мови та структуроване виведення дій за один прохід вперед. У той час як LLM описує, що має статися, модель VLA насправді робить це, випромінюючи координати, керуючі сигнали та виконувані команди.
Робочий процес Оператора це:
- Сприйняття: робить знімки екрана, трансляції з камери або дані датчиків.
- Міркування: обробляє спостереження разом з інструкціями природною мовою за допомогою моделі VLA.
- Дія: виконує рішення за допомогою взаємодії з інтерфейсом користувача або керування обладнанням — і все це в одному безперервному циклі.
Приклади: LLM проти оператора на базі моделі VLA
Планування зустрічі
LLM: Надає детальне пояснення управління календарем, описуючи кроки для планування зустрічі.
Оператор з моделлю VLA:
- Захоплює робочий стіл користувача.
- Ідентифікує програму календаря (наприклад, Outlook, Google Calendar).
- Перехід до четверга, створення зустрічі о 14:00 та додавання учасників.
- Автоматично адаптується до змін інтерфейсу користувача.
Робототехніка: сортування об'єктів
LLM: генерує точні письмові інструкції для сортування об'єктів, таких як ідентифікація та впорядкування червоних компонентів.
Оператор з моделлю VLA:
- Спостерігає за робочим простором в режимі реального часу.
- Визначає червоні компоненти серед змішаних об'єктів.
- Планує траєкторії без зіткнень для роботизованої руки.
- Виконує операції підбору та розміщення, динамічно пристосовуючись до нових позицій та орієнтацій.
Моделі VLA нарешті долають прірву між штучним інтелектом, який може міркувати про світ, і штучним інтелектом, який насправді може його змінити. Саме вони перетворюють автоматизацію з крихкого дотримання правил на адаптивне вирішення проблем — розумних працівників.
«Традиційні скрипти ламаються, коли змінюється середовище, але оператори використовують візуальне розуміння для адаптації в режимі реального часу, обробляючи винятки, а не розбиваючись на них».

10,7K
Найкращі
Рейтинг
Вибране