розбивка світової моделі V-JEPA 2 за @k7agar Занурення в архітектуру, що дозволило йому проводити захоплення чашок з 65% успіхом згадки про «проблему мовних цілей», коли робот здатний зрозуміти, чого йому потрібно досягти, не показуючи фото / кілька фотографій Було б цікаво дослідити децентралізований підхід для цього 1. Модель світу генерує ітерації «мети» 2. Децентралізована мережа верифікаторів голосує за те, яка з них вважається точною «метою», наприклад, ідентифікація сендвіча BLT посилання нижче
490