انهيار النموذج العالمي V-JEPA 2 حسب @k7agar الغوص في الهندسة المعمارية التي جعلت من الممكن لها تنفيذ الإمساك بالكوب بمعدل نجاح 65٪ يذكر عن "مشكلة هدف اللغة" حيث يكون الروبوت قادرا على فهم ما يحتاج إلى تحقيقه دون أن يظهر له صورة / صور متعددة سيكون من المثير للاهتمام استكشاف نهج لامركزي لذلك 1. يولد النموذج العالمي تكرارات "الهدف" 2. أصوات شبكة التحقق اللامركزية التي يعتبر عليها "هدفا" دقيقا ، على سبيل المثال تحديد شطيرة BLT الرابط أدناه
‏‎507‏