découpage du modèle mondial V-JEPA 2 par @k7agar plongée dans l'architecture qui a permis de réaliser une saisie de tasse avec un taux de réussite de 65 % mentions du 'problème de l'objectif linguistique' où le robot est capable de comprendre ce qu'il doit accomplir sans qu'on lui montre une image / plusieurs images il serait intéressant d'explorer une approche décentralisée pour cela 1. le modèle mondial génère des itérations de 'but' 2. un réseau de vérificateurs décentralisés vote sur celui qui est considéré comme un 'but' précis, par exemple identifier un sandwich BLT lien ci-dessous
508