sammenbrudd av V-JEPA 2 verdensmodell etter @k7agar dykke ned i arkitekturen som gjorde det mulig for den å utføre koppgriping med 65 % suksessrate omtaler om 'språkmålsproblemet' der roboten er i stand til å forstå hva den trenger å oppnå uten å bli vist et bilde / flere bilder ville vært interessant å utforske en desentralisert tilnærming for det 1. Verdensmodellen genererer iterasjoner av 'mål' 2. desentralisert verifikatornettverk stemmer over hvilket som anses som et nøyaktig "mål", for eksempel å identifisere BLT-sandwich lenke nedenfor
479