análise do modelo mundial V-JEPA 2 por @k7agar mergulhando na arquitetura que possibilitou a realização de agarrar copos com uma taxa de sucesso de 65% menções sobre o 'problema do objetivo de linguagem' onde o robô é capaz de entender o que precisa alcançar sem ser mostrado uma imagem / várias imagens seria interessante explorar uma abordagem descentralizada para isso 1. o modelo mundial gera iterações de 'objetivo' 2. uma rede de verificadores descentralizada vota sobre qual é considerado um 'objetivo' preciso, por exemplo, identificar um sanduíche BLT link abaixo
544