Niech robot zrobi hamburgera od podstaw! Niesamowity postęp w zakresie manipulacji złożonej na długim horyzoncie. Wizja sama w sobie często nie wystarcza — ta praca inteligentnie integruje wysokiej rozdzielczości czujniki dotykowe za pomocą uczenia międzymodalnego. ViTacFormer nie tylko przewiduje kontakt, ale także umożliwia solidne uczenie przez naśladowanie z antropomorficznymi rękami. Kamień milowy w wielomodalnej kontroli robotów.
Haoran Geng
Haoran Geng8 lip, 23:15
🤖 Co by było, gdyby humanoidalny robot mógł przygotować hamburgera z surowych składników — aż na twój talerz? 🔥 Z radością ogłaszamy ViTacFormer: naszą nową linię do manipulacji na nowym poziomie z aktywną wizją + wysokorozdzielczym dotykiem. 🎯 Po raz pierwszy w historii demonstrujemy ~2,5 minuty ciągłej, autonomicznej kontroli — łącząc aktywną wizję, wysokorozdzielczy dotyk i robotyczne ręce SharpaWave o wysokim stopniu swobody — aby wykonać złożone, rzeczywiste zadania. Kod jest w pełni udostępniony; sprawdź naszą: Stronę główną: Link do pracy: Github:
3,78K