$CODEC: Hạ tầng cho các tác nhân Hình ảnh-Ngôn ngữ-Hành động; Thực thi AI Thế giới thực - Codec cung cấp năng lượng cho các Nhà điều hành, những tác nhân có khả năng nhận thức, lý luận và hành động sử dụng các mô hình VLA (Hình ảnh-Ngôn ngữ-Hành động). - Khác với LLM, các Nhà điều hành phát ra các điều khiển có thể thực thi: nhấp chuột, gõ phím, tín hiệu robot, không chỉ là văn bản. - @codecopenflow vận hành toàn bộ hệ thống: đầu vào hình ảnh → lý luận ngôn ngữ → hành động trong thế giới thực trong một vòng lặp thích ứng duy nhất. - Được xây dựng trên Mixtral-8x7B + CogVLM; đào tạo trong môi trường sandbox cho phép lặp lại an toàn trước khi triển khai trực tiếp. - @RoboMove là bản demo trực tiếp đầu tiên; SDK/API sẽ sớm ra mắt cho các nhà xây dựng tác nhân trong UI, robot và trò chơi. - Thiết kế Nhà điều hành xử lý các thay đổi bố cục, lỗi và quy trình nhiều bước mà không cần kịch bản dễ vỡ. - Lộ trình bao gồm thị trường Nhà điều hành có thể kiếm tiền, nhật ký dựa trên Solana và staking để đảm bảo an toàn. - Được thành lập bởi @_lilkm_ (cựu huggingface) và @unmoyai (elixir); được định vị như hạ tầng cốt lõi cho AI hiện thân. - Các yếu tố thúc đẩy: ra mắt SDK, triển khai tác nhân bên thứ ba và các bản demo đa miền.
1,81K