Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
PUMP công khai đã kết thúc, ban đầu tôi cũng đã đầu tư lớn vào Bybit, chỉ để lại 1/2 trên chuỗi, cuối cùng chỉ có giao dịch trên chuỗi thành công, may mắn là không phải bảo hiểm trước…
Nói về việc gần đây có nhiều người trong cộng đồng AI đang thảo luận về VLA (Vision‑Language‑Action)
Tôi đã đặc biệt nghiên cứu xem có ai đang làm dự án liên quan đến VLA trên chuỗi không, và đã thấy dự án CodecFlow @Codecopenflow, tôi đã mua một ít.
== CodecFlow đang làm gì ==
Giới thiệu ngắn gọn về VLA, VLA là một mô hình cho phép AI không chỉ "có thể nói", mà còn "có thể làm".
Các LLM truyền thống (như GPT) chỉ có thể hiểu ngôn ngữ, cung cấp gợi ý, nhưng chúng không thể thực hiện thao tác, không thể nhấp vào màn hình, không thể lấy vật thể.
Mô hình VLA có nghĩa là tích hợp ba khả năng lớn:
1. Vision (thị giác): hiểu hình ảnh, chụp màn hình, đầu vào từ camera hoặc dữ liệu cảm biến
2. Language (ngôn ngữ): hiểu lệnh ngôn ngữ tự nhiên của con người
3. Action (hành động): tạo ra các lệnh có thể thực hiện, như nhấp chuột, nhập bàn phím, điều khiển cánh tay robot
CodecFlow đang làm VLA trên chuỗi, tất cả quy trình hoạt động còn có thể được ghi lại trên chuỗi, có thể kiểm toán, có thể xác minh, có thể thanh toán.
Nói một cách đơn giản, đây là "hạ tầng cơ bản của robot AI".
== Tại sao tôi đặc biệt chú ý đến dự án này? ==
Tôi phát hiện ra rằng các nhà phát triển của họ là những người đóng góp cốt lõi cho dự án mã nguồn mở LeRobot nổi tiếng trong lĩnh vực VLA!
LeRobot là một trong những cơ sở hàng đầu để xây dựng mô hình VLA trong cộng đồng mã nguồn mở, bao gồm cả SmolVLA, một VLA nhẹ có thể chạy trên laptop.
Điều này cho thấy đội ngũ này thực sự hiểu cấu trúc VLA và Robot.
Tôi thấy họ cũng đang tiếp tục xây dựng, giá coin cũng ổn định tăng lên, tôi rất lạc quan về lĩnh vực VLA, và từ xu hướng tổng thể, VLA và robot thực sự là tương lai trên thị trường.
• Các ông lớn Web2 (Google, Meta, Tesla) hiện đang đầu tư mạnh vào VLA & đào tạo robot;
• Các dự án Web3 rất ít có ứng dụng VLA có thể thực hiện nhiệm vụ, vẫn còn rất hiếm
• VLA có cơ hội phát huy giá trị lớn trong các tình huống như DePIN, Tự động hóa Web, thực hiện AI Agent trên chuỗi.
CA: 69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump
Luôn luôn DYOR.

26 thg 6, 2025
$CODEC Operator là gì?
Đó là nơi mà các mô hình Vision-Language-Action cuối cùng làm cho AI hữu ích cho công việc thực tế.
Một Operator là một tác nhân phần mềm tự động được cung cấp năng lượng bởi các mô hình VLA, thực hiện các nhiệm vụ thông qua một chu trình liên tục nhận thức-lý luận-hành động.
LLMs có thể suy nghĩ và nói một cách xuất sắc, nhưng chúng không thể chỉ, nhấp chuột, hoặc nắm bắt bất cứ điều gì. Chúng là những động cơ lý luận thuần túy mà không có sự kết nối nào với thế giới vật lý.
VLAs kết hợp nhận thức hình ảnh, hiểu ngôn ngữ và đầu ra hành động có cấu trúc trong một lần truyền duy nhất. Trong khi một LLM mô tả những gì nên xảy ra, một mô hình VLA thực sự làm cho nó xảy ra bằng cách phát ra tọa độ, tín hiệu điều khiển và lệnh thực thi.
Quy trình làm việc của Operator là:
- Nhận thức: chụp ảnh màn hình, luồng camera, hoặc dữ liệu cảm biến.
- Lý luận: xử lý các quan sát cùng với hướng dẫn bằng ngôn ngữ tự nhiên sử dụng mô hình VLA.
- Hành động: thực hiện các quyết định thông qua tương tác UI hoặc điều khiển phần cứng - tất cả trong một vòng lặp liên tục.
Ví dụ: LLM so với Operator được cung cấp năng lượng bởi mô hình VLA
Lên lịch cuộc họp
LLM: Cung cấp một giải thích chi tiết về quản lý lịch, phác thảo các bước để lên lịch một cuộc họp.
Operator với mô hình VLA:
- Chụp màn hình máy tính của người dùng.
- Xác định ứng dụng lịch (ví dụ: Outlook, Google Calendar).
- Điều hướng đến thứ Năm, tạo một cuộc họp vào lúc 2 giờ chiều và thêm người tham gia.
- Tự động thích ứng với các thay đổi giao diện người dùng.
Robot: Phân loại đối tượng
LLM: Tạo ra các hướng dẫn viết chính xác cho việc phân loại đối tượng, chẳng hạn như xác định và tổ chức các thành phần màu đỏ.
Operator với mô hình VLA:
- Quan sát không gian làm việc trong thời gian thực.
- Xác định các thành phần màu đỏ trong số các đối tượng hỗn hợp.
- Lập kế hoạch các quỹ đạo không va chạm cho cánh tay robot.
- Thực hiện các thao tác nhặt và đặt, điều chỉnh một cách linh hoạt theo các vị trí và hướng mới.
Các mô hình VLA cuối cùng đã thu hẹp khoảng cách giữa AI có thể lý luận về thế giới và AI có thể thực sự thay đổi nó. Chúng là những gì biến tự động hóa từ việc tuân theo quy tắc mong manh thành giải quyết vấn đề thích ứng - những công nhân thông minh.
"Các kịch bản truyền thống bị hỏng khi môi trường thay đổi, nhưng Operators sử dụng hiểu biết hình ảnh để thích ứng trong thời gian thực, xử lý các ngoại lệ thay vì bị sập."

10,69K
Hàng đầu
Thứ hạng
Yêu thích