انتهى البيع العام ل PUMP ، في الأصل كنت أيضا مبلغا كبيرا في Bybit ، فقط 1/2 على السلسلة ، وفي النهاية ، كانت السلسلة فقط ناجحة ، ولحسن الحظ لم يكن هناك تحوط مقدما ... في الآونة الأخيرة ، كان هناك الكثير من النقاش في مجتمع الذكاء الاصطناعي حول VLA (الرؤية - اللغة - العمل) على وجه الخصوص ، ذهبت للبحث عما إذا كان هناك أي شخص يقوم بمشاريع متعلقة ب VLA على السلسلة ، ورأيت هذا المشروع CodecFlow@Codecopenflow واشتريت قليلا. == ماذا يفعل CodecFlow == مقدمة موجزة عن VLA ، وهي بنية نموذجية تسمح ل الذكاء الاصطناعي ليس فقط "بالتحدث" ، ولكن "العمل". يمكن لطلاب القانون التقليديين (مثل GPT) فهم اللغة وتقديم الاقتراحات فقط ، ولكن لا يمكنهم القيام بالتدريب العملي أو النقر على الشاشات أو الاستيلاء على الأشياء. يعني نموذج VLA أنه يدمج ثلاث قدرات: 1. الرؤية: فهم الصور أو لقطات الشاشة أو مدخلات الكاميرا أو بيانات المستشعر 2. اللغة: فهم تعليمات اللغة الطبيعية للإنسان 3. الإجراء: قم بإنشاء أوامر قابلة للتنفيذ ، مثل نقرات الماوس وإدخال لوحة المفاتيح والتحكم في الذراع الآلية يقوم CodecFlow بعمل VLA على السلسلة ، ويمكن أيضا تحميل جميع العمليات إلى السلسلة ، والتي يمكن تدقيقها والتحقق منها وتسويتها. بعبارات بسيطة ، إنها البنية التحتية ل "روبوت الذكاء الاصطناعي". == لماذا أولي اهتماما خاصا لهذا العنصر؟ == اكتشفت أن مطوروهم هم المساهمون الأساسيون في LeRobot ، وهو المشروع مفتوح المصدر الأكثر سخونة في مساحة VLA! LeRobot هي القاعدة العليا لبناء نماذج VLA في عالم المصدر المفتوح ، بما في ذلك VLA خفيفة الوزن التي يمكن تشغيلها على أجهزة الكمبيوتر المحمولة مثل SmolVLA. هذا يعني أن هذا الفريق يفهم حقا بنية VlA والروبوت. أرى أنهم يستمرون أيضا في البناء ، كما أن سعر العملة يرتفع بشكل مطرد ، وأنا متفائل جدا بشأن مسار VLA ، ومن الاتجاه العام ، فإن VLA والروبوتات هي بالفعل المستقبل في السوق. • عمالقة Web2 (Google و Meta و Tesla) ملتزمون الآن تماما بتدريب VLA والروبوت. • مشاريع Web3 نادرة من حيث تطبيقات VLA التي يمكنها أداء المهام • لدى VLA الفرصة للعب دور كبير في سيناريوهات مثل DePIN وأتمتة الويب وتنفيذ عامل الذكاء الاصطناعي على السلسلة. CA: 69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump دائما DYOR。
CodecFlow
CodecFlow‏26 يونيو 2025
ما هو مشغل $CODEC؟ إنه المكان الذي تجعل فيه نماذج الرؤية واللغة والعمل الذكاء الاصطناعي مفيدا للعمل الحقيقي. المشغل هو وكيل برمجيات مستقل مدعوم بنماذج VLA التي تؤدي المهام من خلال دورة مستمرة للإدراك والعقل والفعل. يمكن لطلاب القانون التفكير والتحدث ببراعة ، لكن لا يمكنهم الإشارة أو النقر أو الاستيلاء على أي شيء. إنها محركات تفكير بحتة بدون أساس في العالم المادي. تجمع VLAs بين الإدراك البصري وفهم اللغة وإخراج العمل المنظم في تمريرة أمامية واحدة. بينما يصف LLM ما يجب أن يحدث ، فإن نموذج VLA يحقق ذلك بالفعل عن طريق إصدار الإحداثيات وإشارات التحكم والأوامر القابلة للتنفيذ. سير عمل المشغل هو: - الإدراك: يلتقط لقطات شاشة أو موجزات الكاميرا أو بيانات المستشعر. - التفكير: يعالج الملاحظات جنبا إلى جنب مع تعليمات اللغة الطبيعية باستخدام نموذج VLA. - الإجراء: ينفذ القرارات من خلال تفاعلات واجهة المستخدم أو التحكم في الأجهزة - كل ذلك في حلقة واحدة مستمرة. أمثلة: LLM مقابل المشغل المدعوم من طراز VLA جدولة اجتماع LLM: يقدم شرحا مفصلا لإدارة التقويم ، ويحدد خطوات جدولة الاجتماع. المشغل مع طراز VLA: - يلتقط سطح مكتب المستخدم. - يحدد تطبيق التقويم (على سبيل المثال ، Outlook ، تقويم Google). - الانتقال إلى الخميس، وإنشاء اجتماع في الساعة 2 ظهرا، وإضافة الحضور. - يتكيف تلقائيا مع تغييرات واجهة المستخدم. الروبوتات: فرز الكائنات LLM: يولد تعليمات مكتوبة دقيقة لفرز الكائنات، مثل تحديد المكونات الحمراء وتنظيمها. المشغل مع طراز VLA: - يراقب مساحة العمل في الوقت الفعلي. - يحدد المكونات الحمراء بين الكائنات المختلطة. - يخطط لمسارات خالية من الاصطدام لذراع آلية. - ينفذ عمليات الانتقاء والمكان ، والتكيف ديناميكيا مع المواضع والتوجهات الجديدة. تعمل نماذج VLA أخيرا على سد الفجوة بين الذكاء الاصطناعي التي يمكن أن تفكر في العالم الذكاء الاصطناعي التي يمكن أن تغيره بالفعل. إنها التي تحول الأتمتة من اتباع القواعد الهشة إلى عمال أذكياء يتكيفون. "تنكسر البرامج النصية التقليدية عندما تتغير البيئة، لكن العملاء يستخدمون الفهم المرئي للتكيف في الوقت الفعلي، والتعامل مع الاستثناءات بدلا من التعطل عليها."
‏‎10.69‏K