المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
فقط افعل لنفسك معروفا واقرأ شرح تريسي عن سبب كون @codecopenflow أحد أفضل الرهانات لمشغلي الذكاء الاصطناعي
أصدرت OpenAI للتو وكيل Operators الخاص بها ، لذلك من الواضح أن الشركات الكبيرة تعمل أيضا على VLAs
لا يزال مخاطرة عالية ، لكن الستراتوسفير هو السقف المثير لهذا

18 يوليو، 16:10
أكدت OpenAI للتو أطروحة النجم الشمالي الخاصة بي عن الذكاء الاصطناعي اليوم من خلال إطلاق سراح وكيل المشغل.
لم تكن هذه أطروحتي التوجيهية $CODEC فحسب ، بل كانت كل استثمار الذكاء الاصطناعي آخر قمت به ، بما في ذلك تلك التي وقعت في وقت سابق من العام خلال هوس الذكاء الاصطناعي.
كان هناك الكثير من النقاش مع برنامج الترميز فيما يتعلق بالروبوتات ، في حين أن هذا العمودي سيكون له روايته الخاصة قريبا جدا ، فإن السبب الأساسي الذي جعلني متفائلا جدا بشأن برنامج الترميز منذ اليوم الأول يرجع إلى كيفية قيام بنيتها بتشغيل وكلاء المشغلين.
لا يزال الناس يقللون من شأن مقدار الحصة السوقية المعرضة للخطر من خلال بناء برامج تعمل بشكل مستقل ، ويتفوق على العمال البشريين دون الحاجة إلى مطالبات أو رقابة مستمرة.
لقد رأيت الكثير من المقارنات مع $NUIT. أولا ، أريد أن أقول إنني من أشد المعجبين بما تبنيه Nuit ولا أتمنى شيئا سوى نجاحهم. إذا كتبت "nuit" في برقيتي ، فسترى أنه في أبريل قلت إنه إذا اضطررت إلى الاحتفاظ بعملة واحدة لعدة أشهر ، فستكون Nuit بسبب أطروحة المشغل الخاصة بي.
كان Nuit أكثر مشاريع المشغل الواعد على الورق ، ولكن بعد بحث مكثف ، وجدت أن هندسته المعمارية تفتقر إلى العمق اللازم لتبرير استثمار كبير أو وضع سمعتي وراءه.
مع وضع ذلك في الاعتبار ، كنت بالفعل على دراية بالثغرات المعمارية في فرق وكلاء المشغل الحالية والبحث بنشاط عن مشروع يعالجها. بعد فترة وجيزة من ظهور برنامج الترميز (بفضل إصرار @0xdetweiler على النظر بشكل أعمق) وهذا هو الفرق بين الاثنين:
$CODEC مقابل $NUIT
تم بناء بنية برنامج الترميز عبر ثلاث طبقات. الآلة والنظام والذكاء، التي تفصل بين البنية التحتية وواجهة البيئة ومنطق الذكاء الاصطناعي. يعمل كل عامل عميل في برنامج الترميز في الجهاز الظاهري أو الحاوية المعزولة الخاصة به، مما يسمح بالأداء الأصلي القريب وعزل الأخطاء. يعني هذا التصميم متعدد الطبقات أن المكونات يمكن أن تتوسع أو تتطور بشكل مستقل دون كسر النظام.
تأخذ الهندسة المعمارية ل Nuit مسارا مختلفا من خلال كونها أكثر تجانسا. تدور مجموعتها حول وكيل متصفح ويب متخصص يجمع بين التحليل والتفكير في الذكاء الاصطناعي والعمل. بمعنى أنها تحلل صفحات الويب بعمق إلى بيانات منظمة ليستهلكها الذكاء الاصطناعي وتعتمد على المعالجة السحابية لمهام الذكاء الاصطناعي الثقيلة.
إن نهج برنامج الترميز لتضمين نموذج Vision-Language-Action خفيف الوزن (VLA) داخل كل وكيل يعني أنه يمكن تشغيله محليا بالكامل. الأمر الذي لا يتطلب إعادة اتصال مستمر إلى السحابة للحصول على التعليمات ، والتخلص من زمن الوصول وتجنب الاعتماد على وقت التشغيل والنطاق الترددي.
يعالج وكيل Nuit المهام عن طريق تحويل صفحات الويب أولا إلى تنسيق دلالي ثم استخدام دماغ LLM لمعرفة ما يجب القيام به ، والذي يتحسن بمرور الوقت مع التعلم المعزز. على الرغم من فعاليته في أتمتة الويب ، إلا أن هذا التدفق يعتمد على معالجة الذكاء الاصطناعي الثقيلة من جانب السحابة وهياكل الصفحات المحددة مسبقا. يعني ذكاء الجهاز المحلي لبرنامج الترميز أن القرارات تحدث بالقرب من البيانات ، مما يقلل من النفقات العامة ويجعل النظام أكثر استقرارا للتغييرات غير المتوقعة (لا توجد نصوص هشة أو افتراضات DOM).
يتبع مشغلو برنامج الترميز حلقة مستمرة للإدراك والتفكير والفعل. تقوم طبقة الجهاز ببث البيئة (على سبيل المثال تطبيق مباشر أو تغذية روبوت) إلى طبقة الذكاء عبر القنوات المحسنة لطبقة النظام ، مما يمنح الذكاء الاصطناعي "عيون" على الحالة الحالية. يقوم نموذج VLA الخاص بالوكيل بعد ذلك بتفسير العناصر المرئية والتعليمات معا لاتخاذ قرار بشأن الإجراء ، والذي تنفذه طبقة النظام من خلال أحداث لوحة المفاتيح / الماوس أو التحكم في الروبوت. تعني هذه الحلقة المدمجة أنها تتكيف مع الأحداث الحية ، حتى إذا تحولت واجهة المستخدم ، فلن تكسر التدفق.
لوضع كل هذا في تشبيه أكثر بساطة ، فكر في مشغلي برنامج الترميز كموظف مكتف ذاتيا يتكيف مع المفاجآت في الوظيفة. يشبه وكيل Nuit الموظف الذي يحتاج إلى التوقف ، ووصف الموقف للمشرف عبر الهاتف ، وانتظار التعليمات.
دون النزول كثيرا في حفرة الأرانب الفنية ، يجب أن يمنحك هذا فكرة عالية المستوى عن سبب اختياري ل Codec كرهاني الأساسي على العملاء.
نعم ، يتمتع Nuit بدعم من YC ، وهو فريق مكدس و github من المستوى S. على الرغم من أن بنية برنامج الترميز قد تم إنشاؤها مع وضع القياس الأفقي في الاعتبار ، مما يعني أنه يمكنك نشر الآلاف من الوكلاء بالتوازي مع عدم وجود ذاكرة مشتركة أو سياق تنفيذ بين الوكلاء. فريق الترميز ليس مطورين عاديين أيضا.
تفتح بنية VLA الخاصة بهم العديد من حالات الاستخدام التي لم تكن ممكنة مع نماذج الوكلاء السابقة بسبب الرؤية من خلال وحدات البكسل ، وليس لقطات الشاشة.
يمكنني الاستمرار ولكني سأحفظ ذلك للمشاركات المستقبلية.
1.91K
الأفضل
المُتصدِّرة
التطبيقات المفضلة