حديثي الكامل من معرض AIE العالمي قد انتهى الآن :)
AI Engineer
AI Engineer‏8 يوليو، 01:34
🆕 تدريب المنطق الوكيل ميزة اليوم هي عودة @willccbb المظفرة إلى مسار RL لمرحلة AIE - الآن كجزء من @PrimeIntellect! يقوم الكثير من بناة الوكلاء بشكل أساسي ب "RL باليد". يشرح بإيجاز خوارزميات RL الحالية في شريحة واحدة (!) ، لكنه يجادل بعد ذلك بأن RL - خاصة بالنسبة للنماذج المفتوحة - عالق في الرياضيات وكود الأسئلة والأجوبة السخونة الجديدة هي RL عامل متعدد الأدوار ، ومكتبة المدققين الجديدة هي مجموعة الأدوات النهائية لبناء وكيل وتحويله إلى حلقة RL. يجب أن يستكشف المزيد من الأشخاص بناء نماذج وكيل أفضل ويتيح Will + PI ذلك للجميع!
feedsImage
‏‎14.77‏K