المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
🧵أفضل 10 نماذج مفتوحة حسب المزود
على الرغم من أن النماذج المسجلة الملكية غالبا ما تتصدر المخططات ، إلا أن النماذج المفتوحة يتم إقرانها أيضا في وضع المعركة ، ويتم تصنيفها في قوائم المتصدرين العامة.
فيما يلي أفضل 10 عند تكديسها حسب النموذج المفتوح العلوي حسب المزود.
- # 1 كيمي K2 (معهد ماساتشوستس للتكنولوجيا المعدل) @Kimi_Moonshot
- # 2 DeepSeek R1 0528 (معهد ماساتشوستس للتكنولوجيا) @deepseek_ai
- # 3 Qwen 235b a22b لا تفكير (Apache 2.0) @alibaba_qwen
- # 4 MiniMax M1 (معهد ماساتشوستس للتكنولوجيا) @minimax_ai
- # 5 جيما 3 27 ب (جيما) @googledeepmind
- # 6 ميسترال سمول الترا (أباتشي 2.0) @mistral_ai
- # 7 لاما 3.1 Nemotron Ultra 253b v1 (طراز Nvidia المفتوح) @nvidia
- # 8 الأمر أ (متماسك) @cohere
- # 9 لاما 4 المنشق إنسيروكت (لاما 4) @aiatmeta
- # 10 OLMo 2 32b Instruct (Apache 2.0) @allen_ai
راجع الموضوع لمعرفة المزيد عن أفضل 5 في هذه القائمة 👇

كيمي K2 - # 1 في الساحة المفتوحة!
إذا كنت تهتم بالنماذج مفتوحة المصدر ، فإن هذا النموذج الجديد من شركة الذكاء الاصطناعي الصاعدة ، Moonshot الذكاء الاصطناعي ، يحدث موجات كواحد من أكثر LLMs مفتوحة المصدر إثارة للإعجاب حتى الآن. يخبرنا مجتمعنا أنهم يحبون أيضا الطريقة التي يستجيب بها Kimi K2: Kimi روح الدعابة دون أن يبدو آليا للغاية.
تم بناء Kimi K2 على بنية مزيج من الخبراء (MoE) ، بإجمالي 1 تريليون معلمة ، منها 32 مليار نشطة خلال أي استدلال معين. يساعد هذا التصميم النموذج على تحقيق التوازن بين الكفاءة والأداء عند الطلب.
أفضل طراز مفتوح من DeepSeek ، DeepSeek R1-0528 ، يحتل المرتبة # 2
R1-0528 هو إصدار محسن مضبوطة بالتعليمات من R1 ، و # 2 أفضل نموذج دردشة مفتوحة وفقا للمجتمع. قوي في مهام الحوار والاستدلال متعددة الأدوار.
R1 (خط الأساس) هو الأصلي ، ولا يزال صلبا ولكنه الآن متأخر قليلا عن متغيرات الضبط الأحدث.
V3-0324 هو نموذج وزارة التربية والتعليم مع معلمات إجمالية تبلغ 236B ، ولكنه ينشط فقط عدد قليل من الخبراء لكل مطالبة. هذا يجعلها قوية وفعالة. إنه يعمل بشكل جيد عبر التعليمات والتفكير والمهام متعددة اللغات ، ولكن التنسيق الفوري مهم هنا أكثر من R1-0528.
Qwen 235b a22b (بدون تفكير) هو أعلى تصنيف للنماذج المفتوحة لشركة Alibaba في # 3
235B-a22b-no-thinking هو نموذج خام بدون ضبط التعليمات (وبالتالي "عدم التفكير").
إنه رائع في التوليد ويحتل مرتبة عالية مع المجتمع نظرا لقوته المنطقية الخام.
تتضمن بعض أفضل الموديلات المفتوحة الأخرى مع مجتمعنا من علي بابا ما يلي:
تعد المتغيرات 32B و 30B-a3b بدائل أصغر وأسرع مع أداء قوي ، على الرغم من أنها تتخلف عن طرازات الدرجة الأولى. نظرا لكون 32B أكثر كثافة بين الاثنين ، يفضل المجتمع دقته على 30B-a3b. 30B-a3b هو نموذج وزارة التربية مما يجعله أسرع قليلا.
تم تصميم QWQ-32B خصيصا لمعالجة مشاكل التفكير المعقدة ويهدف إلى مطابقة أداء الموديلات الأكبر حجما مثل DeepSeek R1 ، ولكنه لا يترك هذه العلامة تماما عند اختباره في العالم الحقيقي.
يصنع MiniMax M1 القائمة مع أعلى تصنيف للطراز في # 4
تتميز M1 أيضا بنهجها الفريد مع بنية وزارة التربية جنبا إلى جنب مع شكل من أشكال الاهتمام يسمى "Lightning Attention" ، وهي آلية خطية مصممة خصيصا لمعالجة الرموز المميزة عالية الكفاءة.
من المؤكد أن هذا النهج لفت انتباه مجتمعنا لكونه جيدا حقا في الحوار والتفكير واتباع التعليمات.
تهبط Google DeepMind في # 5 مع أفضل طراز مفتوح ، Gemma 3 27b
Gemma 3 هو نموذج لغة مفتوح الوزن ومتعدد الوسائط. يمكن ل Gemma 3 التعامل مع كل من مدخلات النص والصور ، والتفوق في التفكير ، ومهام السياق الطويل ، وتطبيقات لغة الرؤية. يحب مجتمعنا كيف حسنت Gemma كفاءة الذاكرة وزادت من الدعم لسياق أكبر مقارنة بالإصدارات السابقة.
36.4K
الأفضل
المُتصدِّرة
التطبيقات المفضلة