مقدمة في نماذج اللغة غير المصفاة
أصبحت نماذج اللغة الكبيرة (LLMs) ركيزة أساسية في الذكاء الاصطناعي الحديث، مما يمكن الآلات من فهم وإنتاج نصوص شبيهة بالنصوص البشرية. بينما تأتي العديد من نماذج LLMs مع فلاتر محتوى مدمجة لمنع توليد محتوى ضار أو غير مناسب، يتزايد الاهتمام بنماذج LLMs غير المصفاة. تعمل هذه النماذج دون مثل هذه القيود، مما يوفر مرونة أكبر وامتثالاً ولكنها تمثل أيضًا تحديات أخلاقية كبيرة. تستكشف هذه المقالة أفضل خمس نماذج LLMs غير المصفاة المتاحة اليوم، مع نظرة مفصلة على نموذج Dolphin 2.7 Mixtral 8x7b وكيفية تشغيله باستخدام Ollama.
الميزات الرئيسية لنموذج دولفين لاما 3 70B:
- أكثر قوة ومرونة من نموذج Llama-3.1-8B-Instruct المفكوك
- تجربة LLM غير مصفاة
- متاحة على Anakin.AI! ببساطة قم بزيارة https://app.anakin.ai/، وانقر على خيار "الدردشات" في اللوحة اليسرى.

واختر خيار دولفين لاما 3.1 8B للتحدث غير المقيد مع LLMs عبر الإنترنت!


1. دولفين 2.9.1 لاما 3 70B: أفضل نموذج LLM غير مصفاة بشكل عام
أثبتت نماذج لاما 3 أنها موثوقة وتنتج مخرجات مدهشة تتحدى OpenAI. فلماذا لا تستخدم النسخة غير المصفاة من لاما 3؟
نموذج كبير غير مصفاة يستخدم بنية لاما 3. تشمل النقاط البارزة:
- 70 مليار معامل لأداء عالي عبر مجموعة واسعة من المهام، مما يمكنه من التفكير المعقد وقدرات التوليد
- طول سياق ممتد للتعامل مع المدخلات الأطول والحفاظ على التماسك، مناسب للمهام التي تتطلب تحليل مستندات ضخمة
- تحسين القدرات المعرفية والتفكير مقارنة بالنماذج الأصغر، مما قد يقترب من أداء مستوى الإنسان في مجالات معينة
- تم تدريبه باستخدام ضبط دقيق كامل الوزن بطول تسلسل 4K، مما يسمح بمعالجة فعالة لتسلسلات النصوص الطويلة
- يشتمل على قدرات وكيلة أولية ويدعم استدعاء الوظائف لمخرجات أكثر تنظيماً، مما يعزز إمكانياته لإكمال المهام وتكامله مع أنظمة أخرى
- إزالة مجموعات البيانات المستخدمة في الإصدارات السابقة لمعالجة قضايا السلوك والاعتماد المفرط على توجيهات النظام، مما قد يُحسن موثوقيته ويقلل من السلوكيات غير المرغوب فيها
- مرخص بموجب اتفاقية ترخيص المجتمع META LLAMA 3، مما يسمح بالاستخدام التجاري ضمن الشروط المحددة، ويوفر الفرص للأعمال مع الحفاظ على بعض القيود
- تتطلب طبيعتها غير المصنفة تنفيذًا دقيقًا للإرشادات الأخلاقية واستراتيجيات إدارة المحتوى في التطبيقات الواقعية
2. دولفين 2.7 مكسطرال 8x7B: نموذج LLM كلاسيكي غير مصفاة
دولفين 2.7 مكسطرال 8x7b، الذي أنشأه إريك هارثفورد، هو نموذج LLM غير مصفاة رائد معروف بقدراته القوية في البرمجة وامتثاله العالي. يستند هذا النموذج إلى بنية مكسطرال المكونة من خبراء متعددين، والتي تجمع بين عدة نماذج ذكاء اصطناعي متخصصة في نظام واحد قوي. تم ضبطه بدقة مع مجموعات بيانات إضافية مثل Synthia و OpenHermes و PureDove، مما يجعله متعدد الاستخدامات للغاية.
الميزات الرئيسية لدولفين 2.7 مكسطرال 8x7b
- تصميم غير مصفاة: تم تصميم دولفين 2.7 مكسطرال 8x7b للعمل بدون فلاتر المحتوى، مما يسمح له بتوليد ردود دون قيود. وهذا يجعله متوافقاً للغاية وقادراً على إنتاج مجموعة واسعة من المخرجات، بما في ذلك تلك التي قد تعتبر غير أخلاقية أو غير مناسبة.
- أداء عالي: يتميز النموذج في مهام البرمجة، بفضل تدريبه على مجموعات بيانات برمجية واسعة. يمكنه توليد كود عالي الجودة وتقديم تفسيرات مفصلة، مما يجعله أداة قيمة للمطورين.
- تكميم مرن: يتوفر دولفين 2.7 مكسطرال 8x7b في عدة تنسيقات تكميم، بما في ذلك GGUF و AWQ، التي توازن بين حجم النموذج والأداء. تتيح هذه المرونة للمستخدمين اختيار التكوين الأفضل لأجهزتهم واحتياجات تطبيقاتهم.
يمكنك اختبار هذا النموذج غير المصنف عبر الإنترنت الآن في Anakin AI!
أنكين آي هي منصة الذكاء الاصطناعي الشاملة التي تدعم أي نموذج ذكاء اصطناعي متاح. يمكنك بسهولة دمج واجهة برمجة التطبيقات الخاصة بك لإنشاء تطبيق ذكاء اصطناعي مخصص بسهولة!

تشغيل دولفين 2.7 مكسطرال 8x7b باستخدام Ollama
Ollama هي منصة توفر وصولاً سلسًا إلى نماذج الذكاء الاصطناعي المتقدمة، بما في ذلك دولفين 2.7 مكسطرال 8x7b. إليك كيفية تشغيل هذا النموذج باستخدام Ollama:
- إنشاء حساب: قم بإنشاء حساب على منصة Ollama.
- الوصول إلى النموذج: انتقل إلى مكتبة النماذج واختر دولفين 2.7 مكسطرال 8x7b.
- إعداد بيئتك: قم بتكوين إعدادات النموذج حسب متطلباتك. يمكنك اختيار تنسيق التكميم وضبط معلمات مثل درجة الحرارة وحدود الرموز.
- التفاعل مع النموذج: استخدم واجهة المنصة لإدخال العروض واستلام الردود من النموذج. يدعم Ollama أوضاع التفاعل المتنوعة، بما في ذلك الدردشات المحاكية واستعلامات منظمة.
مثال على الأمر لتشغيل النموذج:
ollama run dolphin-mixtral "اختر مشكلة صعبة من leetcode، وحلها في Kotlin"
سيطلب هذا الأمر من النموذج حل مشكلة معينة في Kotlin، مما يعرض قدراته في البرمجة.
3. رؤية دولفين 72B: نموذج رؤية غير مصفاة
نعم، دولفين يمكنه الرؤية الآن!

هذا النموذج المتقدم المتعدد الوسائط غير المصنف يمكنه تحليل الصور وتوليد ردود نصية دون قيود على المحتوى. تشمل الميزات الرئيسية:
- بنية 72 مليار معامل لأداء عالٍ في معالجة اللغة والرؤية، مما يسمح بالتفكير المعقد والمخرجات التفصيلية
- القدرة على التفكير حول الصور ووصفها، مما يجعلها مناسبة لمجموعة واسعة من المحتوى البصري
- قدرات متعددة الوسائط تجمع بسلاسة بين فهم الرؤية واللغة، مما يمكّن من تفاعلات غنية بين مدخلات النص والصورة
- مبنية على بنية BunnyQwen، ومحسّنة لمعالجة البيانات البصرية والنصية بشكل فعال في نموذج واحد
- تتطلب موارد حسابية كبيرة، مع 147 جيجابايت من VRAM اللازمة للنشر، مما يحد من استخدامها على إعدادات الأجهزة المتطورة
- طول سياق مثير للإعجاب يبلغ 131072 رمز لمعالجة العروض الطويلة وتوليد ردود تفصيلية، مما يسمح بتحليل مستندات أو محادثات طويلة
- تستخدم Qwen2Tokenizer بحجم مفردات يبلغ 152064 لتمثيل نص دقيق، مما يمكّن من التعامل الدقيق مع لغات مختلفة والمصطلحات المتخصصة
- صممت لتكون غير مصفاة، مما يسمح بمخرجات غير مقيدة قد تتطلب الاعتبار الدقيق في سيناريوهات النشر.
4. دولفين 2.9.3 مكسطرال نيمو 12B: أفضل نموذج LLM غير مصفاة محلي، حتى الآن
تم التحقق من نموذج مكسطرال-نيمو-12B كواحد من أفضل نماذج LLM المحلية التي تعمل على الكمبيوتر المحمول الحديث. إذا كنت بحاجة إلى مساعد LLM يعمل محليًا، فإن هذا النموذج غير المصنف هو الأفضل بالنسبة لك.
يوجد لديه نموذج غير مصفاة بمقدار 12 مليار معامل يعتمد على بنية نيمو الخاصة بشركة مكسطرال AI. الجوانب الملحوظة:
- يستخدم تنسيق رعاية ChatML للتفاعلات المنظمة، مما يمكّن من فصل واضح بين إرشادات النظام ومدخلات المستخدم وردود النموذج
- نافذة سياق 128K تمكّن من تحليل مستندات طويلة أو محادثات، مناسبة للمهام التي تتطلب ذاكرة طويلة الأمد وتماسك
- مصمم لاتباع التعليمات، المحادثة، البرمجة، والقدرات الوكيلة الأولية، مما يجعله متعدد الاستخدامات لمجموعة متنوعة من التطبيقات
- مدرب على مجموعة بيانات متنوعة تشمل محتوى متعدد اللغات وأمثلة برمجية، مما يعزز قدرته على التعامل مع مجموعة واسعة من المهام واللغات
- يطبق ميزات استدعاء الوظائف لمخرجات أكثر تنظيماً، مما يتيح التكامل مع أدوات خارجية وواجهات برمجة التطبيقات
- محسن للنشر على الأجهزة المتوسطة مع الحفاظ على أداء قوي، مما يوازن بين إمكانية الوصول والقدرة
- مرخص بموجب Apache 2.0، مما يسمح بالاستخدام التجاري مع النسب المناسبة، مما يوفر مرونة للمطورين والأعمال
- تتطلب طبيعتها غير المصنفة اعت consideration دقيق لمحددات الأخلاقية وإمكانية تنفيذ الضوابط في بيئات الإنتاج
5. دولفين 2.9 لاما3 8B: الجوهرة الرائعة لنموذج LLM غير المصفاة
قم بتشغيله الآن باستخدام أو لاما. جربه، إنه مذهل:
ollama run dolphin-llama3
هذا النموذج غير المصنف بمقدار 8 مليار معامل يعتمد على بنية لاما 3. السمات الرئيسية:
- محسن من حيث الكفاءة والأداء على الأجهزة المستهلكة، مما يجعله متاحًا لمجموعة أكبر من المستخدمين والتطبيقات
- يحافظ على العديد من القدرات للنماذج الأكبر في تغليف أصغر بمقدار 8B، مما يقدم توازنًا جيدًا بين الأداء ومتطلبات الموارد
- متاح في إصدارات مع نوافذ سياق كل من 32K و 256K، مما يوفر مرونة لمختلف حالات الاستخدام ومتطلبات الذاكرة
- مناسب للنشر على الأنظمة ذات الموارد المحدودة، حيث يحتاج فقط إلى 4.7 جيجابايت من التخزين، مما يمكّن من الاستخدام على أجهزة الكمبيوتر المحمولة والخوادم الأصغر
- مدرب على مجموعة بيانات متنوعة للتعامل مع مجموعة واسعة من المهام بما في ذلك البرمجة والتحليل، مما يعزز تعدديته
- مصمم ليكون متوافقًا للغاية مع طلبات المستخدم، مما يستدعي الاستخدام الحذر وإمكانيات التحكم المحتملة لمنع الاستخدام غير الصحيح أو توليد محتوى ضار
- متوافق مع أدوات النشر الشعبية مثل Ollama لتسهيل التكامل في المشاريع، مما يبسط عملية التطوير
- تسمح طبيعتها غير المصنفة بمخرجات غير مقيدة، مما قد يتطلب تصفية محتوى إضافية أو إرشادات المستخدم في التطبيقات العملية
6. دولفين 2.9.3 يي 1.5 34B 32k GGUF
يجمع هذا النموذج غير المصنف بين بنية يي مع تحسينات. تشمل الميزات الرئيسية:
- 34 مليار معامل، يحقق توازنًا بين حجم النموذج والأداء، مناسب للمستخدمين الذين يتطلبون قدرات قوية دون متطلبات الموارد للنماذج الأكبر
- نافذة سياق 32k للتعامل مع مستندات ومحادثات أطول، مما يمكّن من تحليل نصوص واسعة مع الحفاظ على التماسك
- تنسيق GGUF للنشر الفعال وتقليل المساحة التخزينية، مما يحسن الأداء على مجموعة متنوعة من تكوينات الأجهزة
- محسن للاستخدام مع أطر استدلال مفتوحة المصدر الشهيرة، مما يسهل التكامل في أنظمة الذكاء الاصطناعي الحالية والمشاريع
- مصمم للحفاظ على أداء عالي مع أن يكون أكثر وصولًا من النماذج الأكبر، مما يجعله مناسبًا للنشر على الأجهزة المتوسطة الراقية أو مثيلات السحابة
- مناسب لمجموعة واسعة من التطبيقات بما في ذلك توليد النص، التحليل، ومهام البرمجة، مما يوفر تعددية للمطورين والباحثين
- يتطلب اعتبارًا دقيقًا للتداعيات الأخلاقية بسبب طبيعته غير المصنفة، مما يستوجب تنفيذ سياسات للاستخدام وآليات تصفية المحتوى بطريقة مدروسة
- قد يوفر تسوية جيدة بين قدرات النماذج الأكبر وفاعلية الموارد للنماذج الأصغر، مما يجعله جذابًا للمنظمات التي لديها موارد حسابية معتدلة
6. GPT-4-x-Vicuna
GPT-4-x-Vicuna هو إصدار غير مصفاة من نموذج GPT-4 الشهير، تم ضبطه لإزالة فلاتر المحتوى. يُعرف هذا النموذج بأدائه العالي في توليد نصوص مشابهة للبشر وقدرته على التعامل مع استفسارات معقدة دون قيود.
الميزات الرئيسية
- امتثال عالي: تم تصميم النموذج للامتثال لأي طلب، مما يجعله شديد التعدد.
- فهم لغوي متقدم: يتفوق في فهم وتوليد نصوص معقدة، مما يجعله مناسبًا لمجموعة واسعة من التطبيقات.
7. نحن-هيرمس-لاما2
نحن-هيرمس-لاما2 هو نموذج LLM آخر غير مصفاة اكتسب شعبية لأدائه القوي ومرونته. يستند إلى بنية لاما2 وتم ضبطه للعمل دون فلاتر المحتوى.
الميزات الرئيسية
- أداء قوي: يؤدي النموذج جيدًا عبر مختلف المهام، من الكتابة الإبداعية إلى الوثائق الفنية.
- نشر مرن: يمكن نشره على منصات مختلفة، مما يجعله متاحًا لمجموعة متنوعة من حالات الاستخدام.
8. ميثوماكس
ميثوماكس هو نموذج LLM غير مصفاة معروف بقدراته الإبداعية. يحظى بشعبية خاصة بين المستخدمين الذين يحتاجون إلى نموذج يمكنه توليد محتوى تخيلي وغير مقيد.
الميزات الرئيسية
- مخرجات إبداعية: يتفوق النموذج في توليد نصوص إبداعية وتخيلية، مما يجعله مثاليًا للكتّاب ومنشئي المحتوى.
- مرونة عالية: يمكنه التعامل مع مجموعة واسعة من العروض دون قيود، مما يوفر للمستخدمين أداة متعددة الاستخدامات لمجموعة متنوعة من التطبيقات.
9. أيروبوروس-30B
أيروبوروس-30B هو نموذج LLM قوي غير مصفاة يقدم أداء عالي وامتثال قوي. تم تصميمه للتعامل مع استفسارات معقدة وتوليد ردود تفصيلية دون فلاتر محتوى.
الميزات الرئيسية
- أداء عالي: النموذج قادر على التعامل مع استفسارات معقدة وتوليد ردود تفصيلية.
- مجموعة واسعة من التطبيقات: مناسب لمجموعة متنوعة من التطبيقات، من الوثائق الفنية إلى الكتابة الإبداعية.
هل تعمل نماذج LLM غير المصنفة فعلاً؟
بينما تقدم نماذج LLMs غير المصفاة مزايا كبيرة، فإنها تمثل أيضًا تحديات أخلاقية كبيرة. إن عدم وجود مراقبة للمحتوى يعني أن هذه النماذج يمكن أن تنتج محتوى ضار أو متحيز أو غير مناسب، مما يمكن أن يكون له عواقب قانونية وسمعة خطيرة.
نموذج LLMs غير مصفاة، لكنها قد لا تكون "مجانية"
- التحيز والعدالة: دون فلاتر المحتوى، فمن الضروري ألا تقدم نماذج LLMs الحقيقة بنسبة 100%. يمكن أن تستمر النماذج غير المصنفة في تعزيز وزيادة التحيزات الحالية الموجودة في بيانات التدريب. يمكن أن يؤدي ذلك إلى مخرجات غير عادلة وتمييزية.
- لا يزال يتعين عليك توجيه LLM، بشكل صحيح: توفير إرشادات واضحة وأمثلة عن الاستخدام المسؤول يمكن أن يساعد المستخدمين على التفاعل مع النموذج بأخلاقية. من الضروري تشجيع المستخدمين على تجنب العروض الخبيثة واستخدام النموذج لأغراض بناءة.
- يمكن أن يحسن التدريب الدقيق والتوجيه نماذج LLM غير المصنفة: يمكن أن يساعد ضبط النموذج باستخدام مجموعات بيانات إضافية وتوظيف تقنيات توجيه عند الاختبار في تعزيز التزامه بالإرشادات الأخلاقية. يمكن أن تساعد هذه الاستراتيجيات في تحسين موثوقية النموذج وسلامته.
استنتا جودة
تعد نماذج LLM غير المصنفة مثل دولفين 2.7 مكسطرال 8x7b تقدماً كبيرًا في تقنية الذكاء الاصطناعي، حيث تقدم قدرات قوية لمجموعة واسعة من التطبيقات. ومع ذلك، فإن إمكانياتها في إنتاج محتوى ضار تتطلب اعتبارات دقيقة واستخدامًا مسؤولاً. توفر منصات مثل Ollama واجهة قيمة للتفاعل مع هذه النماذج، ولكن يجب أن يظل المستخدمون يقظين ويتبنون استراتيجيات تخفيف مناسبة لضمان النشر الأخلاقي والآمن. مع استمرار تطور مجال الذكاء الاصطناعي، سيكون التوازن بين فوائد نماذج LLM غير المصنفة وضرورة الاحتياطات الأخلاقية أمرًا حاسمًا للاستفادة من كامل إمكاناتها.