ما هي مميزات وعيوب نموذج DeepSeek V3 الذكي؟ وما علاقة رقائق إنفيديا H800؟

كتبت – هاجر هشام

أحدثت شركة DeepSeek الصينية ضجة كبيرة في عالم التكنولوجيا بإطلاقها نموذج DeepSeek V3 الذكي، والذي أثبت تفوقاً ملحوظاً على منافسيه في مجال الذكاء الاصطناعي من أبرزها نموذج GPT-4 من OpenAI، دعونا نستكشف معكم في هذا التقرير مميزات نموذج DeepSeek V3 الجديد.

إطلاق نموذج DeepSeek V3 الذكي

أكدت نتائج اختبار Aider Polyglot، وهو اختبار متخصص في تقييم قدرة النماذج الذكية على كتابة الأكواد البرمجية، تفوق DeepSeek V3 بشكل كبير على منافسيه.

وتم تدريب DeepSeek V3 على قاعدة بيانات ضخمة تحتوي على تريليونات من الكلمات قد تصل إلى 12.8 تريليون توكن "وحدة تمثيل البيانات النصية"، وهذا ما يقارب من 9.6 مليون كلمة لكل مليون توكن.

وهذا أتاح له اكتساب فهم عميق للغة البشرية ومعالجتها بكفاءة عالية، لذلك تمكنت القاعدة البيانات الضخمة النموذج من التعلم من مجموعة واسعة من النصوص والموضوعات، مما زاد من تنوع قدراته.

كما يعتمد نموذج DeepSeek V3 الذكي على بنية معقدة تضم 685 مليار متغير، وهو ما يزيد بكثير عن عدد المتغيرات في نماذج أخرى مثل Llama 3.1 من ميتا الذي يحتوي على 405 مليار متغير، وبسبب هذا العدد الكبير من المتغيرات فإن DeepSeek V3 يمنح قدرة أكبر على التعلم والاستدلال.

تدريب DeepSeek V3 باستخدام رقائق إنفيديا H800

على الرغم من الحظر المفروض على رقائق إنفيديا H800، والتي تعتبر ضرورية لتدريب النماذج اللغوية الكبيرة، تمكنت شركة DeepSeek من تدريب نموذجها في غضون شهرين فقط، وبميزانية متواضعة قدرها 5.5 مليون دولار، وهذا يثبت قدرة الصين على تطوير تكنولوجيا الذكاء الاصطناعي بشكل سريع ومتواصل، حتى في ظل الضغوط الدولية.

مميزات نموذج DeepSeek V3 الذكي

تمكن DeepSeek V3 من تحقيق نتائج مبهرة في مجموعة واسعة من المهام، بما في ذلك:

كتابة الأكواد البرمجية: أظهر النموذج قدرة استثنائية على كتابة أكواد برمجية عالية الجودة وكفاءة، متفوقاً على نماذج أخرى رائدة مثل GPT-4 من OpenAI.
إنشاء النصوص: يمكن لـ DeepSeek V3 توليد نصوص إبداعية وم informative بأشكال مختلفة، مثل المقالات والقصص والشعر.
الترجمة الفورية: كما يتميز النموذج بقدرته على ترجمة النصوص بدقة وسرعة بين اللغات المختلفة.

عيوب استخدام نموذج DeepSeek V3 الذكي

رغم التقدم التقني الذي حققه DeepSeek V3، إلا أنه يواجه بعض الانتقادات بسبب وجود قيود على إجاباته، فإن النظام يرفض الإجابة على أسئلة حساسة مثل أحداث ميدان تيانانمين، وهو ما يعكس الرقابة الحكومية الصارمة على محتوى الإنترنت في الصين.

تبرر شركة DeepSeek هذه القيود بأنها تتبع توجيهات الحكومة الصينية، والتي تشدد على ضرورة أن تخضع جميع النماذج الذكية للاختبار والموافقة من قبل الجهات الحكومية المختصة، وتؤكد الشركة أن هذه الإجراءات تهدف إلى ضمان استخدام التكنولوجيا الذكية بشكل آمن ومسؤول.

في حين أظهرت اختبارات حديثة على النموذج اللغوي الكبير DeepSeek V3 مشكلة غريبة تتمثل في خلط النموذج بين هويته وهوية نماذج أخرى، فقد لاحظ العديد من المستخدمين أن النموذج يجيب أحيانًا على الأسئلة باعتباره ChatGPT، وهو أحد أشهر نماذج الذكاء الاصطناعي، بل ويعرض تفاصيل حول واجهة برمجة التطبيقات الخاصة بـ ChatGPT.

يعود سبب هذه المشكلة إلى أن نموذج DeepSeek V3 الذكي تم تدريبه على كم هائل من البيانات المتاحة على الإنترنت، والتي تتضمن معلومات عن العديد من النماذج اللغوية الكبيرة، بما في ذلك ChatGPT، وبالتالي، أصبح النموذج يخلط بين المعلومات التي تعلمها، مما يؤدي إلى ظهور مثل هذه الأخطاء.

كما تعتمد معظم النماذج اللغوية الكبيرة على البيانات المفتوحة المصدر المتاحة على الإنترنت، والتي قد تحتوي على معلومات غير دقيقة أو متناقضة، وهذا يزيد من صعوبة ضمان دقة وسلامة النتائج التي يقدمها النموذج.

لا يقتصر هذا النوع من المشاكل على DeepSeek V3 فقط، بل واجهته نماذج أخرى مثل Gemini من Google، والذي خلط في بعض الأحيان بين هويته وهوية نموذج Wenxinyiyan الخاص بشركة بايدو، وهذا يؤكد أن مشكلة الخلط بين الهويات هي تحدٍ شائع يواجه مطوري النماذج اللغوية الكبيرة.