DeepSeek تعلن عن نموذجها الجديد «V3.1» للاختبار.. ذكاء اصطناعي بكلفة أقل

أعلنت شركة DeepSeek عن إصدار محدث من نموذج الذكاء الاصطناعي V3 الخاص بها، والمسمى V3.1، وقالت إنه جاهز للاختبار.
وأضافت الشركة الناشئة في مجال الذكاء الاصطناعي، ومقرها هانغتشو، أن النموذج الجديد يتميز بفترة سياق أطول، مما يمكنه من معالجة المزيد من المعلومات في كل استعلام.
وفقا لموقع “tech in asia” التقني لم تفصح DeepSeek عن المزيد من التفاصيل التقنية، ولم تنشر بعد وثائق على منصات رئيسية مثل Hugging Face.
لفتت نماذج الشركة السابقة الانتباه لسرعتها وأدائها، منافسة شركات أمريكية مثل OpenAI.
تفوق نموذج R1 من DeepSeek، الذي أطلق في وقت سابق من هذا العام، على العديد من نماذج الذكاء الاصطناعي الغربية في الاختبارات المعيارية.
ولم تطلق الشركة نموذج R2 المنتظر بعد، حيث أشارت تقارير محلية إلى تأخيرات بسبب مشاكل تقنية ومعايير الرئيس التنفيذي ليانغ وينفنغ العالية.
يمثل نموذج تسعير DeepSeek تحولا جذريا في اقتصاديات الذكاء الاصطناعي، حيث تعمل R1 بما يقارب 5% من تكلفة سلسلة O1 من OpenAI.
تتجاوز هذه الميزة في التكلفة R1، حيث تشير التقارير إلى أن نماذج DeepSeek أرخص من عروض OpenAI في خط إنتاجها الثاني بما يتراوح بين 20 و50 مرة.
تنبع كفاءة التكلفة من أسلوب التدريب المبتكر R1-Zero، الذي يعتمد كليا على التعلم المعزز والاستدلال التسلسلي، مما قد يتطلب موارد حسابية أقل من الأساليب التقليدية.
يجبر هذا التغيير في التسعير الشركات الرائدة على إعادة النظر في هياكل تكلفتها، مع جعل قدرات الذكاء الاصطناعي المتقدمة في متناول الشركات الناشئة ذات الميزانية المحدودة ومبادرات البحث التي لم تكن قادرة سابقا على تحمل تكاليف النماذج المتميزة.
تسمح الطبيعة مفتوحة المصدر لنماذج DeepSeek للشركات بنشر حلول الذكاء الاصطناعي وتخصيصها دون تكبد التكاليف المتكررة المرتفعة المرتبطة بالمنصات الملكية 2.
تكشف صعوبات شركة DeepSeek مع نموذج R2 عن التحديات العملية لتبني التكنولوجيا محليا، على الرغم من الضغوط الحكومية.
واجهت الشركة صعوبات تقنية مستمرة مع شرائح Ascend من هواوي، مما أجبرها على اللجوء إلى أجهزة Nvidia للتدريب، بينما اقتصر استخدام شرائح هواوي على مهام الاستدلال.
ساهمت هذه النكسة في الأجهزة في تأجيل إطلاق R2، المقرر أصلا في مايو/أيار 2025، حيث أعرب الرئيس التنفيذي ليانغ وينفنغ عن عدم رضاه عن الأداء الحالي.
سمحت هذه التحديات التقنية لمنافسين، مثل Qwen3 من علي بابا، بالاستفادة من تأخيرات DeepSeek من خلال دمج خوارزميات تدريب مماثلة مع تحسين الكفاءة.
وتوضح تجربة DeepSeek كيف يمكن للتوترات بين الأهداف السياسية للاستقلال التكنولوجي ومتطلبات الأداء العملي أن تخلق تحديات تشغيلية كبيرة لشركات الذكاء الاصطناعي، حتى تلك التي تحقق الاعتراف الدولي.
aXA6IDQ1LjE0LjIyNS4xMCA= جزيرة ام اند امز