دوت نت فور عرب

أخبار وتقنية وأكثر

الصين ديبسيك لديها بعض ادعاءات منظمة العفو الدولية الكبيرة ؛ ليس كل الخبراء مقتنعين
مال و أعمال

الصين ديبسيك لديها بعض ادعاءات منظمة العفو الدولية الكبيرة ؛ ليس كل الخبراء مقتنعين

[ad_1]

هزت شركة Deepseek ، شركة الذكاء الاصطناعي الصيني Deepseek ، الأسواق هذا الأسبوع ، حيث تتفوق مطالباتها على نموذج الذكاء الاصطناعي الجديد وتكلف جزءًا بسيطًا من السعر.

إن التأكيدات – على وجه التحديد أن نموذج اللغة الكبير لـ Deepseek يكلف 5.6 مليون دولار فقط لتدريب – أثارت مخاوف بشأن مبالغ تواتر العيان التي ينفقها عمالقة التكنولوجيا حاليًا على البنية التحتية الحاسوبية المطلوبة لتدريب أعباء العمل المتقدمة من الذكاء الاصطناعي.

لكن ليس الجميع مقتنعين بادعاءات ديبسيك.

طلبت CNBC خبراء الصناعة عن آرائهم حول Deepseek ، وكيف يقارن فعليًا بـ Openai ، منشئ Chatbot Viral ChatGpt الذي أثار ثورة الذكاء الاصطناعي.

ما هو ديبسيك؟

في الأسبوع الماضي ، أصدرت Deepseek R1 ، نموذج التفكير الجديد الذي ينافس Openai’s O1. نموذج التفكير هو نموذج لغة كبير يحطم يطالب بأسفل إلى قطع أصغر وينظر في مقاربات متعددة قبل إنشاء استجابة. إنه مصمم لمعالجة المشكلات المعقدة بطريقة مماثلة للبشر.

تأسست Deepseek في عام 2023 من قبل Liang Wenfeng ، المؤسس المشارك لصندوق التحوط الكمي الذي يركز على الذكاء الاصطناعى ، للتركيز على نماذج اللغة الكبيرة والوصول إلى الذكاء العام الاصطناعي ، أو AGI.

يشير Agi كمفهوم فضفاض إلى فكرة الذكاء الاصطناعي الذي يساوي أو يتجاوز الفكر الإنساني في مجموعة واسعة من المهام.

الكثير من التكنولوجيا وراء R1 ليست جديدة. ومع ذلك ، فإن ما يلفت الانتباه هو أن Deepseek هو أول من نشره في نموذج AI عالي الأداء مع “وفقًا للشركة-تخفيضات كبيرة في متطلبات الطاقة.

وقال Xiaomeng Lu ، مدير ممارسة التكنولوجيا الجيولوجية في Euroasia Group: “إن الوجبات الجاهزة هي أن هناك العديد من الاحتمالات لتطوير هذه الصناعة. إن الطريقة المكثفة للرقائق/رأس المال المتطورة هي طريقة تكنولوجية واحدة”.

“لكن Deepseek يثبت أننا ما زلنا في المرحلة الناشئة من تطوير الذكاء الاصطناعي وقد لا يكون المسار الذي وضعته Openai هو الطريق الوحيد إلى الذكاء الاصطناعي للغاية.”

كيف يختلف عن Openai؟

لدى Deepseek نظامين رئيسيين حصلوا على ضجة من مجتمع الذكاء الاصطناعى: V3 ، نموذج اللغة الكبير الذي يلف منتجاتها ، و R1 ، نموذج التفكير.

كلا النموذجين مفتوح المصدر ، مما يعني أن الكود الأساسي الخاص بهما مجاني ومتاح للجمهور للمطورين الآخرين لتخصيص وإعادة التوزيع.

نماذج Deepseek أصغر بكثير من العديد من نماذج اللغة الكبيرة الأخرى. V3 لديه ما مجموعه 671 مليار معلمة ، أو المتغيرات التي يتعلمها النموذج أثناء التدريب. وعلى الرغم من أن Openai لا يكشف عن المعلمات ، إلا أن الخبراء يقدرون أحدث نموذج له على الأقل تريليون.

فيما يتعلق بالأداء ، تقول Deepseek إن طراز R1 الخاص به يحقق أداءً مماثل لـ Openai’s O1 على مهام التفكير ، مشيرًا إلى معايير بما في ذلك AIME 2024 و Codeforces و GPQA Diamond و MATH-500 و MMLU و SWE-BENCE.

اقرأ المزيد من تغطية Deepseek

في تقرير فني ، قالت الشركة إن طراز V3 لديها تكلفة تدريب بقيمة 5.6 مليون دولار فقط – جزء صغير من مليارات الدولارات التي أنفقتها مختبرات AI الغربية البارزة مثل Openai والأنثروبري على تدريب وتشغيل نماذج AI التأسيسية. ليس من الواضح بعد مقدار تكاليف Deepseek التي يجب تشغيلها.

إذا كانت تكاليف التدريب دقيقة ، فهذا يعني أن النموذج قد تم تطويره على جزء صغير من تكلفة النماذج المنافسة بواسطة Openai ، الأنثروبور ، جوجل وغيرهم.

وقال دانييل نيومان ، الرئيس التنفيذي لشركة Tech Insight The Futurum Group ، إن هذه التطورات تشير إلى “اختراق هائل” ، على الرغم من أنه ألقى بعض الشكوك في الأرقام الدقيقة.

وقال “أعتقد أن اختراقات ديبسيك تشير إلى انعطاف ذي معنى لتوسيع القوانين وضرورة حقيقية”. “بعد قولي هذا ، لا يزال هناك الكثير من الأسئلة والشكوك حول الصورة الكاملة للتكاليف لأنها تتعلق بتطوير Deepseek.”

وفي الوقت نفسه ، أشار بول تريوليو ، نائب الرئيس الأول لسياسة الصين والتكنولوجيا في شركة DGA Group الاستشارية ، أنه كان من الصعب إجراء مقارنة مباشرة بين تكلفة نموذج Deepseek وتكلفة المطورين الأمريكيين الرئيسيين.

وقال “كان الرقم 5.6 مليون لـ Deepseek V3 فقط لشراء تدريب واحد ، وشددت الشركة على أن هذا لا يمثل التكلفة الإجمالية للبحث والتطوير لتطوير النموذج”. “التكلفة الإجمالية على الأرجح على الأرجح ، ولكن لا تزال أقل من المبلغ الذي تنفقه شركات AI الرئيسية الأمريكية.”

لم يكن Deepseek متاحًا على الفور للتعليق عند الاتصال به من قبل CNBC.

مقارنة Deepseek ، Openai على السعر

يكشف كل من Deepseek و Openai عن أسعار حسابات موديلاتهم على مواقع الويب الخاصة بهم.

يقول Deepseek إن R1 يكلف 55 سنتًا لكل مليون رموز من المدخلات – “الرموز” التي تشير إلى كل وحدة من النصوص التي تتم معالجتها بواسطة النموذج – و 2.19 دولار لكل مليون رموز من الإنتاج.

وبالمقارنة ، تُظهر صفحة التسعير الخاصة بـ Openai لـ O1 أن الشركة تتقاضى 15 دولارًا لكل مليون رموز إدخال و 60 دولارًا لكل مليون رموز إخراج. بالنسبة إلى GPT-4O Mini ، النموذج اللغوي الأصغر والمنخفض التكلفة في Openai ، تتقاضى الشركة 15 سنتًا لكل مليون رموز إدخال.

الشك على الرقائق

لقد أدى كشف Deepseek عن R1 بالفعل إلى نقاش عام ساخن حول صحة مطالبتها – ليس أقلها لأن نماذجها تم تصميمها على الرغم من ضوابط التصدير من الولايات المتحدة التي تقيد استخدام رقائق الذكاء الاصطناعى المتقدمة إلى الصين.

تدعي Deepseek أنها حققت اختراقها باستخدام مقاطع NVIDIA الناضجة ، بما في ذلك رقائق H800 و A100 ، والتي هي أقل تقدماً من H100s المتطورة في صانع الرقائق ، والتي لا يمكن تصديرها إلى الصين.

ومع ذلك ، في التعليقات على CNBC الأسبوع الماضي ، قال المدير التنفيذي لشركة Scale AI Alexandr Wang ، إنه يعتقد أن Deepseek استخدم الرقائق المحظورة – ادعية تنكر ديبسيك.

ريد هوفمان ، المؤسس المشارك لـ LinkedIn: Deepseek AI يثبت أن هذه الآن

منذ ذلك الحين خرجت Nvidia وقالت إن وحدات معالجة الرسومات التي استخدمها Deepseek كانت متوافقة تمامًا مع التصدير.

الصفقة الحقيقية أم لا؟

يبدو أن خبراء الصناعة يتفقون على نطاق واسع على أن ما حققه ديبسيك مثير للإعجاب ، على الرغم من أن البعض حث على الشكوك على بعض مطالبات الشركة الصينية.

“ديبسيك مثير للإعجاب بشكل شرعي ، لكن مستوى الهستيريا هو لائحة اتهام للكثيرين” ، كتب رجل الأعمال الأمريكي بالمر لوكي ، الذي أسس Oculus و Anduril على X.

“إن رقم 5 ملايين دولار هو زائف. يتم دفعه من قبل صندوق تحوط صيني لإبطاء الاستثمار في الشركات الناشئة الأمريكية ، وخدمة شورتاتهم ضد جبابرة أمريكية مثل NVIDIA ، وإخفاء التهرب من العقوبات”.

قال Seena Rejal ، كبير الموظفين التجاريين في NetMind ، وهي شركة ناشئة مقرها لندن والتي توفر إمكانية الوصول إلى نماذج Deepseek من الذكاء الاصطناعي عبر شبكة GPU الموزعة ، إنه لم ير أي سبب لعدم تصديق Deepseek.

وقال ريجال لـ CNBC في مقابلة عبر الهاتف في وقت سابق من هذا الأسبوع: “حتى لو تم إيقاف تشغيله بعامل معين ، فإنه لا يزال يأتي فعالًا إلى حد كبير”. “منطق ما شرحوه معقول للغاية.”

ومع ذلك ، فقد ادعى البعض أن تقنية Deepseek ربما لم يتم بناؤها من الصفر.

وقال فينود خوسلا من الملياردير على X ، دون إعطاء المزيد من التفاصيل: “يرتكب Deepseek نفس الأخطاء التي ترتكبها O1 ، وهو ما يشير إلى أن التكنولوجيا قد انفصلت”.

إنه مطالبة بأن Openai نفسها قد أشارت إليها ، حيث أخبرت CNBC في بيان يوم الأربعاء أنها تقوم بمراجعة التقارير التي قد يكون لها Deepseek “استخدام بيانات الإخراج بشكل غير لائق من نماذجها لتطوير نموذج الذكاء الاصطناعي الخاص بها ، وهي طريقة يشار إليها باسم” التقطير “.

وقال متحدث باسم Openai لـ CNBC “إننا نأخذ تدابير مضادة عدوانية واستباقية لحماية تقنيتنا وسنواصل العمل عن كثب مع حكومة الولايات المتحدة لحماية النماذج الأكثر قدرة التي يتم بناؤها هنا”.

سلعة الذكاء الاصطناعي

ومع ذلك ، فإن التدقيق المحيط بـ Deepseek يتفوق ، يتفق علماء الذكاء الاصطناعى على نطاق واسع على أنه يمثل خطوة إيجابية لهذه الصناعة.

يان ليكون ، كبير علماء الذكاء الاصطناعي في ميتاقال إن نجاح Deepseek يمثل انتصارًا لنماذج الذكاء الاصطناعى مفتوح المصدر ، وليس بالضرورة فوزًا للصين على التعريف الأمريكي هو وراء نموذج AI شهير مفتوح المصدر يسمى Llama.

“للأشخاص الذين يرون أداء Deepseek ويفكرون:” الصين تتفوق على الولايات المتحدة في الذكاء الاصطناعي “. أنت تقرأ هذا الخطأ.

“لقد استفاد Deepseek من الأبحاث المفتوحة والمصدر المفتوح (على سبيل المثال Pytorch و Llama من Meta). لقد توصلوا إلى أفكار جديدة وقاموا ببناءها على رأس عمل الآخرين. نظرًا لأن عملهم يتم نشره ومصدر مفتوح ، يمكن للجميع الاستفادة منها. هذه هي قوة البحث المفتوح والمصدر المفتوح. “

يشاهد: لماذا يضع Deepseek تقدم AI في أمريكا للخطر

لماذا تضع ديبسيك في الصين تقدم منظمة العفو الدولية في أمريكا للخطر

– ساهمت كاترينا بيشوب وهايدن فيلد في سي إن بي سي في هذا التقرير

[ad_2]

اترك ردا

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *