منزل القضايا

تحجيم نقاط فحص الذكاء الاصطناعي: تأثير أقراص SSD عالية السعة على تدريب النماذج

جميع المنتجات

خادم تخزين الرف
(179)

خادم هواوي فيوجن
(31)

خادم Dell Powerge
(59)

خادم H3C
(31)

مفاتيح داتاكوم
(96)

جهاز WLAN
(21)

راوتر لاسلكي ذكي
(17)

القرص الصلب HDD
(78)

القرص الصلب الداخلي SSD
(16)

بطاقة رسومات Geforce
(27)

معالج INTEL CPU
(20)

ذاكرة الخادم RAM
(6)

خادم تخزين مجدد
(6)

وحدة الإرسال والاستقبال SFP
(4)

تبديل قناة الألياف
(125)

شهادة

الصين Beijing Qianxing Jietong Technology Co., Ltd. الشهادات

زبون مراجعة

موظفو المبيعات في Beijing Qianxing Jietong Technology Co. ، Ltd محترفون وصبورون للغاية. يمكنهم تقديم الاقتباسات بسرعة. كما أن جودة المنتجات وتعبئتها جيدة جدًا. تعاوننا سلس للغاية.

—— 《Festfing DV LLC

عندما كنت أبحث عن وحدة المعالجة المركزية Intel CPU و Toshiba SSD بشكل عاجل ، أعطتني Sandy من Beijing Qianxing Jietong Technology Co.، Ltd الكثير من المساعدة وحصلت على المنتجات التي أحتاجها بسرعة. أنا حقا أقدرها.

—— كيتي ين

ساندي من بكين Qianxing Jietong Technology Co. ، Ltd هو بائع دقيق للغاية ، يمكنه تذكيرني بأخطاء التكوين في الوقت المناسب عندما أشتري خادمًا. المهندسون محترفون للغاية ويمكنهم إكمال عملية الاختبار بسرعة.

—— ستريلكين ميخائيل فلاديميروفيتش

نحن سعداء جدًا بتجربتنا في العمل مع شركة بكين تشيانشينغ جيتونغ. جودة المنتج ممتازة، والتسليم دائمًا في الموعد المحدد. فريق المبيعات لديهم محترف، صبور، ومفيد جدًا في الإجابة على جميع أسئلتنا. نحن نقدر حقًا دعمهم ونتطلع إلى شراكة طويلة الأمد. موصى به بشدة!

—— أحمد نافيد

الجودة: تجربة رائعة مع موردي. كانت ميكروتيك RB3011 مستخدمة بالفعل، لكنها كانت في حالة جيدة جدا وكل شيء يعمل بشكل مثالي. التواصل كان سريعا وسلاسة،وكل مخاوفي تمت معالجتها بسرعةمُزود موثوق به جداً

—— جيران كوليسيو

ابن دردش الآن

تحجيم نقاط فحص الذكاء الاصطناعي: تأثير أقراص SSD عالية السعة على تدريب النماذج

March 13, 2026

يعد حفظ نقاط الفحص أمرًا ضروريًا لتدريب نماذج الذكاء الاصطناعي، حيث يضمن المرونة والكفاءة التشغيلية والقدرة على استئناف التدريب أو ضبطه من حالات محفوظة. ومع ذلك، فإن متطلبات أعباء عمل الذكاء الاصطناعي الحديثة - التي تتميز بنماذج معقدة بشكل متزايد ومجموعات بيانات تدريب واسعة - تدفع أنظمة التخزين إلى أقصى حدودها.

دور نقاط الفحص في سير عمل الذكاء الاصطناعي

يعد حفظ نقاط الفحص في تدريب الذكاء الاصطناعي عملية حيوية تتضمن حفظ الحالة الكاملة للنموذج بشكل دوري أثناء دورة تدريبه. تشمل هذه الحالة أوزان النموذج ومعاملاته، وحالات المحسن، وجداول معدل التعلم، وبيانات التعريف التدريبية. من خلال إنشاء لقطة شاملة لعملية التدريب على فترات زمنية محددة، يضمن حفظ نقاط الفحص استمرارية التدريب ويتيح الاسترداد في حالة حدوث انقطاعات.

عادةً ما يتم التقاط نقاط الفحص على فترات زمنية تعتمد على التكرار (على سبيل المثال، كل ألف خطوة تدريب). يعتمد تدريب نماذج اللغة الكبيرة (LLM) الحديثة - الذي يمكن أن يمتد لأسابيع أو حتى أشهر ويستهلك موارد حسابية هائلة - بشكل كبير على نقاط الفحص هذه كشبكة أمان ضد الأعطال المحتملة. على سبيل المثال، يمكن أن يؤدي تدريب نموذج من فئة GPT-4 إلى إنشاء نقاط فحص تتراوح من عدة مئات من الجيجابايت إلى عدة تيرابايت، اعتمادًا على حجم النموذج وتكوين التدريب.

عملية التدريب التي تم إنشاؤها بواسطة DALL-E

الغرض الأساسي من حفظ نقاط الفحص يتجاوز مجرد وظيفة النسخ الاحتياطي. إنه يعمل كآلية حاسمة لمرونة التدريب، مما يسمح باستئناف التدريب من آخر حالة محفوظة بدلاً من البدء من جديد في حالات فشل النظام أو انقطاع التيار الكهربائي أو مشكلات الأجهزة. بالإضافة إلى ذلك، تعد نقاط الفحص لا تقدر بثمن لتحليل النموذج: فهي تمكن الباحثين من فحص تطور النموذج في مراحل تدريب مختلفة وربما العودة إلى حالات سابقة إذا تم اكتشاف تدهور في الأداء.

من منظور التخزين، فإن أنماط الكتابة أثناء حفظ نقاط الفحص جديرة بالملاحظة بشكل خاص. عندما يتم تشغيل نقطة فحص، يجب على النظام كتابة كميات هائلة من البيانات بنمط انفجاري. هذا يخلق ملف تعريف I/O مميزًا: فترات من نشاط تخزين منخفض نسبيًا أثناء حسابات التدريب، تليها عمليات كتابة مكثفة وعالية النطاق الترددي أثناء حفظ نقاط الفحص. عادةً ما تكون عمليات الكتابة هذه متسلسلة ويمكن أن تستفيد بشكل كبير من أنظمة التخزين المحسّنة للكتابة المتسلسلة عالية النطاق الترددي.

يمكن أن يكون لاستراتيجيات التوازي المختلفة في التدريب الموزع تأثير كبير على سلوك حفظ نقاط الفحص. تؤثر هذه الاستراتيجيات على وقت حدوث حفظ نقاط الفحص أثناء التدريب والجزء الذي يتم حفظه من النموذج. في إعدادات التدريب الموزع الحديثة، قد تقوم وحدات معالجة الرسومات المتعددة بكتابة أجزاء مختلفة من نفس الطبقة في وقت واحد، مما يؤدي إلى إنشاء أنماط I/O معقدة. هذه القدرة على الكتابة المتوازية هي مفتاح الكفاءة ولكنها تتطلب تنسيقًا دقيقًا وأنظمة تخزين قوية يمكنها التعامل مع عمليات الكتابة المتزامنة مع الحفاظ على اتساق البيانات. يمكن أن يؤدي أي اختناق في هذه العملية إلى تأخيرات تدريب واسعة النطاق.

يمكن أن يؤدي حفظ نقاط الفحص البطيء إلى اختناقات تدريب كبيرة، حيث يجب أن تتوقف عملية التدريب بأكملها أثناء كتابة نقطة الفحص إلى التخزين. على سبيل المثال، في إعداد تدريب واسع النطاق، إذا استغرق حفظ نقطة الفحص 30 دقيقة كل بضع ساعات، فقد يؤدي ذلك إلى تراكم ساعات من وقت التوقف عن العمل على مدار فترة التدريب بأكملها. يؤثر هذا بشكل مباشر على كفاءة التدريب ويزيد من التكاليف التشغيلية - خاصة في البيئات السحابية حيث يتم فوترة موارد الحوسبة بالساعة.

يسمح حفظ نقاط الفحص الأسرع أيضًا للفرق بإنشاء نقاط فحص بشكل متكرر، مما يقلل من الحد الأقصى المحتمل لفقدان البيانات في حالة حدوث أعطال. هذا يتيح أساليب تدريب أكثر عدوانية ودورات تكرار تجريبية محسّنة. علاوة على ذلك، تسهل أوقات تحميل نقاط الفحص السريعة إجراء تجارب أسرع بتكوينات تدريب وهياكل نماذج مختلفة، حيث يمكن للباحثين استعادة الحالات السابقة بسهولة لاختبار أساليب بديلة.

تصبح قدرة نظام التخزين على التعامل بكفاءة مع عمليات نقاط الفحص هذه عاملاً محوريًا في البنية التحتية التدريبية الشاملة. يمكن لحلول التخزين عالية الأداء التي يمكنها إدارة كل من أنماط الكتابة الانفجارية لنقاط الفحص وعمليات القراءة/الكتابة المستمرة للتدريب أن تقلل بشكل كبير من الوقت والتكلفة الإجمالية لتدريب نماذج اللغة الكبيرة. وبالتالي، فإن خصائص أداء نظام التخزين الفرعي - لا سيما قدرته على التعامل مع الكتابة المتسلسلة الكبيرة والحفاظ على نطاق ترددي عالٍ ثابت - هي اعتبارات حاسمة عند تصميم البنية التحتية لتدريب نماذج LLM.

لهذا التقرير، سعينا إلى تقييم أداء SSD لحفظ نقاط فحص الذكاء الاصطناعي، وتقييم فوائد أحدث أقراص Gen5 SSD عندما تكون سرعة نقاط الفحص حرجة، مقارنة بأكبر أقراص QLC SSD في السوق - والتي يمكنها تخزين أعداد هائلة من نقاط الفحص إذا كان ذلك أكثر فائدة للنموذج الذي يتم تدريبه.

أداء نقاط الفحص - قياس الأداء باستخدام DLIO

لتقييم أداء Solidigm SSD في الوقت الفعلي في بيئات تدريب الذكاء الاصطناعي، استخدمنا أداة قياس الأداء Data and Learning Input/Output (DLIO). تم تطوير DLIO بواسطة Argonne National Laboratory، وهي مصممة خصيصًا لاختبار أنماط I/O في أعباء عمل التعلم العميق، مما يوفر رؤى حول كيفية تعامل أنظمة التخزين مع حفظ نقاط الفحص، واستيعاب البيانات، وتحديات تدريب النموذج.

باستخدام DLIO، سعينا إلى قياس إنتاجية محرك الأقراص وزمن الاستجابة والموثوقية في ظل سيناريوهات حفظ نقاط الفحص المكثفة. بينما تم إجراء هذا الاختبار على D5-P5336 بسعة 61.44 تيرابايت، تشير بيانات الأداء الأولية إلى أن Solidigm D5-P5336 بسعة 122 تيرابايت يوفر ملف تعريف أداء مشابهًا. قمنا أيضًا بتضمين نتائج من D7-PS1010 المستند إلى TLC لإظهار مزايا PCIe Gen5 في هذا الاختبار. اخترنا هذين المحركين لعرض كلا المنظورين لنقاط الفحص: أحدهما يركز على أسرع وقت ممكن لنقطة الفحص، والآخر على تخزين الحد الأقصى لعدد نقاط الفحص على SSD واحد.

تم اختيار المنصة لهذا العمل وهي Dell PowerEdge R760 التي تعمل بنظام Ubuntu 22.04.02 LTS. استخدمنا DLIO benchmark version 2.0 من الإصدار بتاريخ 13 أغسطس 2024. تم تلخيص تكوين نظامنا أدناه:

2 × Intel Xeon Gold 6430 (32 نواة، 2.1 جيجاهرتز)
16 × 64 جيجابايت DDR5-4400
480 جيجابايت Dell BOSS SSD
كابلات تسلسلية Gen5 JBOF
- 7.68 تيرابايت Solidigm D7-PS1010
- 61.44 تيرابايت Solidigm D5-P5336

لضمان أن قياسات الأداء لدينا تعكس سيناريوهات العالم الحقيقي، استندنا في اختباراتنا إلى بنية نموذج LLAMA 3.1 405B، وتنفيذ حفظ نقاط الفحص عبر torch.save() لالتقاط معلمات النموذج وحالات المحسن وحالات الطبقة. قامت إعداداتنا بمحاكاة نظام 8 وحدات معالجة رسومات، وتنفيذ استراتيجية توازي هجينة مع معالجة متوازية للنموذج رباعية ومعالجة خط أنابيب ثنائية موزعة عبر وحدات معالجة الرسومات الثماني. أسفر هذا التكوين عن أحجام نقاط فحص تبلغ 1636 جيجابايت، وهي تمثل متطلبات تدريب نماذج اللغة الكبيرة الحديثة.

تضمنت عملية الاختبار الخاصة بنا لعبء عمل نقاط فحص DLIO ملء كل محرك أقراص إلى مستوى استخدام مماثل. بالنسبة لـ Solidigm D5-P5336 بسعة 61.44 تيرابايت، تضمنت كل تمريرة 33 فترة نقطة فحص، بإجمالي 54 تيرابايت. استوعب D7-PS1010 الأصغر بسعة 7.68 تيرابايت بشكل مريح ثلاث فترات نقطة فحص، بإجمالي مساحة 4.9 تيرابايت. يمكن أن تتسع نقطة فحص إضافية في D7-PS1010، على الرغم من أنها رفعت مستوى استخدامه أعلى قليلاً مما أردنا.

أسفر عبء عمل نقاط فحص DLIO عن نتائج مثيرة للاهتمام عندما قارنا D5-P5336 بسعة 61.44 تيرابايت المستند إلى Gen4 QLC بـ D7-PS1010 المستند إلى Gen5 TLC بسعة 7.68 تيرابايت. خلال التمريرة الأولى، مع امتلاء محركات الأقراص، شهدنا فجوة أوسع في الأداء بين نموذجي SSD. أكمل PS1010 الأسرع من Gen5 كل نقطة فحص في المتوسط في 464 ثانية، مقارنة بـ 623 ثانية من P5336 من Gen4. في التمريرتين الثانية والثالثة، ضاقت الفجوة إلى 579 و 587 ثانية لـ PS1010 و 676 و 680 ثانية لـ P5336.

بالنسبة للشركات التي تتطلع إلى الحصول على أصغر فجوة ممكنة في فترات نقاط الفحص، يوفر PS1010 المستند إلى Gen5 TLC ميزة في أسرع وقت إنجاز. إذا كان الهدف هو الاحتفاظ بالعديد من نقاط الفحص بتكلفة فعالة، فيمكن لـ P5336 المستند إلى Gen4 QLC القيام بذلك. قمنا بقياس فرق في متوسط أوقات نقاط الفحص أقل من 17٪ بين كلا المحركين خلال التمريرتين الثانية والثالثة.

نطاق تخزين GPU Direct

بينما يوضح DLIO أداء الفلاش في سير عمل الذكاء الاصطناعي، فإن عبء العمل يعتمد بالكامل على الكتابة حتى يتم استعادة نقطة الفحص. لرسم صورة أكمل لـ Solidigm D7-PS1010 و D5-P5336 في أعباء عمل الذكاء الاصطناعي، قمنا بتضمين قياسات نطاق القراءة باستخدام GDSIO.

كيف يعمل تخزين GPU Direct

تقليديًا، عندما تقوم وحدة معالجة الرسومات بمعالجة البيانات المخزنة على محرك NVMe، يجب أن تنتقل البيانات أولاً عبر وحدة المعالجة المركزية والذاكرة النظامية قبل الوصول إلى وحدة معالجة الرسومات. تقدم هذه العملية اختناقات، حيث تصبح وحدة المعالجة المركزية وسيطًا، مما يضيف زمن استجابة ويستهلك موارد النظام القيمة. يلغي تخزين GPU Direct هذه عدم الكفاءة من خلال تمكين وحدة معالجة الرسومات من الوصول إلى البيانات مباشرة من جهاز التخزين عبر ناقل PCIe. يقلل هذا المسار المباشر من الحمل الزائد المرتبط بنقل البيانات، مما يسمح بنقل بيانات أسرع وأكثر كفاءة.

أعباء عمل الذكاء الاصطناعي، وخاصة تلك التي تتضمن التعلم العميق، كثيفة البيانات للغاية. يتطلب تدريب الشبكات العصبية الكبيرة معالجة تيرابايت من البيانات، وأي تأخير في نقل البيانات يمكن أن يؤدي إلى وحدات معالجة رسومات غير مستغلة وأوقات تدريب أطول. يعالج تخزين GPU Direct هذا التحدي من خلال ضمان تسليم البيانات إلى وحدة معالجة الرسومات بأسرع ما يمكن، مما يقلل من وقت الخمول ويزيد من الكفاءة الحسابية.

مثل اختبار DLIO، الهدف هو فهم وتوصيف الاختلافات بين أقراص Gen5 SSD عالية السرعة وأقراص QLC عالية السعة بشكل أفضل. ليست كل أعباء عمل الذكاء الاصطناعي متماثلة، وكل محرك أقراص يقدم مزايا مميزة، اعتمادًا على الحاجة.

مصفوفة تكوين الاختبار

اختبرنا بشكل منهجي كل تركيبة من المعلمات التالية مع NVIDIA L4 في منصة الاختبار الخاصة بنا:

أحجام الكتل: 1 ميجابايت، 128 كيلوبايت، 64 كيلوبايت، 16 كيلوبايت، 8 كيلوبايت
عدد الخيوط: 128، 64، 32، 16، 8، 4، 1
عدد المهام: 16
أحجام الدُفعات: 16

كان أول نظرة لنا على D5-P5336 المستند إلى QLC، والذي بلغ ذروته عند 4.2 جيجابايت/ثانية باستخدام حجم نقل 1 ميجابايت عند عمق I/O يبلغ 128. أدى تأثير أحجام الكتل إلى زيادة كبيرة في النطاق الترددي، بالانتقال من 8 كيلوبايت إلى 1 ميجابايت. بدأت ميزة زيادة عمق I/O في التراجع عند 32، حيث بدأت أعباء العمل في الاستقرار.

بعد ذلك، ننظر إلى PS-1010 من Gen5، والذي يمكن أن يصل إلى 6.2 جيجابايت/ثانية بحجم كتلة 1 ميجابايت وعمق I/O يبلغ 128. في المجمل، تفوق على P5336 المستند إلى Gen4، مع أعباء عمل معينة تظهر زيادة كبيرة. جاء مجال تحسين ملحوظ في حجم الكتلة 128 كيلوبايت، حيث عند عمق I/O يبلغ 64 و 128، قدم PS1010 ضعف نطاق القراءة الترددي لـ P5336.

من المهم ملاحظة أنه تم اختبار كلا SSD باستخدام NVIDIA L4. بينما يكون Gen4 D5-P5336 عند نهايته العليا أو بالقرب منها، أظهرت وحدات معالجة الرسومات NVIDIA العليا مثل H100 أداءً أعلى مع D7-PS1010. سرعة محرك الأقراص هي العامل الحاسم النهائي لبعض العملاء، بينما يعطي آخرون الأولوية للكثافة الإجمالية.Solidigmتوفر حلولاً لـكليهما، مع عروضها من أقراص QLC و TLC SSD.الخلاصة

مع استمرار تزايد حجم وتعقيد تدريب الذكاء الاصطناعي، يجب على البنية التحتية للتخزين الأساسية ليس فقط مواكبة ذلك، بل أيضًا تحديد الإيقاع. تسلط اختباراتنا مع اثنين من أقراص SSD المختلفة بشكل مميز الضوء على أهمية مواءمة حلول التخزين مع أولويات التدريب المحددة - سواء كان ذلك يعني تقليل زمن استجابة نقاط الفحص أو زيادة كثافة نقاط الفحص لتحقيق قابلية التوسع الفعالة من حيث التكلفة.

في تقييمنا، اختبرنا Solidigm D5-P5336 (61.44 تيرابايت) و D7-PS1010 (7.68 تيرابايت) في ظل ظروف تدريب الذكاء الاصطناعي الواقعية، مستفيدين من DLIO benchmark وسير عمل مكثف لنقاط فحص LLM الهجين المتوازي. التقطنا مقاييس تعكس أداء كتابة نقاط الفحص عبر عدة جولات اختبار مع امتلاء محركات الأقراص، مما يؤكد اختلافات الأداء في أوقات الإنجاز بين D5-P5336 المستند إلى Gen4 QLC و D7-PS1010 المستند إلى Gen5 TLC.

بينما قدم D7-PS1010 أسرع كتابات لنقاط الفحص الممكنة، أظهر D5-P5336 مزايا قوية في فعالية التكلفة والسعة، مع مقايضة أداء متواضعة فقط. فحصنا أيضًا نطاقات القراءة الترددية لتخزين GPU Direct (GDS) باستخدام GDSIO مع وحدة معالجة رسومات NVIDIA L4. أظهرت نتائجنا أن Solidigm D5-P5336 قدمت نطاق قراءة ترددي يصل إلى 4.2 جيجابايت/ثانية بحجم نقل 1 ميجابايت، بينما قدم D7-PS1010 زيادة كبيرة إلى 6.2 جيجابايت/ثانية. سيكون الأداء أكثر إثارة للإعجاب عند الاستفادة من وحدة معالجة رسومات أقوى، مثل NVIDIA L40s أو H100/H200.

بالنظر إلى المستقبل، فإن السعة غير المسبوقة لـ Solidigm D5-P5336 122TB SSD مهيأة لإعادة تشكيل تدريب ونشر الذكاء الاصطناعي. مع استمرار نمو أحجام النماذج ومتطلبات نقاط الفحص، تفتح محركات الأقراص عالية السعة هذه مستويات جديدة من الكفاءة والمرونة، مما يتيح استراتيجيات تدريب كانت غير قابلة للتحقيق سابقًا. تُمكّن ريادة Solidigm في حلول SSD عالية السعة المؤسسات من تخزين المزيد من البيانات ونقاط الفحص على عدد أقل من محركات الأقراص، مع المساعدة في تأمين بنيتها التحتية للمستقبل ضد الموجة التالية من تعقيد الذكاء الاصطناعي.

شركة بكين تشيانشينغ جييتونغ للتكنولوجيا المحدودة

ساندي يانغ / مدير الاستراتيجية العالمية
WhatsApp / WeChat: +86 13426366826
البريد الإلكتروني: yangyd@qianxingdata.com
الموقع الإلكتروني: www.qianxingdata.com/www.storagesserver.com
التركيز التجاري:

توزيع منتجات تكنولوجيا المعلومات والاتصالات / التكامل والخدمات / حلول البنية التحتية
مع أكثر من 20 عامًا من الخبرة في توزيع تكنولوجيا المعلومات، نتعاون مع العلامات التجارية العالمية الرائدة لتقديم منتجات موثوقة وخدمات احترافية.
"استخدام التكنولوجيا لبناء عالم ذكي" مقدم خدمة منتجات تكنولوجيا المعلومات والاتصالات الموثوق به!

PREV: الـ Micron 6550 ION SSD: أداء الجيل الخامس، كفاءة الطاقة، وسعة عالية في محرك واحد

NEXT: التبريد السائل قادم إلى مركز البيانات الخاص بك: Dell Tech World يسلط الضوء على الخيارات

تفاصيل الاتصال

Beijing Qianxing Jietong Technology Co., Ltd.

اتصل شخص: Ms. Sandy Yang

الهاتف :: 13426366826

تحجيم نقاط فحص الذكاء الاصطناعي: تأثير أقراص SSD عالية السعة على تدريب النماذج

خادم تخزين الرف

خادم هواوي فيوجن

خادم Dell Powerge

خادم H3C

مفاتيح داتاكوم

جهاز WLAN

راوتر لاسلكي ذكي

القرص الصلب HDD

القرص الصلب الداخلي SSD

بطاقة رسومات Geforce

معالج INTEL CPU

ذاكرة الخادم RAM

خادم تخزين مجدد

وحدة الإرسال والاستقبال SFP

تبديل قناة الألياف

تحجيم نقاط فحص الذكاء الاصطناعي: تأثير أقراص SSD عالية السعة على تدريب النماذج

نطاق تخزين GPU Direct

كيف يعمل تخزين GPU Direct

مصفوفة تكوين الاختبار

خادم تخزين الرف

12 فتحة 1U Rackmount Server Lenovo ThinkSystem SR630 Rack Server

ThinkSystem SR250 V2 4SFF Rack Storage Server معالج Intel Xeon E-2378G

خادم التخزين على حامل Intel C621A Inspur NF5180M6 1U Rack Mount Server

خادم هواوي فيوجن

FusionServer 5288 V6 4U Rack Server 32 DDR4 DIMMs 44 3.5 بوصة الأقراص الصلبة

خادم هواوي فيوجن سيرفر 1U عالي الكثافة للغاية 1288H V5

الجيل الجديد من OceanStor 5310 Huawei Rack Server Hybrid Flash Storage