مواصفات DapuStor J5060
| J5060 | |
|---|---|
| السعة (تيرابايت) | 61.44 |
| عامل الشكل | U.2 15 مم |
| الواجهة | PCIe 4.0 x4، NVMe 1.4a، دعم المنفذ المزدوج |
| عرض النطاق الترددي للقراءة/الكتابة (128 كيلوبايت) ميجابايت/ثانية | 7400 / 3000 |
| قراءة/كتابة عشوائية (4 كيلوبايت) ألف عملية إدخال/إخراج | 1500 / 30 (16 كيلوبايت) |
| كمون القراءة/الكتابة العشوائي 4 كيلوبايت (نموذجي) ميكروثانية | 105 (4 كيلوبايت) / 33 (16 كيلوبايت) |
| كمون القراءة/الكتابة التسلسلي 4 كيلوبايت (نموذجي) ميكروثانية | 7 (4 كيلوبايت) / 12 (16 كيلوبايت) |
| الطاقة النموذجية (واط) | 23 |
| طاقة الخمول (واط) | 5 |
| نوع الفلاش | 3D Enterprise QLC NAND Flash |
| القدرة على التحمل | 0.5 DWPD |
| متوسط الوقت بين الأعطال (MTBF) | 2 مليون ساعة |
| معدل خطأ غير قابل للتصحيح (UBER) | 1 قطاع لكل 10^17 بت مقروءة |
| الضمان | 5 سنوات |
أداء DapuStor J5060
نقاط الفحص
لتقييم أداء وحدة التخزين SSD من DapuStor J5060 في بيئات تدريب الذكاء الاصطناعي في العالم الحقيقي، استخدمنا أداة قياس الأداء Data and Learning Input/Output (DLIO). تم تطوير DLIO بواسطة مختبر أرجون الوطني، وهي مصممة خصيصًا لاختبار أنماط الإدخال/الإخراج في أعباء عمل التعلم العميق. إنها توفر رؤى حول كيفية تعامل أنظمة التخزين مع تحديات مثل نقاط الفحص، واستيعاب البيانات، وتدريب النماذج. يوضح الرسم البياني أدناه كيف تتعامل كلتا الوحدتين مع العملية عبر 99 نقطة فحص. عند تدريب نماذج التعلم الآلي، تعد نقاط الفحص ضرورية لحفظ حالة النموذج بشكل دوري، ومنع فقدان التقدم أثناء الانقطاعات أو انقطاع التيار الكهربائي. يتطلب هذا الطلب على التخزين أداءً قويًا، خاصة تحت أعباء العمل المستمرة أو المكثفة.
كانت المنصة المختارة لهذا العمل هي Dell PowerEdge R760 التي تعمل بنظام Ubuntu 22.04.02 LTS. استخدمنا الإصدار 2.0 من أداة قياس الأداء DLIO من إصدار 13 أغسطس 2024. تم تلخيص تكوين نظامنا أدناه:
- 2 × Intel Xeon Gold 6430 (32 نواة، 2.1 جيجاهرتز)
- 16 × 64 جيجابايت DDR5-4400
- 480 جيجابايت Dell BOSS SSD
- كابلات تسلسلية Gen5 JBOF
- 61.44 تيرابايت Dapustor J5060
- 61.44 تيرابايت Solidigm D5-P5336
لضمان أن يعكس قياس الأداء لدينا سيناريوهات العالم الحقيقي، استندنا في اختباراتنا إلى بنية نموذج LLAMA 3.1 405B. قمنا بتطبيق نقاط الفحص باستخدام torch.save() لالتقاط معلمات النموذج، وحالات المحسن، وحالات الطبقات. حاكى إعدادنا نظامًا بـ 8 وحدات معالجة رسومات، مع تطبيق استراتيجية توازي هجينة مع توازي رباعي في الموتر وتوازي خط أنابيب ثنائي عبر وحدات معالجة الرسومات الثماني. أسفر هذا التكوين عن أحجام نقاط فحص تبلغ 1636 جيجابايت، وهي تمثل متطلبات تدريب نماذج اللغة الكبيرة الحديثة.
بشكل عام، أظهرت Dapustor J5060 ثباتًا قويًا خلال المرحلة الأولية من الاختبار، مع أوقات تتراوح حول 575.66 ثانية لأول 33 نقطة فحص. تمكنت 5060J من الحفاظ على أداء أعلى قبل أن يتم ملء المحرك لأول مرة. من ناحية أخرى، أظهرت Solidigm P5336، على الرغم من أنها كانت أبطأ في البداية من J5060، أداءً ثابتًا مع استمرار الاختبار.
عند الأخذ في الاعتبار المتوسطات الإجمالية، سجلت Dapustor J5060 وقتًا قدره 769.44 ثانية، بينما أكملت Solidigm P5336 في 640.17 ثانية. هذا يضع Solidigm P5336 في المقدمة من حيث حفظ نقاط الفحص بشكل أسرع.
بشكل عام، تتعامل Dapustor J5060 مع العمليات القصيرة بشكل جيد ولكنها تواجه صعوبة في عمليات الكتابة المستمرة التي تتجاوز 30 دقيقة. في الوقت نفسه، تعد Solidigm P5336 هي الوحدة الأفضل للأداء الثابت طوال المهام المطولة. يتضح أداء الكتابة الأضعف هذا من Dapustor J5060 عندما يتدهور سرعة نقاط الفحص مع استمرار الاختبار.
تخزين GPU المباشر
تخزين GPU المباشر (GPU Direct Storage) هي تقنية تتيح نقل البيانات مباشرة بين أجهزة التخزين ووحدات معالجة الرسومات (GPUs)، متجاوزة وحدة المعالجة المركزية (CPU) وذاكرة النظام. في نقل البيانات التقليدي، يتم قراءة البيانات من التخزين إلى ذاكرة وحدة المعالجة المركزية ثم نسخها إلى ذاكرة وحدة معالجة الرسومات. تتضمن هذه العملية نسخ بيانات متعددة، مما يؤدي إلى زيادة الكمون وتقليل الأداء. تعمل وحدة المعالجة المركزية كعنق زجاجة، حيث تحتاج إلى التعامل مع نقل البيانات بين التخزين ووحدة معالجة الرسومات. يلغي GDS عنق الزجاجة هذا من خلال السماح لأجهزة التخزين بنقل البيانات مباشرة من وإلى ذاكرة وحدة معالجة الرسومات.
قمنا باختبار كل تركيبة من المعلمات التالية بشكل منهجي في كل من أعباء عمل القراءة والكتابة:
- أحجام الكتل: 1 ميجابايت، 128 كيلوبايت، 16 كيلوبايت
- عمق الإدخال/الإخراج: 128، 64، 32، 16، 8، 4، 1
بينما نراجع نتائج GDSIO الخاصة بنا، نفحص أداء القراءة والكتابة لوحدتي Dapustor J5060 و Solidigm P5336 بسعة 61.44 تيرابايت.
أداء القراءة التسلسلي GDSIO
تحقق Dapustor J5060 إنتاجية قراءة قصوى تبلغ 4.2 جيجابايت/ثانية بحجم كتلة 1 ميجابايت مع أعماق إدخال/إخراج تبلغ 64 و 128. عند أصغر حجم كتلة (16 كيلوبايت)، يتراوح الأداء من 0.1 جيجابايت/ثانية إلى 0.8 جيجابايت/ثانية مع زيادة عمق الإدخال/الإخراج. يوضح هذا تفضيلًا واضحًا لأحجام الكتل الأكبر مع أعماق الإدخال/الإخراج العالية لتحقيق أقصى إنتاجية. يتم تحقيق الأداء الأقصى عند أحجام الكتل الكبيرة، مما يشير إلى كفاءة المحرك في التعامل مع عمليات نقل البيانات المجمعة.
بالمقارنة، وصلت Solidigm P5336 إلى إنتاجية قصوى مماثلة تبلغ 4.3 جيجابايت/ثانية بنفس حجم الكتلة (1 ميجابايت) ولكنها حققت هذا الأداء في وقت سابق عند عمق إدخال/إخراج يبلغ 32 وحافظت عليه باستمرار عند أعماق إدخال/إخراج أعلى. يشير هذا إلى كفاءة أفضل قليلاً في التعامل مع أحجام الكتل الكبيرة في نطاق أوسع من أعماق الإدخال/الإخراج لـ Solidigm P5336.
لإعطاء عرض مقارنة أفضل، لدينا مخطط تفاضلي يقارن بين كلتا الوحدتين. يظهر ظل أخضر للمربع ميزة وحدة التخزين SSD من DapuStor، بينما يظهر مربع يتحرك إلى الجانب الأحمر من الطيف ضعفًا. هنا، تتفوق J5060 على P5336 في حجم الكتلة 128 كيلوبايت باستثناء أعماق الإدخال/الإخراج من 4 إلى 8. ومع ذلك، لوحظ انخفاض في الإنتاجية عند أعماق الإدخال/الإخراج الأعلى مع أحجام الكتل 16 كيلوبايت و 1 ميجابايت، مما يشير إلى كفاءة أقل في تلك السيناريوهات.
في مقارنة كمون القراءة التسلسلي، تحافظ Solidigm P5336 باستمرار على كمون أقل من Dapustor J5060 عبر جميع أحجام الكتل وأعماق الإدخال/الإخراج تقريبًا. عند حجم الكتلة 16 كيلوبايت، يصبح الفارق أكثر وضوحًا مع زيادة عمق الطابور: تصل J5060 إلى ذروتها عند 2329 ميكروثانية عند عمق 128، بينما تظل P5336 أقل عند 1365 ميكروثانية. عند 128 كيلوبايت، تتفوق Solidigm مرة أخرى عبر معظم الأعماق، باستثناء الأحمال العالية (4080 ميكروثانية على J5060 مقابل 5539 ميكروثانية على P5336) عند العمق 128. عند حجم الكتلة 1 ميجابايت، تواجه كلتا الوحدتين زيادة في الكمون كما هو متوقع، ولكن P5336 تظل تحت السيطرة بشكل أفضل قليلاً، مع 29138 ميكروثانية مقابل 29512 ميكروثانية عند أعلى عمق طابور.
أداء الكتابة التسلسلي GDSIO
تُظهر Dapustor J5060 إنتاجية كتابة ثابتة تتراوح بين 2.7 و 2.8 جيجابايت/ثانية لأحجام الكتل 128 كيلوبايت و 1 ميجابايت عبر جميع أعماق الإدخال/الإخراج (باستثناء 128 كيلوبايت، حجم إدخال/إخراج واحد، والذي سجل 2.2 جيجابايت/ثانية. بالنسبة لأحجام الكتل 16 كيلوبايت، يتراوح الأداء من 0.5 جيجابايت/ثانية إلى 1.4 جيجابايت/ثانية، اعتمادًا على عمق الإدخال/الإخراج، ويصل إلى ذروته عند 1.4 جيجابايت/ثانية عند أعماق الإدخال/الإخراج الأعلى.
في المقابل، تقدم Solidigm P5336 أداءً أفضل أثناء أحجام الكتل 128 كيلوبايت و 1 ميجابايت، وتصل إلى ذروتها عند 3.2 جيجابايت/ثانية. بالنسبة لأحجام الكتل الأصغر (16 كيلوبايت)، تُظهر Solidigm P5336 أيضًا أداءً أعلى، وتصل إلى ذروة 1.4 جيجابايت/ثانية عند أعماق الإدخال/الإخراج من 16 إلى 64. يشير هذا إلى أن Solidigm P5336 أكثر كفاءة قليلاً مع أحجام الكتل الأصغر أثناء عمليات الكتابة.
بالانتقال إلى عرض تفاضلي، نرى فجوة أكبر تتسع بين Dapustor J5060 وأداء الكتابة لـ Solidigm P5336. تُظهر مقارنة الإنتاجية لدينا أن J5060 تتخلف عن P5336 في معظم المجالات، خاصة مع أحجام الكتل الكبيرة (1 ميجابايت) عبر جميع أعماق الإدخال/الإخراج. تصل انخفاضات الإنتاجية إلى -0.5 جيجابايت/ثانية عند أعماق الإدخال/الإخراج 4. في حين أن هناك مكاسب في الأداء عند أعماق الإدخال/الإخراج الأعلى مع أحجام الكتل 128 كيلوبايت، إلا أنها ليست كبيرة بما يكفي لتعويض الأداء المنخفض الأوسع.
عند مقارنة كمون الكتابة التسلسلي بين Dapustor J5060 و Solidigm P5336، تُظهر كلتا الوحدتين سلوكًا مشابهًا عند أحجام الكتل الأصغر مثل 16 كيلوبايت، مع تفوق Solidigm بشكل طفيف عند أعماق الإدخال/الإخراج المنخفضة، بينما تقلل Dapustor الفجوة عند الأعماق الأعلى (64 و 128). عند أحجام الكتل 128 كيلوبايت، تتفوق Solidigm مرة أخرى عند أعماق الطابور الضحلة، ولكن Dapustor توفر باستمرار كمونًا أقل مع زيادة عمق الإدخال/الإخراج، مما يشير إلى توسع أفضل تحت الحمل. ومع ذلك، مع أحجام الكتل 1 ميجابايت، تحتفظ Solidigm بميزة كمون واضحة عبر جميع أعماق الإدخال/الإخراج، وتُظهر أوقات استجابة أسرع بشكل كبير تحت أعباء عمل الكتابة التسلسلية الثقيلة. بشكل عام، تقدم Solidigm أداءً أكثر اتساقًا، بينما تكون قوة Dapustor أكثر وضوحًا عند الكتل متوسطة الحجم والطوابير الأعمق.
ملخص أعباء عمل FIO
Flexible I/O Tester (FIO) هي أداة قياس أداء قياسية في الصناعة تُستخدم لقياس أداء أجهزة التخزين في مجموعة واسعة من سيناريوهات أعباء العمل. موثوق به لتنوعه وموثوقيته، يحاكي FIO الظروف الواقعية، ويوفر رؤى حول قدرات وحدات التخزين SSD وحدود أدائها. تستفيد StorageReview من FIO لتقديم تحليلات شاملة، وقياس الإنتاجية، والكمون، وعمليات الإدخال/الإخراج عبر أنماط أعباء العمل، وأحجام الكتل، وأعماق الطوابير.
أعباء العمل المطبقة:
- قراءة وكتابة تسلسلية 128 كيلوبايت
- قراءات وكتابات عشوائية 64 كيلوبايت
- قراءات وكتابات عشوائية 16 كيلوبايت
- قراءات وكتابات عشوائية 4 كيلوبايت
تمثل أعباء العمل هذه طيفًا واسعًا من حالات استخدام المؤسسات، بما في ذلك عمليات نقل تسلسلية كبيرة، والإدخال/الإخراج العشوائي المكثف النموذجي لقواعد البيانات، وعمليات الوصول العشوائي للكتل الصغيرة الشائعة في البيئات الافتراضية.
يلخص قسم الأداء هذا أداء Dapustor J5060 عبر أعباء العمل الاصطناعية الرئيسية، بما في ذلك عمليات القراءة/الكتابة التسلسلية والعشوائية بأحجام كتل وأعماق طوابير مختلفة. يتم استخراج المقاييس مباشرة من مخرجات fio المحللة وتشمل عرض النطاق الترددي (ميجابايت/ثانية)، وعمليات الإدخال/الإخراج، وشرائح الكمون حتى 99.9999٪، مما يوفر رؤى حول كل من الإنتاجية وسلوك الذيل تحت الحمل.
أداء القراءة والكتابة التسلسلي 128 كيلوبايت
| المحرك | الخيط/عمق الإدخال/الإخراج | عرض النطاق الترددي (ميجابايت/ثانية) | عمليات الإدخال/الإخراج | 99.0% | 99.9% | 99.99% |
|---|---|---|---|---|---|---|
| قراءة Dapustor J5060 | 1T/64Q | 7,482 | 57,081 | 1.66 مللي ثانية | 2.02 مللي ثانية | 2.83 مللي ثانية |
| قراءة Solidigm P5336 | 1T/64Q | 7,479 | 57,057 | 1.51 مللي ثانية | 1.66 مللي ثانية | 1.81 مللي ثانية |
| كتابة Dapustor J5060 | 1T/16Q | 3,023 | 23,063 | 0.69 مللي ثانية | 0.69 مللي ثانية | 0.70 مللي ثانية |
| كتابة Solidigm P5336 | 1T/16Q | 3,364 | 25,669 | 2.67 مللي ثانية | 3.48 مللي ثانية | 4.42 مللي ثانية |
تقدم Dapustor J5060 أداء قراءة تسلسلي مثير للإعجاب عند 128 كيلوبايت، وتصل إلى 7.48 جيجابايت/ثانية مع تحكم صارم في الكمون، حتى عند الشرائح الأعلى. مقارنة بـ Solidigm P5336، فإن إنتاجية J5060 متطابقة تقريبًا (7.48 جيجابايت/ثانية مقابل 7.47 جيجابايت/ثانية). ومع ذلك، تحتفظ Solidigm بأفضلية طفيفة في اتساق الكمون، وتُظهر كمون ذيل أقل هامشيًا.
عند كتابة تسلسلية بدقة 128 كيلوبايت (QD16)، تحقق J5060 أداءً قويًا يبلغ 3023 ميجابايت/ثانية مع كمون منخفض جدًا. ومع ذلك، تتفوق Solidigm P5336 على هذا بفارق معتدل، وتصل إلى 3364 ميجابايت/ثانية، على الرغم من أنها عند كمون أعلى بشكل ملحوظ، خاصة عند شريحة 99.99٪ (4.42 مللي ثانية مقابل 0.70 مللي ثانية منخفضة بشكل ملحوظ لـ Dapustor). يشير هذا إلى أن J5060 مرشح أقوى لسيناريوهات الكتابة التسلسلية الحساسة للكمون.
أداء القراءة والكتابة العشوائية 64 كيلوبايت
| المحرك | عمق الإدخال/الإخراج | عرض النطاق الترددي (ميجابايت/ثانية) | عمليات الإدخال/الإخراج | 99.0% | 99.9% | 99.99% |
|---|---|---|---|---|---|---|
| قراءة Dapustor J5060 | 8T/32Q | 7,475 | 114,058 | 20.05 مللي ثانية | 21.89 مللي ثانية | 25.82 مللي ثانية |
| قراءة Solidigm P5336 | 8T/32Q | 7,472 | 114,014 | 21.36 مللي ثانية | 21.89 مللي ثانية | 22.68 مللي ثانية |
| كتابة Dapustor J5060 | 8T/32Q | 534 | 8,151 | 574.6 مللي ثانية | 708.8 مللي ثانية | 742.39 مللي ثانية |
| كتابة Solidigm P5336 | 8T/32Q | 857 | 13,070 | 196.1 مللي ثانية | 208.6 مللي ثانية | 221.24 مللي ثانية |
في قراءات عشوائية بدقة 64 كيلوبايت (QD256)، تتفوق Dapustor J5060 بإنتاجية تقارب 7.4 جيجابايت/ثانية وكمون مُتحكم فيه جيدًا. تتطابق نتائج Solidigm بشكل وثيق (7.47 جيجابايت/ثانية)، مع كمون أقصى أفضل قليلاً. كلتا الوحدتين تقدمان أداءً استثنائيًا هنا، مع اختلافات عملية ضئيلة.
أداء الكتابة عند 64 كيلوبايت عشوائيًا هو المكان الذي تواجه فيه J5060 صعوبة ملحوظة، مع انخفاض الإنتاجية بشكل حاد إلى 534 ميجابايت/ثانية وزيادة الكمون بشكل كبير (742.39 مللي ثانية عند 99.99٪). في المقابل، تتفوق Solidigm P5336 بشكل كبير على J5060، حيث تقدم 857 ميجابايت/ثانية وكمون أقل بكثير (221.24 مللي ثانية عند نفس الشريحة)، مما يجعلها مناسبة بشكل أفضل للتطبيقات الحساسة للكمون وإنتاجية الكتابة المستمرة.
أداء القراءة والكتابة العشوائية 16 كيلوبايت
| المحرك | عمق الإدخال/الإخراج | عرض النطاق الترددي (ميجابايت/ثانية) | عمليات الإدخال/الإخراج | 99.0% | 99.9% | 99.99% |
|---|---|---|---|---|---|---|
| قراءة Dapustor J5060 | 8T/32Q | 7,430 | 453,461 | 5.28 مللي ثانية | 6.39 مللي ثانية | 8.16 مللي ثانية |
| قراءة Solidigm P5336 | 8T/32Q | 7,431 | 453,527 | 5.01 مللي ثانية | 5.21 مللي ثانية | 5.47 مللي ثانية |
| كتابة Dapustor J5060 | 8T/32Q | 531 | 32,404 | 143.65 مللي ثانية | 149.94 مللي ثانية | 181.40 مللي ثانية |
| كتابة Solidigm P5336 | 8T/32Q | 847 | 51,724 | 57.9 مللي ثانية | 65.8 مللي ثانية | 71.8 مللي ثانية |
عند عبء عمل القراءة العشوائية بدقة 16 كيلوبايت (QD256)، تحقق Dapustor نتائج ممتازة بـ 453 ألف عملية إدخال/إخراج وكمون مُتحكم فيه. تعكس Solidigm P5336 هذا الأداء بشكل أساسي، وتتفوق قليلاً على Dapustor في الكمون (5.47 مللي ثانية مقابل 8.16 مللي ثانية عند 99.99٪)، مما يشير إلى اتساق كمون أفضل قليلاً لـ Solidigm في سيناريوهات القراءة العشوائية المكثفة.
ينخفض أداء الكتابة العشوائية بدقة 16 كيلوبايت لوحدة التخزين SSD من DapuStor بشكل كبير إلى 32 ألف عملية إدخال/إخراج، ويزداد الكمون إلى 181.4 مللي ثانية (99.99٪). هنا مرة أخرى، تتفوق Solidigm بشكل كبير على وحدة DapuStor، حيث تقدم 51.7 ألف عملية إدخال/إخراج وملف كمون مُحسّن بشكل كبير (71.8 مللي ثانية عند 99.99٪)، مما يؤكد تفوق Solidigm لأعباء عمل الكتابة العشوائية الحساسة للكمون.
شركة بكين تشيانشينغ جييتونغ للتكنولوجيا المحدودة
ساندي يانغ/مدير الاستراتيجية العالمية
واتساب / وي شات: +86 13426366826
البريد الإلكتروني: yangyd@qianxingdata.com
الموقع الإلكتروني: www.qianxingdata.com/www.storagesserver.com
التركيز التجاري:
توزيع منتجات تكنولوجيا المعلومات والاتصالات / تكامل الأنظمة والخدمات / حلول البنية التحتية
مع أكثر من 20 عامًا من الخبرة في توزيع تكنولوجيا المعلومات، نتعاون مع العلامات التجارية العالمية الرائدة لتقديم منتجات موثوقة وخدمات احترافية.
"استخدام التكنولوجيا لبناء عالم ذكي" مقدم الخدمة الموثوق به لمنتجات تكنولوجيا المعلومات والاتصالات!



