أصدرت AMD رسميًا Instinct MI350P، وهو مسرع PCIe جديد مصمم لمستخدمي المؤسسات الذين يبحثون عن استدلال الذكاء الاصطناعي الداخلي دون إجراء إصلاحات شاملة على البنية التحتية الحالية لمركز البيانات لديهم. تتميز بطاقة الرسومات هذه بفتحة مزدوجة وكاملة الارتفاع وعامل الشكل كامل الطول، وهي متوافقة تمامًا مع الخوادم التقليدية المبردة بالهواء. كما أنه يمثل الإصدار الأول من AMD لشريحة Instinct من الجيل الحالي المصممة لفتحات الخوادم القياسية منذ ما يقرب من أربع سنوات.
ايه ام دي غريزة MI350P
ظل خط إنتاج Instinct القائم على PCIe من AMD راكدًا بعد إطلاق MI210 في أوائل عام 2022. اعتمدت جميع الأجيال اللاحقة، بما في ذلك MI300X وMI325X وMI350X بتنسيق OAM، وحدات مقابس OAM مثبتة على لوحات أساسية عالمية مخصصة. تتطلب هذه الوحدات حاويات مخصصة مزودة بتوصيل قوي للطاقة وتدفق هواء لدعم ما يصل إلى ثمانية مسرعات من فئة 1000 واط في درج واحد. تناسب بنية الأجهزة هذه موفري الخدمات السحابية واسعة النطاق الذين يشترون رفوف وحدة معالجة الرسومات بكميات كبيرة، ومع ذلك فهي تفشل في استيعاب المؤسسات العادية غير الراغبة أو غير القادرة على نشر رفوف الذكاء الاصطناعي المخصصة لمهام الاستدلال في الموقع. يملأ MI350P هذه الفجوة في السوق بدقة. حاليًا، تفتقر NVIDIA إلى منافس PCIe متطور على مستوى الخادم في هذا القطاع، مما يترك AMD حصريًا مؤقتًا في السوق.
مقارنة الأجهزة: MI350P مقابل MI350X OAM
MI350P ليس نسخة مختصرة من MI350X؛ صممت AMD شريحة انسيابية مستقلة لهذا الطراز الجديد. يدمج جهاز MI350X قالبي إدخال/إخراج مقترنين بثمانية قوالب معقدة للتسريع (XCDs)، مما يوفر 256 وحدة حسابية إجمالاً. في المقابل، يحتوي جهاز MI350P على قالب إدخال/إخراج واحد وأربعة أقراص XCD، أي ما يعادل 128 وحدة حسابية. على الرغم من خفض مقياس السيليكون إلى النصف، إلا أنه يحافظ على تردد ساعة ذروة متطابق يبلغ 2.2 جيجا هرتز مثل نظيرته ذات المستوى الأعلى. يتبع تكوين الذاكرة نفس المواصفات التي تم تخفيضها: أربعة مكدسات HBM3E (مقابل ثمانية)، وناقل ذاكرة 4096 بت (أقل من 8192 بت)، إلى جانب سعة ذاكرة 144 جيجابايت وعرض نطاق ترددي 4 تيرابايت/ثانية، مقارنة بإنتاجية MI350X التي تبلغ 288 جيجابايت و8 تيرابايت/ثانية.
معمارية AMD Instinct MI350P
يتم أيضًا تقليل إنتاجية الحوسبة القصوى بمقدار النصف. يصل MI350P إلى 4600 MXFP4 TFLOPS مقابل 9.2 PFLOPS لـ MI350X، إلى جانب 2300 FP8 TFLOPS مقارنة بـ 4.6 PFLOPS للطراز المتميز. تتبع مقاييس الأداء لـ BF16 وFP16 ومعايير الدقة الأخرى نفس الانخفاض النسبي. والجدير بالذكر أن AMD نشرت بيانات الأداء المستدام في الذروة وفي العالم الحقيقي من أجل الشفافية. توفر البطاقة 2,299 TFLOPS ضمن MXFP4، و1,529 TFLOPS ضمن FP8، و713 TFLOPS ضمن BF16. تعكس هذه الأرقام العملية الإخراج الحقيقي ضمن غلاف طاقة بقدرة 600 واط، حيث تؤدي قيود الطاقة وقيود عرض النطاق الترددي للذاكرة حتماً إلى انخفاض الأداء النظري الأقصى.
قام فريق التحرير سابقًا بتقييم منصة MI350X عبر برنامج Jumpstart الخاص بشركة Supermicro وتعرف على قدراتها القوية في عبء العمل الاستدلالي. يتطلع الفريق إلى إجراء اختبار عملي لـ MI350P، وتحليل كيفية أداء مسرع عامل الشكل PCIe هذا داخل هيكل خادم السلع القياسي.
لا يتميز جهاز MI350P بخفض الطاقة بنسبة 50% على الرغم من مقياس السيليكون المخفض إلى النصف. إنه يحمل معدل طاقة 600 واط TBP، أي ما يعادل 60% تقريبًا من حد MI350X البالغ 1000 واط. تصل هذه القوة الكهربائية القصوى إلى الحد العلوي لمواصفات PCIe CEM، مما يؤدي إلى تشغيل البطاقة عند الحد الأقصى الحراري للفتحة. يتوفر وضع تشغيل مخفض بقدرة 450 واط للخوادم ذات التبريد غير الكافي، مصحوبًا بانقطاعات معتدلة في الأداء. من خلال وضعه في نفس شريحة الطاقة، يتنافس MI350P بشكل مباشر مع NVIDIA's H200 NVL وRTX Pro 6000 Server لشراء المؤسسات.
على عكس H200 من NVIDIA مع وصلات NVL4 عالية السرعة، فإن MI350P يعطل التعرض للنسيج اللامتناهي. يقتصر نقل البيانات بين وحدات معالجة الرسومات على نطاق ترددي يبلغ 128 جيجابايت/ثانية لـ PCIe Gen5 x16.
نشر ثماني وحدات معالجة الرسومات (GPU) المبردة بالهواء
وباعتبارها بطاقة FHFL PCIe قياسية ذات فتحة مزدوجة، فإن MI350P متوافقة مع خوادم المؤسسات الحالية. توفر الشركات المصنعة الأصلية الكبرى نماذج كثيفة مزودة بثمانية وحدات معالجة رسومات GPU، بما في ذلك Dell PowerEdge XE7740 الذي تمت مراجعته مسبقًا وHPE ProLiant DL380a Gen12. تم تحسين هذه المنصات لمسرعات بقدرة 600 واط، ولا تتطلب أي رفوف مخصصة أو تبريد سائل أو ألواح أساسية OAM.
يوفر تكوين MI350P المكون من ثماني بطاقات HBM3E سعة 1,152 جيجابايت وعرض نطاق ترددي إجمالي يبلغ 32 تيرابايت/ثانية، وهو ما يكفي لاستضافة نماذج تريليون معلمة بدقة MXFP4 داخل هيكل واحد يتم تبريده بالهواء. ومع ذلك، فإنه يضحي بأقمشة التحجيم المخصصة. في حين أن MI350X يستخدم Infinity Fabric للاتصال السريع بين الوحدات، فإن MI350P يعتمد فقط على PCIe Gen5. تناسب هذه البنية توازي الموتر المحلي للعقدة وتوازي البيانات عبر العقدة للاستدلال، في حين يظل MI350X القائم على OAM متفوقًا في مهام تدريب الذكاء الاصطناعي ذات النطاق الترددي المكثف.
تنسيقات دقيقة
يرث MI350P جميع التنسيقات الدقيقة من MI350X دون ترقيات. أصبحت أنواع توسيع نطاق OCP، بما في ذلك MXFP4 وMXFP6 وMXFP8، سائدة في تطوير نماذج الذكاء الاصطناعي، مما يتيح تدريبًا منخفض الدقة مع تدهور لا يُذكر في الجودة. يوفر MXFP4 ضعف سرعة FP8 وأربعة أضعاف إنتاجية BF16. تثبت حالات العالم الحقيقي مثل OpenAI gpt-oss وKimi K2.6 قيمة التكميم الأصلي للبت المنخفض. نظرًا لأن أوزان MXFP4 وINT4 تشغل 25% فقط من مساحة ذاكرة BF16، يمكن نشر نماذج تريليون معلمة داخل خادم واحد مزود بثمانية وحدات معالجة رسومات، مما يؤدي إلى التخلص من المجموعات المرهقة متعددة العقد للمؤسسات المحلية.
الخط السفلي
معظم مؤسسات الذكاء الاصطناعي المحلية مقيدة بالطاقة والتبريد والكثافة والميزانية بدلاً من القدرة الحاسوبية الأولية. يعمل جهاز MI350P المنسدل على تخفيف عوائق النشر هذه بشكل فعال. مع افتقار NVIDIA إلى وحدة معالجة الرسومات الرائدة لخادم PCIe في هذا القطاع، تحتفظ AMD بميزة تنافسية واضحة في الوقت الحالي. مزيد من التفاصيل متاحة على صفحة ويب Instinct الرسمية لشركة AMD.
شركة بكين تشيانشينغ جيتونغ للتكنولوجيا المحدودة
ساندي يانغ / مدير الإستراتيجية العالمية
واتساب/وي تشات: +86 13426366826
البريد الإلكتروني: yangyd@qianxingdata.com
الموقع الإلكتروني: www.qianxingdata.com/www.storagesserver.com
التركيز على الأعمال:
توزيع منتجات تكنولوجيا المعلومات والاتصالات / تكامل النظام والخدمات / حلول البنية التحتية
مع أكثر من 20 عامًا من الخبرة في توزيع تكنولوجيا المعلومات، نتعاون مع العلامات التجارية العالمية الرائدة لتقديم منتجات موثوقة وخدمات احترافية.
"استخدام التكنولوجيا لبناء عالم ذكي" مزود خدمة منتجات تكنولوجيا المعلومات والاتصالات الموثوق به!
ساندي يانغ / مدير الإستراتيجية العالمية
واتساب/وي تشات: +86 13426366826
البريد الإلكتروني: yangyd@qianxingdata.com
الموقع الإلكتروني: www.qianxingdata.com/www.storagesserver.com
التركيز على الأعمال:
توزيع منتجات تكنولوجيا المعلومات والاتصالات / تكامل النظام والخدمات / حلول البنية التحتية
مع أكثر من 20 عامًا من الخبرة في توزيع تكنولوجيا المعلومات، نتعاون مع العلامات التجارية العالمية الرائدة لتقديم منتجات موثوقة وخدمات احترافية.
"استخدام التكنولوجيا لبناء عالم ذكي" مزود خدمة منتجات تكنولوجيا المعلومات والاتصالات الموثوق به!



