logo
منزل القضايا

AMD Instinct MI355X يحقق مكاسب MLPerf Inference v6.0 بأكثر من مليون رمز في الثانية ويدعم ROC القابلة للتوسيع

شهادة
الصين Beijing Qianxing Jietong Technology Co., Ltd. الشهادات
الصين Beijing Qianxing Jietong Technology Co., Ltd. الشهادات
زبون مراجعة
موظفو المبيعات في Beijing Qianxing Jietong Technology Co. ، Ltd محترفون وصبورون للغاية. يمكنهم تقديم الاقتباسات بسرعة. كما أن جودة المنتجات وتعبئتها جيدة جدًا. تعاوننا سلس للغاية.

—— 《Festfing DV LLC

عندما كنت أبحث عن وحدة المعالجة المركزية Intel CPU و Toshiba SSD بشكل عاجل ، أعطتني Sandy من Beijing Qianxing Jietong Technology Co.، Ltd الكثير من المساعدة وحصلت على المنتجات التي أحتاجها بسرعة. أنا حقا أقدرها.

—— كيتي ين

ساندي من بكين Qianxing Jietong Technology Co. ، Ltd هو بائع دقيق للغاية ، يمكنه تذكيرني بأخطاء التكوين في الوقت المناسب عندما أشتري خادمًا. المهندسون محترفون للغاية ويمكنهم إكمال عملية الاختبار بسرعة.

—— ستريلكين ميخائيل فلاديميروفيتش

نحن سعداء جدًا بتجربتنا في العمل مع شركة بكين تشيانشينغ جيتونغ. جودة المنتج ممتازة، والتسليم دائمًا في الموعد المحدد. فريق المبيعات لديهم محترف، صبور، ومفيد جدًا في الإجابة على جميع أسئلتنا. نحن نقدر حقًا دعمهم ونتطلع إلى شراكة طويلة الأمد. موصى به بشدة!

—— أحمد نافيد

الجودة: تجربة رائعة مع موردي. كانت ميكروتيك RB3011 مستخدمة بالفعل، لكنها كانت في حالة جيدة جدا وكل شيء يعمل بشكل مثالي. التواصل كان سريعا وسلاسة،وكل مخاوفي تمت معالجتها بسرعةمُزود موثوق به جداً

—— جيران كوليسيو

ابن دردش الآن

AMD Instinct MI355X يحقق مكاسب MLPerf Inference v6.0 بأكثر من مليون رمز في الثانية ويدعم ROC القابلة للتوسيع

April 15, 2026
أعلنت AMD عن نتائج مقارنة MLPerf Inference v6.0، وتحديد موقع GPU Instinct MI355X كمنصة استنتاجية قابلة للتوسع للغاية قادرة على دعم عقدة واحدة، عدة عقدات،والتنفيذات المتباينةوبالإضافة إلى المكاسب الإضافية في الأداء، يقدم التقديم أحمال عمل جديدة، ويدل على إنتاجية على نطاق العنقود تتجاوز مليون رمز في الثانية،وتؤكد إمكانية تكرار الأداء المتسق عبر النظام البيئي للشركاء المتنامي.

CDNA 4 أهداف الهندسة المعمارية استنتاج الكفاءة العالية


تم بناء Instinct MI355X على بنية CDNA 4 من AMD ، مستفيدة من تصميم TSMC للعملية المزدوجة للشريحة: تستخدم محركات الحوسبة (XCDs) عقدة 3nm ، بينما تستخدم محركات الإدخال / الإخراج تقنية 6nm FinFET.تتضمن الحزمة متعددة الشرائح 185 مليار ترانزستور وتدعم تنسيقات البيانات FP4 و FP6تم تجهيز كل وحدة معالجة معالجة مع 288GB من ذاكرة HBM3E (توفير 8 TB / ثانية من نطاق النطاق الترددي للذاكرة) ، مما يتيح دعم نماذج تصل إلى 520 مليار معيار على جهاز واحد.تؤكد AMD أن هذا المزيج من كثافة الحوسبة وقدرة الذاكرة يلغي الحاجة إلى تقسيم نموذج مفرط، وهي ميزة رئيسية لحملات عمل استنتاج واسعة النطاق.

تتوفر المنصة في تكوينات UBB8 ، وتقدم خيارات تبريد الهواء والتبريد السائل المباشر ، بما يتماشى مع متطلبات نشر مراكز البيانات المتنوعة.يحتوي MI355X على 1400W TBP (طاقة التصميم الحراري) مع تبريد السائل، يوفر أداء أعلى من نظيره المبرد بالهواء، MI350X.

إنتاج الشبكات المتعددة يتجاوز مليون رمز في الثانية


الإنجاز البارز من جولة MLPerf v6.0 هو سعة مرور AMD على نطاق العنقود التي تتجاوز مليون رمز في الثانية. باستخدام وحدات معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجةلقد حققت شركة AMD هذا الإنجاز مع Llama 2 70B في كل من سيناريوهات الخادم والخارج، وكذلك مع GPT-OSS-120B في وضع غير متصل.

أحدث حالة شركة حول AMD Instinct MI355X يحقق مكاسب MLPerf Inference v6.0 بأكثر من مليون رمز في الثانية ويدعم ROC القابلة للتوسيع  0

AMD MLPerf 1M رموز لكل ثانية الرسومات

تعكس هذه النتائج تحولًا متزايدًا في الصناعة نحو تقييم أداء الاستدلال على مستوى المجموعة ، بدلاً من كل مسرع فردي.أصبح الإنتاج الإجمالي والوقت إلى الخدمة مقاييس أساسية لتحديد استعداد الإنتاج في عمليات نشر الذكاء الاصطناعي على نطاق واسع.

أظهرت AMD أيضًا كفاءة قياس استثنائية. بالنسبة لـ Llama 2 70B ، حقق تكوين 11 عقدة ، 87 GPU أكثر من مليون رمز في الثانية عبر سيناريوهات Offline ، Server ، و Interactive ،مع كفاءة تنامي تتراوح من 93% إلى 98%بالنسبة لـ GPT-OSS-120B ، توفر مجموعة من 12 عقدة ، 94GPU نطاقًا مماثلًا مع أكثر من 90٪ من كفاءة التوسيع ✓ إثبات الأداء بشكل فعال مع توسيع عمليات النشر إلى ما وراء نظام واحد.

المكاسب بين الأجيال والأداء التنافسي للعقدة الواحدة


أعلنت AMD عن تحسينات كبيرة بين الأجيال ، حيث قدم Instinct MI355X أداءً أفضل 3.1 مرة على Llama 2 70B Server مقارنةً بالجيل السابق من Instinct MI325X ، حيث وصل إلى 100 ،282 رمزاً في الثانيةهذا التحسن ينبع من كل من التحسينات المعمارية في CDNA 4 وتحسينات برنامج ROCm. تحسنت درجات Offline بنسبة 4.4x ودرجات Server بنسبة 4.8x مقارنة بجولات MLPerf السابقة ،مدفوعة في المقام الأول من قبل FP4 الكمية ‬ سمة رئيسية من MI355X التي تفتح عبء أعلى للعبء العامل للذكاء الاصطناعي.

نتائج استنتاج AMD مقابل الرسومات السابقة

في مقارنات العقدة الواحدة مع منصات NVIDIA ، أظهرت MI355X قدرة تنافسية قوية. على Llama 2 70B ، تطابق NVIDIA B200 في معدل الإنتاج غير المباشر ،تم تحقيق التكافؤ القريب في أداء الخادم، وتفوقها في الوضع التفاعلي. مقابل NVIDIA B300 ، قدم MI355X 92٪ من أداء Offline ، و 93٪ من أداء Server ، وتجاوزها بنسبة 4٪ في الوضع التفاعلي.الـ (إم آي 355 إكس) يوفر أيضاً كفاءة عالية من حيث التكلفة، وتقديم 40% أكثر من الرموز لكل دولار مقارنة مع NVIDIA B200.

تمكين النموذج لأول مرة يوسع التغطية


قدم MLPerf Inference v6.0 العديد من الأحمال العاملة الجديدة ، واستخدمت AMD هذه الجولة لعرض تمكين النموذج السريع. GPT-OSS-120B ، وهو نموذج مزيج من الخبراء ، قدم أول ظهور له في MLPerf مع MI355X ،تحقيق نتائج تنافسية مقابل أنظمة NVIDIA في كل من سيناريوهات Offline و Server.

قدمت AMD أيضًا نتائج لتوليد Wan-2.2 النص إلى الفيديو ، مما يمثل دخولها إلى استنتاج الفيديو متعدد الوسائط والتوليد. في حين ركز التقديم الرسمي على تأخير التدفق الواحدكانت النتائج على قدم المساواة مع المنصات القائمةتحسينات بعد الإرسال من الأداء، وتسليط الضوء على مجال لتحسين مع نضج كومة البرمجيات.

تؤكد هذه الإضافات التزام AMD بالانتشار إلى ما وراء معايير LLM التقليدية لدعم أحمال العمل الناشئة للذكاء الاصطناعي عبر حالات الاستخدام المتنوعة.

برنامج ROCm يمكّن من التوسع والاستنتاج المتباين


تعزز AMD الكثير من أداء MI355X و قابلية التوسع لمجموعة برامج ROCm الخاصة بها. تشمل التحسينات الرئيسية تنفيذ FP4 المحسّن ، وتحسين اتصالات GPU إلى GPU للاستنتاج الموزع ،ودعم توزيع حمولة العمل الديناميكية عبر البيئات غير المتجانسة.

AMD MLPerf نتائج استنتاج غريزة mI355x الرسومات
تم تطوير إرسال غير متجانس من قبل Dell و MangoBoost واستخدم ثلاثة نماذج GPU من AMD Instinct: MI300X و MI325X و MI355X.521 رمزاً في الثانية على خادم لاما 2 70B و 151،843 رمزاً في الثانية على "لاما 2 70 بي" غير متصلبينما كانت أنظمة MI300X و MI325X في كوريا، تظهر القدرة على تنسيق الأنظمة الموزعة عبر المواقع الجغرافية.

نمو النظام الإيكولوجي وإمكانية إعادة إنتاجه


توسعت منظومة شركاء AMD بشكل كبير في هذه الجولة MLPerf ، حيث قدمت تسع شركات نتائج عبر أجيال متعددة من Instinct GPU. تشمل الشركات المشاركة Cisco ، Dell ،الحوسبة الضخمة، HPE، MangoBoost، MiTAC، Oracle، Supermicro، و Red Hat، مما يعكس اعتماد صناعة واسعة من حلول استنتاج AMD.

تقديمات الشركاء متوافقة بشكل وثيق مع نتائج AMD الداخلية، عادة ما تكون ضمن نسبة 4% وفي بعض الحالات ضمن نسبة 1%.هذا التوافق يؤكد أن أداء MI355X يمكن إعادة إنتاجه عبر منصات OEM والسحابة، مما يقلل من مخاطر النشر ويزيد من الثقة في نتائج الأداء في العالم الحقيقي.

شركة بكين تشيانكسينغ جييتونغ للتكنولوجيا المحدودة
ساندي يانغ مدير الاستراتيجية العالمية
واتساب / ويتشات: +86 13426366826
البريد الإلكتروني: yangyd@qianxingdata.com
الموقع: www.qianxingdata.com/www.storagesserver.com
التركيز على الأعمال:
توزيع منتجات تكنولوجيا المعلومات والاتصالات / تكامل النظام والخدمات / حلول البنية التحتية
مع أكثر من 20 عامًا من الخبرة في توزيع تكنولوجيا المعلومات، نحن نتعاون مع العلامات التجارية العالمية الرائدة لتقديم منتجات موثوقة وخدمات مهنية.
استخدام التكنولوجيا لبناء عالم ذكي مزود خدمة منتجات تكنولوجيا المعلومات والاتصالات الموثوق به
تفاصيل الاتصال
Beijing Qianxing Jietong Technology Co., Ltd.

اتصل شخص: Ms. Sandy Yang

الهاتف :: 13426366826

إرسال استفسارك مباشرة لنا (0 / 3000)