logo
منزل القضايا

جوجل تعلن عن TPU v8t Sunfish و TPU v8i Zebrafish

شهادة
الصين Beijing Qianxing Jietong Technology Co., Ltd. الشهادات
الصين Beijing Qianxing Jietong Technology Co., Ltd. الشهادات
زبون مراجعة
موظفو المبيعات في Beijing Qianxing Jietong Technology Co. ، Ltd محترفون وصبورون للغاية. يمكنهم تقديم الاقتباسات بسرعة. كما أن جودة المنتجات وتعبئتها جيدة جدًا. تعاوننا سلس للغاية.

—— 《Festfing DV LLC

عندما كنت أبحث عن وحدة المعالجة المركزية Intel CPU و Toshiba SSD بشكل عاجل ، أعطتني Sandy من Beijing Qianxing Jietong Technology Co.، Ltd الكثير من المساعدة وحصلت على المنتجات التي أحتاجها بسرعة. أنا حقا أقدرها.

—— كيتي ين

ساندي من بكين Qianxing Jietong Technology Co. ، Ltd هو بائع دقيق للغاية ، يمكنه تذكيرني بأخطاء التكوين في الوقت المناسب عندما أشتري خادمًا. المهندسون محترفون للغاية ويمكنهم إكمال عملية الاختبار بسرعة.

—— ستريلكين ميخائيل فلاديميروفيتش

نحن سعداء جدًا بتجربتنا في العمل مع شركة بكين تشيانشينغ جيتونغ. جودة المنتج ممتازة، والتسليم دائمًا في الموعد المحدد. فريق المبيعات لديهم محترف، صبور، ومفيد جدًا في الإجابة على جميع أسئلتنا. نحن نقدر حقًا دعمهم ونتطلع إلى شراكة طويلة الأمد. موصى به بشدة!

—— أحمد نافيد

الجودة: تجربة رائعة مع موردي. كانت ميكروتيك RB3011 مستخدمة بالفعل، لكنها كانت في حالة جيدة جدا وكل شيء يعمل بشكل مثالي. التواصل كان سريعا وسلاسة،وكل مخاوفي تمت معالجتها بسرعةمُزود موثوق به جداً

—— جيران كوليسيو

ابن دردش الآن

جوجل تعلن عن TPU v8t Sunfish و TPU v8i Zebrafish

May 11, 2026
في Google Cloud Next، كشفت Google عن الجيل الثامن من مسرعات الذكاء الاصطناعي: TPU v8t "Sunfish" للتدريب وTPU v8i "Zebrafish" للاستدلال، إلى جانب نسيج مركز بيانات Virgo الجديد. تم تصميم هذه الرقائق خصيصًا لعصر الذكاء الاصطناعي الوكيل، وتم تحسينها للتدريب على نماذج كبيرة من الخبراء (MoE) والرموز المميزة ذات زمن الاستجابة المنخفض التي تقدم بأسعار فعالة من حيث التكلفة. أثناء مشاركة نفس النظام الأساسي المضيف ونسيج التوصيل البيني، يختلف v8t وv8i في الذاكرة وSRAM والهيكل وتخصص الأجهزة.

أحدث حالة شركة حول جوجل تعلن عن TPU v8t Sunfish و TPU v8i Zebrafish  0

يدعم v8t superpod 9,600 شريحة مع 2 PB HBM ويوفر 121 EFLOPS من حساب FP4، أي ما يقرب من ثلاثة أضعاف أداء الجيل السابق من Ironwood. يتسع الطراز v8i إلى 1,152 شريحة مع 288 جيجابايت HBM و384 ميجابايت على الرقاقة SRAM، مما يوفر كفاءة أفضل بنسبة 80% في تكلفة الاستدلال مقارنة بـ Ironwood. يربط نسيج Virgo ما يزيد عن 134,000 شريحة v8t، مما يوفر عرض نطاق ترددي غير معطل يبلغ 47 Pb/s مع إنتاجية أعلى بمعدل 4 مرات لكل مسرع وزمن وصول أقل بنسبة 40%.

بنية TPU الأساسية مقابل GPU


وحدات TPU عبارة عن شرائح ASIC مخصصة تتميز بوحدات مضاعفة المصفوفة الكبيرة (MXUs) وذاكرة الوصول العشوائي (SRAM) المُدارة بواسطة البرامج والتجميع المسبق. على عكس الجدولة الديناميكية صغيرة النواة لوحدة معالجة الرسومات، تتميز وحدات TPU بتدفق بيانات محدد مع مصفوفات انقباضية، مما يزيل تشويش ذاكرة التخزين المؤقت وجدولة الالتواء من أجل استخدام أعلى لـ FLOPS على أحمال عمل المصفوفة الكثيفة. ومع ذلك، تعاني وحدات TPU من الأشكال الديناميكية والتناثر غير المنتظم وشبكات الرسوم البيانية المعقدة، بينما تقدم أيضًا دعمًا أضيق للنظام البيئي للبرمجيات الذي يهيمن عليه JAX وXLA.

من الواضح أن الاختلاف الهيكلي في دعم التناثر يميز بين وحدات معالجة الرسومات (TPU) ووحدات معالجة الرسومات. تدعم NVIDIA Tensor Cores أصلاً التناثر المنظم بنسبة 2:4 عبر الضغط على مستوى التعليمات. في المقابل، تعمل المصفوفات الانقباضية المصنوعة من مادة TPU بطريقة متماسكة، مما يجعل عدم التخطي الصفري غير فعال بدون توقف خطوط الأنابيب أو أجهزة إضافية لتخفيف الضغط. يعتمد AWS Trainium2 حلاً وسطًا مع أدوات إزالة الضغط المتفرقة المخصصة للاحتفاظ بإنتاجية المصفوفة.

تقوم وحدات TPU بدمج SparseCores للتعامل مع مهام التجميع المبعثرة غير المنتظمة لتضمين الجداول وتوجيه MoE. تتفوق هذه النوى المتخصصة في الفرز والتبديل وإعادة ترتيب البيانات، وتغطي أعباء عمل التوصيات وإرسال الرموز المميزة التي لا تستطيع وحدات MXU القياسية معالجتها بكفاءة.

TPU v8t "Sunfish": مسرع التدريب


تم تجهيز شريحة التدريب v8t بذاكرة HBM3e بسعة 216 جيجابايت وذاكرة SRAM بسعة 128 ميجابايت. تعمل دقة FP4 الأصلية على مضاعفة الإنتاجية لكل دورة، مما يدفع حوسبة الشريحة الواحدة إلى 12.6 PFLOPS. وهو يحتفظ بوصلة دائرية ثلاثية الأبعاد ونطاق ترددي ICI مطور يبلغ 19.2 تيرابايت/ثانية، وهو مثالي للاتصالات الجماعية القائمة على الحلقة في التدريب واسع النطاق.

تعمل تقنية SparseCores الموروثة على تحسين النقل غير المنتظم للبيانات الشاملة لوزارة التعليم. تعمل ترقيتان مهمتان على كسر الاختناقات واسعة النطاق: تتجاوز تقنية TPUDirect RDMA وTPUDirect Storage وحدة المعالجة المركزية المضيفة لتمكين الوصول المباشر إلى ذاكرة TPU، مما يوفر إنتاجية إدخال/إخراج أسرع بمقدار 10 مرات. بالإضافة إلى ذلك، يستخدم v8t وحدات المعالجة المركزية Axion المستندة إلى Arm من Google كمعالجات مضيفة، مما يعزل ارتعاش المضيف ويعزز استقرار المعالجة المسبقة للتدريب المتزامن متعدد الشرائح.

أحدث حالة شركة حول جوجل تعلن عن TPU v8t Sunfish و TPU v8i Zebrafish  1

TPU v8i "الزرد": مسرع الاستدلال


تم تصميم الإصدار 8i خصيصًا لأحمال عمل الاستدلال المرتبطة بعرض النطاق الترددي للذاكرة، ويعطي الأولوية لإنشاء الرموز المميزة ذات زمن الوصول المنخفض. ويتميز بسعة 384 ميجابايت SRAM - ثلاثة أضعاف تلك الموجودة في Ironwood - لتخزين ذاكرة التخزين المؤقت KV على الرقاقة وتقليل قراءة HBM المتكررة. بفضل اثنين من TensorCores و288 جيجابايت HBM3e، فإنه يحقق حوسبة 10.1 PFLOPS FP4، مما يتداخل مع مهام الاستدلال قصيرة الدفعة من أجل استخدام مستدام أعلى.

بدلاً من SparseCores، يعمل محرك تسريع المجموعات المخصص (CAE) على تقليل زمن انتقال المزامنة على الشريحة بما يصل إلى 5×، مما يؤدي إلى تحسين العمليات الجماعية المتكررة على دفعات صغيرة. يتخلى الإصدار 8i عن الحيد ثلاثي الأبعاد لصالح طوبولوجيا Boardfly المستندة إلى Dragonfly، مما يقلل الحد الأقصى للقفزات من شريحة إلى شريحة من 16 إلى 7 ويقلل زمن الوصول الشامل لـ MoE بنسبة 50%.

التسلسل الهرمي لنسيج برج العذراء والمشتري


تعمل شركة Virgo بمثابة نسيج قابل للتوسيع داخل مركز البيانات، حيث تتبنى بنية غير معيقة من طبقتين للتخلص من الإفراط في الاشتراك في حركة مرور الذكاء الاصطناعي من الشرق إلى الغرب. مدعومًا بمفاتيح MEMS الضوئية، فإنه يتيح إعادة توجيه الأخطاء على مستوى المللي ثانية ويحافظ على 97% من الإنتاجية الجيدة لـ v8t superpods. بالاشتراك مع Jupiter — نسيج مركز البيانات عبر المسافات الطويلة من Google — يدعم نظام الاتصال البيني متعدد الطبقات أكثر من مليون شريحة TPU في مجموعة منطقية واحدة مع 1.7 ZFLOPS إجمالي حساب FP4.

الأداء والتكلفة الإجمالية للملكية ووضع السوق


يمنح استخدام نماذج FLOPs (MFU) ذات الإنتاجية الجيدة والمستقرة مزايا جذابة من حيث التكلفة لوحدات TPU. عند استخدام MFU بنسبة 40%، تكون تكاليف تدريب TPU أقل بنسبة 62% من NVIDIA GB300. في مقارنة الأجهزة، يقع أداء FP4 الكثيف لـ v8t بين GB200 وGB300، بينما تهيمن Google على التجميعات واسعة النطاق باستخدام جراب واحد مكون من 9600 شريحة، وهو ما يتجاوز نطاق NVLink الذي يضم 72 وحدة معالجة رسومات NVIDIA.

وبالنظر إلى المستقبل، ستعمل Vera Rubin وRubin Ultra وKyber من NVIDIA على تضييق فجوة أداء TPU من عام 2026 إلى 2027. وتشمل نقاط ضعف TPU صغر حجم HBM لكل شريحة، وغياب تناثر الأجهزة والتوافق المحدود للنظام البيئي. ومع ذلك، تحافظ Google على نقاط قوتها في مجال التجميع الضخم، وزمن الوصول المحدد، وكفاءة التكلفة لأعباء عمل وزارة التربية والتعليم.

تعمل Google على توسيع البنية التحتية لوحدة معالجة الرسومات (TPU) وNVIDIA GPU. تخطط Meta لصفقة اعتماد TPU بمليارات الدولارات بدءًا من عام 2027. وباعتبارها جيلًا ثنائي الشريحة مُحسّنًا لعصر الوكلاء، يؤمن TPU v8 قدرة Google التنافسية ضد NVIDIA Grace-Blackwell لنشر الذكاء الاصطناعي على نطاق واسع.

شركة بكين تشيانشينغ جيتونغ للتكنولوجيا المحدودة
ساندي يانغ / مدير الإستراتيجية العالمية
واتساب/وي تشات: +86 13426366826
البريد الإلكتروني: yangyd@qianxingdata.com
الموقع الإلكتروني: www.qianxingdata.com/www.storagesserver.com
التركيز على الأعمال:
توزيع منتجات تكنولوجيا المعلومات والاتصالات / تكامل النظام والخدمات / حلول البنية التحتية
مع أكثر من 20 عامًا من الخبرة في توزيع تكنولوجيا المعلومات، نتعاون مع العلامات التجارية العالمية الرائدة لتقديم منتجات موثوقة وخدمات احترافية.
"استخدام التكنولوجيا لبناء عالم ذكي" مزود خدمة منتجات تكنولوجيا المعلومات والاتصالات الموثوق به!
تفاصيل الاتصال
Beijing Qianxing Jietong Technology Co., Ltd.

اتصل شخص: Ms. Sandy Yang

الهاتف :: 13426366826

إرسال استفسارك مباشرة لنا (0 / 3000)