logo
منزل أخبار

أخبار الشركة عن الكتاب الأحمر لـ "بيغ بلو" حول إدارة كاش KV على نطاق التخزين

شهادة
الصين Beijing Qianxing Jietong Technology Co., Ltd. الشهادات
الصين Beijing Qianxing Jietong Technology Co., Ltd. الشهادات
زبون مراجعة
موظفو المبيعات في Beijing Qianxing Jietong Technology Co. ، Ltd محترفون وصبورون للغاية. يمكنهم تقديم الاقتباسات بسرعة. كما أن جودة المنتجات وتعبئتها جيدة جدًا. تعاوننا سلس للغاية.

—— 《Festfing DV LLC

عندما كنت أبحث عن وحدة المعالجة المركزية Intel CPU و Toshiba SSD بشكل عاجل ، أعطتني Sandy من Beijing Qianxing Jietong Technology Co.، Ltd الكثير من المساعدة وحصلت على المنتجات التي أحتاجها بسرعة. أنا حقا أقدرها.

—— كيتي ين

ساندي من بكين Qianxing Jietong Technology Co. ، Ltd هو بائع دقيق للغاية ، يمكنه تذكيرني بأخطاء التكوين في الوقت المناسب عندما أشتري خادمًا. المهندسون محترفون للغاية ويمكنهم إكمال عملية الاختبار بسرعة.

—— ستريلكين ميخائيل فلاديميروفيتش

نحن سعداء جدًا بتجربتنا في العمل مع شركة بكين تشيانشينغ جيتونغ. جودة المنتج ممتازة، والتسليم دائمًا في الموعد المحدد. فريق المبيعات لديهم محترف، صبور، ومفيد جدًا في الإجابة على جميع أسئلتنا. نحن نقدر حقًا دعمهم ونتطلع إلى شراكة طويلة الأمد. موصى به بشدة!

—— أحمد نافيد

الجودة: تجربة رائعة مع موردي. كانت ميكروتيك RB3011 مستخدمة بالفعل، لكنها كانت في حالة جيدة جدا وكل شيء يعمل بشكل مثالي. التواصل كان سريعا وسلاسة،وكل مخاوفي تمت معالجتها بسرعةمُزود موثوق به جداً

—— جيران كوليسيو

ابن دردش الآن
الشركة أخبار
الكتاب الأحمر لـ "بيغ بلو" حول إدارة كاش KV على نطاق التخزين

يدعم نظام ملفات IBM Storage Scale الموازي إدارة ذاكرة التخزين المؤقت KV الموزعة مقترنة مع NVIDIA Dynamo ، وتلبية سيناريوهات استنتاج الذكاء الاصطناعي واسعة النطاق مع أحمال عمل سياقية ضخمة.

آخر أخبار الشركة الكتاب الأحمر لـ "بيغ بلو" حول إدارة كاش KV على نطاق التخزين  0

أصدرت شركة آي بي إم كتاباً رسمياً بعنوانسياق بلا حدود: منصة كاش KV عالية الأداء لاستدلال الذكاء الاصطناعي واسع النطاق، مما يوفر بنية مرجعية كاملة معتمدة لهذا الحل المشترك. يجمع المجموعة المتكاملة بين خوادم تخزين Supermicro Petascale ، وشبكات NVIDIA Spectrum-X Ethernet ،و IBM Storage Scale Erasure Coding Edition (ECE) لبناء مستوى تخزين مشترك عالي الأداء لاستنتاج الذكاء الاصطناعيوباعتبارها وثائق فنية موثوقة نشرتها IBM ITSO (منظمة الدعم الفني الدولية) ، تقدم IBM Redbooksإرشادات متعمقة لتنفيذ منتجات البنية التحتية لشركة IBM.

وقد شارك في تأليفها فرق الهندسة من IBM و Supermicro و NVIDIA ، ويعالج Redbook نقطة الألم الأساسية لأعباء العمل ذات السياق الطويل.تطبيقات استرداد RAG وأنابيب الوكيل المستقلة تولد بيانات ذاكرة التخزين المؤقت KV ضخمة داخل GPU HBM. بمجرد إزالة البيانات المؤخّرة من موارد HBM المحدودة، سيؤدي إعادة الحساب المتكررة إلى زيادة حادّة في فترة التأخير، مما يجعل تخزين الكاش KV المتبادل المستمر أمرًا لا غنى عنه.

يتبنى الحل بنية تخزين KV التسلسل الهرمي من خمسة مستويات تغطي متطلبات مختلفة للفترة اللاحقة والقدرة:
  • طبقة G1: عقدة GPU المحلية HBM
  • طبقة G2: نظام العقدة المركزية (DRAM)
  • طبقة G3: سد المحلي المرتبط مباشرة
  • G3.5 طبقة: تخزين فلاش مشترك على مستوى البود ، يقدمها NVIDIA BlueField DPUs مع اتصال مباشر إلى GPU server DPUs
  • طبقة G4: تجمع تخزين مشترك خارجي عبر إيثيرنت متصل بجميع خوادم الحوسبة GPU
تغطي التسلسل الهرمي للذاكرة والتخزين من النهاية إلى النهاية، هذا الإعداد متعدد المستويات يوفر استمرارية وتأخير وتدرج السعة.الإخلاء التلقائي وإعادة تحميل البيانات الديناميكية عبر كومة التخزين بأكملها، والتي تتكيف بمرونة مع أنماط الوصول المختلفة لحملات العمل وميزانيات تكاليف البنية التحتية الكلية.

يتم توزيعها على خوادم تخزين Supermicro Petascale ، وتعمل Storage Scale ECE كطبقة ذاكرة التخزين المؤقت البارد G4. تم تحسينها لبيانات ذاكرة التخزين المؤقت KV غير الحساسة للانتظار ،بما في ذلك حالات المحادثة غير النشطة متعددة الدورات، بيانات سياق العميل المشتركة وسجلات الاستعلامات التاريخية التي لا تتطلب استجابة فورية.

وفقًا لنتائج الاختبار المسجلة في الكتاب الأحمر ، فإن هذه الهندسة المعمارية المرجعية جاهزة للإنتاج تسريع بشكل فعال خدمات استنتاج الذكاء الاصطناعي التوليدية والذكاء الاصطناعي العملي.في اختبارات طلب واحد TTFT (Time To First Token) مقارنة مع خوادم GPU مستقلة بدون ذاكرة تخزين KV خارجية، يحافظ النظام المتكامل على TTFT مستقرة بغض النظر عن التغيرات السريعة في الطول.56x تسريعتحت تسلسلات مدخلات 130k رمز ويقضي تماما على تقلبات تأخير الاستدلال الناجمة عن أطوال استدعاء الممتدة.

تحت ضغط استنتاج متعدد المستخدمين في وقت واحد يحقق الحل تحسنًا كبيرًا في الأداء: يرتفع معدل عرض الطلب من 0.19 RPS إلى 4.26 RPS ، مما يمثل22x زيادة في الناتجوفي الوقت نفسه، يقلل إجمالي وقت معالجة 200 طلب استنتاج بنسبة 95%، مما يرفع بكثير كفاءة استخدام معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة معالجة.

كما يحافظ المكدس على أداء قوي تحت اختبارات الإجهاد الصاخبة القاسية. مع أربعة أطراف عملاء تولد حركة إدخال / إخراج شبكة تنافسية 200 جيجابايت / ثانية ،النظام المتكامل لا يزال يعمل بشكل مستقر عند 3.6 RPS، إنهاء كل 200 طلب استنتاج خلال 55.56 ثانية.أعلى بـ 18 مرةأكثر من بنية إعادة الحوسبة المتعلقة بجهاز المعالجة المركزية (GPU)

وخلص فريق البحث في الكتاب الأحمر إلى: "بالنسبة للشركات التي تهدف إلى تحقيق أقصى قدر من عائد الاستثمار على استثمارات أجهزة GPU باهظة الثمن، توفر هذه الهندسة المعمارية المتكاملة المحققةنهج جاهز للإنتاج لزيادة معدل الإنتاج الاستدلال، خفض فترة تأخير من نهاية إلى نهاية، ودعم تزامن خدمة أعلى، وبناء بنية تحتية استنتاج الذكاء الاصطناعي على نطاق واسع أكثر فعالية من حيث التكلفة.

الكلمات الرئيسية: سوبرمايكرو, IBM Storage Scale, NVIDIA Dynamo

شركة بكين تشيانكسينغ جييتونغ للتكنولوجيا المحدودة
ساندي يانغ مدير الاستراتيجية العالمية
واتساب / ويتشات: +86 13426366826
البريد الإلكتروني: yangyd@qianxingdata.com
الموقع: www.qianxingdata.com/www.storagesserver.com
التركيز على الأعمال:
توزيع منتجات تكنولوجيا المعلومات والاتصالات / تكامل النظام والخدمات / حلول البنية التحتية
مع أكثر من 20 عامًا من الخبرة في توزيع تكنولوجيا المعلومات، نحن نتعاون مع العلامات التجارية العالمية الرائدة لتقديم منتجات موثوقة وخدمات مهنية.
استخدام التكنولوجيا لبناء عالم ذكي مزود خدمة منتجات تكنولوجيا المعلومات والاتصالات الموثوق به
حانة وقت : 2026-06-12 11:09:46 >> أخبار قائمة ميلان إلى جانب
تفاصيل الاتصال
Beijing Qianxing Jietong Technology Co., Ltd.

اتصل شخص: Ms. Sandy Yang

الهاتف :: 13426366826

إرسال استفسارك مباشرة لنا (0 / 3000)