أعلنت WEKA عن دمج منصة NeuralMesh الخاصة بها مع البنية المرجعية NVIDIA STX، مما أدى إلى إنشاء شبكة الذاكرة المعززة الخاصة بها باعتبارها لبنة أساسية للبنية التحتية للجيل التالي من الذكاء الاصطناعي. يعالج الحل المدمج إحدى أهم الاختناقات في بيئات الاستدلال واسعة النطاق: قيود الذاكرة التي تؤثر بشكل مباشر على الأداء، والتكلفة الإجمالية للملكية، والنمو القابل للتطوير.
تعمل شبكة الذاكرة المعززة من WEKA، التي تعمل من خلال NeuralMesh، على توسيع ذاكرة وحدة معالجة الرسومات من خلال إخراج ذاكرة التخزين المؤقت ذات القيمة الرئيسية واستمرارها. عند نشرها مع NVIDIA STX، توفر هذه البنية تخزين ذاكرة سياق عالي الإنتاجية لأحمال عمل الذكاء الاصطناعي الوكيل، مما يدعم التفكير طويل السياق عبر الجلسات والأدوات وسير العمل الشامل. وفقًا للشركة، يمكن للتكوينات التي تجمع بين أنظمة NVIDIA Vera Rubin NVL72 وBlueField-4 DPUs وSpectrum-X Ethernet أن تعزز إنتاجية رمز ذاكرة السياق بمقدار 4x إلى 10x. ومن المتوقع أيضًا أن توفر المنصة ما لا يقل عن 320 جيجابايت/ثانية من القراءة و150 جيجابايت/ثانية من إنتاجية الكتابة، أي أكثر من ضعف أداء بنيات تخزين الذكاء الاصطناعي التقليدية.
البنية التحتية للذاكرة تصبح عنق الزجاجة الاستدلالي
تركز WEKA هذا التكامل على التحدي المتزايد لجدار الذاكرة في عمليات نشر الذكاء الاصطناعي الحديثة. ضمن خطوط أنابيب الاستدلال الحالية، تفرض ذاكرة GPU ذات النطاق الترددي العالي المحدودة عمليات إخلاء متكررة لذاكرة التخزين المؤقت KV، مما يؤدي إلى إعادة الحساب المتكررة وتقليل الكفاءة التشغيلية. ومع ارتفاع تزامن النظام، تتضاعف أوجه القصور هذه، مما يؤدي إلى زيادة نفقات البنية التحتية وتقليل القدرة على التنبؤ بالأداء.
تعمل الشركة على الترويج للبنية التحتية لذاكرة التخزين المؤقت KV المشتركة كحل. ومن خلال الحفاظ على السياق المستمر عبر المستخدمين والجلسات، يؤدي التخزين المؤقت المشترك إلى التخلص من المعالجة الزائدة عن الحاجة وتحقيق الاستقرار في إنتاجية الرمز المميز. توفر NVIDIA STX البنية المرجعية المعتمدة لهذا النموذج، بينما توفر WEKA طبقة التخزين وامتداد الذاكرة.
الشبكة العصبية وبنية شبكة الذاكرة المعززة
تعمل NeuralMesh كمنصة تخزين موزعة لـ WEKA، وهي مصممة للتكامل بسلاسة عبر مجموعة NVIDIA STX الكاملة. فهو يوفر خدمات بيانات عالية الأداء محسنة لأحمال عمل الذكاء الاصطناعي، في حين تعمل شبكة الذاكرة المعززة كطبقة توسيع مخصصة للذاكرة تعمل على دمج ذاكرة التخزين المؤقت KV خارج ذاكرة وحدة معالجة الرسومات.
يسمح هذا التصميم لبيئات الاستدلال بالحفاظ على جلسات طويلة السياق دون زيادة التحميل على موارد وحدة معالجة الرسومات. من خلال الاحتفاظ بحالة ذاكرة التخزين المؤقت وتمكين إعادة الاستخدام عبر أعباء العمل، يحافظ النظام الأساسي على الاستخدام العالي والأداء المتسق مع نطاق عمليات النشر.
تشير WEKA إلى أن شبكة الذاكرة المعززة، التي تم الكشف عنها لأول مرة في GTC 2025 وهي متاحة الآن بشكل عام، قد تم التحقق من صحتها على منصات NVIDIA Grace CPU المقترنة بوحدات BlueField DPU. توفر البنية مكاسب قابلة للقياس في كفاءة الاستدلال، بما في ذلك وقت أسرع بشكل كبير لأول رمز مميز، وإنتاجية أعلى للرمز المميز لكل وحدة معالجة رسومات، وأداء مستقر في ظل زيادة التزامن. يؤدي تفريغ مسار البيانات إلى BlueField-4 أيضًا إلى تقليل حمل وحدة المعالجة المركزية وتخفيف اختناقات الإدخال/الإخراج.
مكاسب الأداء والكفاءة
في البيئات الشبيهة بالإنتاج، تم تصميم النظام الأساسي لتعزيز الاستجابة وكفاءة البنية التحتية. تنص WEKA على أن شبكة الذاكرة المعززة يمكنها تقليل وقت ظهور الرمز المميز الأول بمقدار 4x إلى 20x، مع زيادة إخراج الرمز المميز لكل وحدة معالجة رسومات بما يصل إلى 6.5x. تنبع هذه التحسينات من ارتفاع معدلات ضربات ذاكرة التخزين المؤقت KV وعدد أقل من دورات إعادة الحساب، مما يمكّن الأنظمة من الحفاظ على الأداء مع توسع أحجام السياق وأعداد المستخدمين.
تم تسليط الضوء على شركة Firmus، وهي مزود البنية التحتية للذكاء الاصطناعي، باعتبارها من أوائل الشركات التي استفادت من NeuralMesh مع البنية التحتية القائمة على NVIDIA. أبلغت الشركة عن تحسن في إنتاجية الرمز المميز وانخفاض زمن الوصول على نطاق واسع، مع مكاسب تأتي من الاستخدام الأكثر كفاءة لوحدات معالجة الرسومات الحالية بدلاً من عمليات نشر الأجهزة الإضافية.
الآثار المترتبة على تصميم البنية التحتية لمنظمة العفو الدولية
يسلط هذا التكامل الضوء على التحول في تصميم نظام الذكاء الاصطناعي، حيث تحدد استراتيجيات الذاكرة والتخزين بشكل متزايد الأداء العام وكفاءة التكلفة. مع توسع أعباء عمل الذكاء الاصطناعي الوكيل واتساع نوافذ السياق، تصبح أساليب DRAM فقط غير مستدامة بسبب ارتفاع تكاليف إعادة الحساب ووحدات معالجة الرسومات غير المستغلة بشكل كافٍ.
تضع WEKA ذاكرة التخزين المؤقت KV المشتركة والمستمرة كقدرة أساسية لمصانع الذكاء الاصطناعي. يمكن للمؤسسات التي تتبنى هذا النموذج تحقيق استخدام أعلى لوحدة معالجة الرسومات، واستهلاك أقل للطاقة لكل مهمة استدلال، وقياس أكثر قابلية للتنبؤ. في المقابل، من المرجح أن تواجه البيئات التي تعتمد حصريًا على ذاكرة وحدة معالجة الرسومات المحلية تكاليف تشغيل متزايدة وتناقص العوائد مع نمو أعباء العمل.
شركة بكين تشيانشينغ جيتونغ للتكنولوجيا المحدودة
ساندي يانغ / مدير الإستراتيجية العالمية
واتساب/وي تشات: +86 13426366826
البريد الإلكتروني: yangyd@qianxingdata.com
الموقع الإلكتروني: www.qianxingdata.com/www.storagesserver.com
التركيز على الأعمال:
توزيع منتجات تكنولوجيا المعلومات والاتصالات / تكامل النظام والخدمات / حلول البنية التحتية
مع أكثر من 20 عامًا من الخبرة في توزيع تكنولوجيا المعلومات، نتعاون مع العلامات التجارية العالمية الرائدة لتقديم منتجات موثوقة وخدمات احترافية.
"استخدام التكنولوجيا لبناء عالم ذكي" مزود خدمة منتجات تكنولوجيا المعلومات والاتصالات الموثوق به!
ساندي يانغ / مدير الإستراتيجية العالمية
واتساب/وي تشات: +86 13426366826
البريد الإلكتروني: yangyd@qianxingdata.com
الموقع الإلكتروني: www.qianxingdata.com/www.storagesserver.com
التركيز على الأعمال:
توزيع منتجات تكنولوجيا المعلومات والاتصالات / تكامل النظام والخدمات / حلول البنية التحتية
مع أكثر من 20 عامًا من الخبرة في توزيع تكنولوجيا المعلومات، نتعاون مع العلامات التجارية العالمية الرائدة لتقديم منتجات موثوقة وخدمات احترافية.
"استخدام التكنولوجيا لبناء عالم ذكي" مزود خدمة منتجات تكنولوجيا المعلومات والاتصالات الموثوق به!



