أطلقت شركة إنسبور معلومة خادم الاستدلال الدماغ الميتا R1، القادر على إطلاق العنان لقوة الوحدة القوية البحث العميق 671B على جهاز واحد
في الحادي عشر من فبراير، أطلقت إنسبور معلومة رسميًا جهاز ميتابرين R1خادم الاستدلالمن خلال ابتكار النظام وتحسين التعاون بين أجهزة البرمجيات، يمكن نشر نموذج البحث العميق R1 671B وتشغيله على جهاز واحد، مما يساعد العملاء على تقليل صعوبة وتكلفة نشر نموذج المعلمات الكاملة البحث العميق R1 بشكل كبير، وتحسين أداء خدمة الاستدلال، وتسريع ظهور الاستكشاف الذكي في مختلف الصناعات.
حاليًا، يعد البحث العميق مفتوح المصدر مع إصدارات متعددة من النماذج، مما يساعد الصناعات المختلفة على تسريع تطبيق تقنية النماذج الكبيرة لتعزيز ترقية الأعمال والتحول. من بينها، يتمتع نموذج البحث العميق R1 671B، باعتباره نموذجًا أساسيًا كبيرًا مُعلمًا بالكامل، بقدرة تعميم أقوى ودقة أعلى وقدرة أفضل على فهم السياق مقارنة بنموذج التقطير. ومع ذلك، فإنه يفرض أيضًا متطلبات أعلى على سعة ذاكرة الفيديو للنظام، وعرض النطاق الترددي لذاكرة الفيديو، وعرض النطاق الترددي للربط، والزمن الكامن: هناك حاجة إلى ما لا يقل عن 800 جيجابايت من ذاكرة الفيديو لدقة اف بي 8، وأكثر من 1.4 تيرابايت من مساحة ذاكرة الفيديو مطلوبة لدقة FP16/بي اف 16؛ بالإضافة إلى ذلك، يعد البحث العميق R1 نموذجًا نموذجيًا لسلسلة تفكير طويلة مع خصائص تطبيق الإدخال القصير والإخراج الطويل. تعتمد مرحلة فك التشفير الاستدلالي على عرض النطاق الترددي الأعلى لذاكرة الفيديو وزمن انتقال الاتصالات المنخفض للغاية. استنادًا إلى خصائص قوة الحوسبة ومتطلبات النظام لنموذج 671B، يوفر خادم الاستدلال R1 من الدماغ الميتا سعة ذاكرة فيديو رائدة، ونطاق ترددي لذاكرة الفيديو، وسرعة اتصال، مما يمكن أن يساعد الشركات على إكمال نشر توطين نماذج المعلمات الكاملة البحث العميق بكفاءة.
الالدماغ الميتا R1خادم الاستدلال NF5688G7 هو منصة حوسبة الذكاء الاصطناعي عالية الأداء الرائدة، الأصلية لمحرك الحوسبة اف بي 8، مع سرعة نشر سريعة وعدم فقدان الدقة لطراز البحث العميق R1 671B. من حيث ذاكرة الفيديو، يتم توفير ذاكرة فيديو عالية السرعة HBM3e بسعة 1128 جيجابايت لتلبية متطلبات سعة ذاكرة الفيديو التي لا تقل عن 800 جيجابايت تحت دقة اف بي 8 لطراز 671B. حتى عندما يدعم جهاز واحد الاستدلال الكامل للنموذج، لا يزال يتم حجز مساحة ذاكرة تخزين مؤقتة كافية كيلو فولت. يصل عرض النطاق الترددي لذاكرة الفيديو إلى 4.8 تيرابايت/ثانية، وهو ما يطابق تمامًا الخصائص التقنية لطراز البحث العميق R1 من ددددددد قصير مدخل طويل الناتج، وحساسية عرض النطاق الترددي لذاكرة الفيديو ددددد، ويمكنه تحقيق أقصى تسارع في مرحلة فك تشفير الاستدلال. من حيث الاتصال، يصل عرض النطاق الترددي وحدة معالجة الرسوميات P2P إلى 900 جيجابايت/ثانية، مما يضمن أداء اتصال مثالي للنشر المتوازي للموتر على جهاز واحد. استنادًا إلى أحدث إطار عمل للاستدلال، يمكن لجهاز واحد دعم 20-30 مستخدمًا متزامنًا. في الوقت نفسه، تم تجهيز جهاز NF5688G7 واحد بشبكة توسعة بدون فقدان بسرعة 3200 جيجابت في الثانية، والتي يمكنها تحقيق توسع سريع وفقًا لنمو احتياجات أعمال المستخدم وتوفير حل جاهز لمجموعة خوادم R1 ناضجة.
خادم الاستدلال R1 من الدماغ الميتا NF5868G8 هو خادم استدلال عالي الإنتاجية مصمم خصيصًا لنماذج الاستدلال الكبيرة. إنه أول خادم في الصناعة يدعم 16 بطاقة منفذ PCIe مزدوجة العرض القياسية على جهاز واحد، مما يوفر ما يصل إلى 1536 جيجابايت من سعة ذاكرة الفيديو ويدعم نشر نماذج البحث العميق 671B على جهاز واحد بدقة FP16/بي اف 16. بحث وتطوير مبتكر لطوبولوجيا مترابطة بالكامل من 16 بطاقة تعتمد على منفذ PCIe قماش، مع عرض نطاق ترددي للاتصالات من نظير إلى نظير يصل إلى 128 جيجابايت/ثانية لأي بطاقتين، مما يقلل من زمن انتقال الاتصالات بأكثر من 60%. من خلال التحسين التعاوني للأجهزة البرمجية، مقارنةً بنماذج منفذ PCIe التقليدية المكونة من 8 بطاقات لجهازين، يمكن لـ NF5868G8 تحسين أداء الاستدلال لنموذج البحث العميق 671B بنحو 40%، ويدعم حاليًا خيارات بطاقات تسريع الذكاء الاصطناعي المتعددة.
تعد إنسبور معلومة شركة رائدة عالميًا في توفير منتجات وحلول وخدمات البنية التحتية لتكنولوجيا المعلومات. من خلال تطوير جيل جديد من بنية الحوسبة المرتكزة على النظام، تهدف إنسبور إلى إنشاء منتجات وحلول حوسبة ذكية مفتوحة ومتنوعة وصديقة للبيئة. تلتزم إنسبور معلومة بالبحث والابتكار في منصات الحوسبة بالذكاء الاصطناعي ومنصات الموارد ومنصات الخوارزميات، وتتعاون مع الشركاء الرائدين من خلال نظام ميتابرين البيئي لتسريع ابتكار وتطبيق الذكاء الاصطناعي.
_________ تم اقتباس المقال من حساب يواناو وي تشات الرسمي