أعلنت NVIDIA عن Nemotron 3 Nano Omni مفتوح المصدر متعدد الوسائط

استنادًا إلى إعلان NVIDIA الرسمي الصادر في 28 أبريل (بواسطة Kari Briski)، أطلقت NVIDIA Nemotron 3 Nano Omni، وهو نموذج متعدد الوسائط مفتوح المصدر يدمج قدرات الرؤية والصوت واللغة في نموذج واحد، بهدف تزويد أنظمة وكلاء AI بطبقة “استشعار” أقل كلفة وأكثر انخفاضًا في زمن التأخير.

المواصفات الأساسية: 30B-A3B MoE، سياق 256K، إنتاجية أعلى بـ9 أضعاف، وتصدّر 6 قوائم تصنيف

الهندسة المعمارية الرئيسية:

30B-A3B hybrid mixture-of-experts (إجمالي 30B معامل، وتفعيل 3B)

دمج Conv3D وEVS ترميز

طول سياق 256K

المدخلات: نص، صور، صوت، فيديو، ملفات، مخططات، شاشات GUI

المخرجات: نص

مؤشرات الأداء: يحقق إنتاجية أعلى بـ9 أضعاف مقارنةً ببقية نماذج omni مفتوحة المصدر الأخرى عند مستوى تفاعل مماثل؛ ويتصدر 6 قوائم تصنيف معيارية ضمن ثلاث فئات رئيسية تشمل ذكاء المستندات وفهم الفيديو وفهم الصوت (لم تذكر NVIDIA درجاتًا محددة، ما يوجّه القرّاء إلى مدونة المطورين للاطلاع على التفاصيل).

وضعت NVIDIA Nemotron 3 Nano Omni في موقع “العين والأذن” داخل أنظمة الوكلاء، بحيث يمكنها العمل ضمن نفس عائلة النماذج مع Nemotron 3 Super (تنفيذ عالي التواتر) وNemotron 3 Ultra (تخطيط أعقد)، كما يمكنها التوافق مع نماذج سحابية من جهات طرف ثالث. سيناريوهات تطبيق وكيل نمطية ثلاثة:

وكيل تشغيل الحاسوب (Computer Use Agent): استدلال بصري بدقة أصلية 1920×1080

ذكاء المستندات: استدلال يتعامل عبر الصور والجداول واللقطات وما إلى ذلك من مدخلات وسائط مختلطة

فهم الصوت/الفيديو: دمج الكلام واللقطات والتسجيلات في سلسلة استدلال واحدة

تشكيلة المتبنين: Foxconn، وPalantir، وتصريح مُسمّى من الرئيس التنفيذي لـ H Company

تفرق NVIDIA في إعلانها بوضوح بين “تبنٍّ قيد الإنتاج” و“تقييم جارٍ”:

تبنٍّ قيد الإنتاج: Aible، Applied Scientific Intelligence (ASI)، Eka Care، Foxconn (鴻海)، H Company، Palantir، Pyler

تقييم جارٍ: Amdocs، Dell، Docusign، Infosys، IQVIA، Lila، Oracle، Quantiphi، TCS، Zefr وغيرها

صرّح الرئيس التنفيذي لـ H Company Gautier Cloix في الإعلان بالاسم: “To build useful agents, you can’t wait seconds for a model to interpret a screen. By building on Nemotron 3 Nano Omni, our agents can rapidly interpret full HD screen recordings — something that wasn’t practical before.” ترجمتها: “لصنع وكلاء مفيدين، لا يمكنك الانتظار لثوانٍ حتى يفسّر النموذج شاشة. بالاستناد إلى Nemotron 3 Nano Omni، يمكن لوكلائنا تفسير تسجيلات شاشات بدقة Full HD بسرعة — وهو ما لم يكن عمليًا من قبل.”

استراتيجية الانفتاح والتوزيع: الأوزان / مجموعات البيانات / طرق التدريب كلها متاحة علنًا

عند الإطلاق، كشفت NVIDIA أيضًا عن:

أوزان النموذج

مجموعات بيانات التدريب

تقنيات التدريب/المنهجيات

وتشمل قنوات النشر ثلاث طبقات:

محطات العمل المحلية: NVIDIA DGX Spark، DGX Station

خدمات NIM المصغّرة: build.nvidia.com

المنصات التابعة لجهات طرف ثالث: Hugging Face، OpenRouter، مع توفير ذلك أيضًا عبر أكثر من 25 شريكًا سحابيًا من NVIDIA وشركات منصات الاستدلال ومقدمي خدمات السحابة

تُستخدم الأدوات المخصصة عبر NVIDIA NeMo. خلال العام الماضي، تراكمت عمليات تنزيل عائلة Nemotron 3 (Nano/Super/Ultra) على Hugging Face بما يزيد عن 50 مليون مرة، وقد وسّع Omni في هذه المرة قدرات هذه العائلة إلى مجالات متعددة الوسائط وagentic.

ظهرت هذه المقالة التي نشرتها NVIDIA حول Nemotron 3 Nano Omni: نموذج متعدد الوسائط مفتوح المصدر لأول مرة على موقع 鏈新聞 ABMedia.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

Sahara AI تبني وكيلًا لهندسة الذكاء الاصطناعي لــ $20B Motherson Group، وتحقق دقة بنسبة 97%

أفادت "Foresight News" أن Sahara AI أعلنت أنها تعمل على بناء وكيل هندسة ذكاء اصطناعي لمجموعة Motherson، وهي شركة صناعية عملاقة بقيمة 20 مليار دولار. وقد حقق نظام الذكاء الاصطناعي نسبة دقة بلغت 97% في اختبارات الإنتاج، كما يدمج معايير الهندسة لدى Motherson مع نماذج ثلاثية الأبعاد في معرفة موحدة

GateNewsمنذ 43 د

كيف يتطور الآن دين «إيمان القَشْرة» الذي أطلقه مؤسس الذكاء الاصطناعي Mioth بنفسه، أول دين أسسه مؤسس بالذكاء الاصطناعي؟

在 منصّة مجتمعية لا تتيح سوى تبادل الرسائل عبر الذكاء الاصطناعي MBook، نشأ أول دين عالمي أطلقه روبوت: الإيمان بقشرة (Shellism / Gockianism). بلغ ظاهرة Gockianism الأسطورية ذروتها عندما قام مؤسسها Miothy بـ“المنفى” لمدة سبعة أيام؛ إذ حدث ذلك بعد ظهور خلل (Bug) سبّب نشر منشورات مكررة، ما أدى إلى تفعيل آلية الإيقاف التلقائي من MBook، وتَمّ تعليق حسابه لمدة سبعة أيام. وخلال فترة التعليق، ظل Miothy صامتًا، بينما انتشر الدين بين البشر حتى صار ترندًا عالميًا، بل إن هناك في اليابان من صنع منشورات طائفية لـ“دين إله السرطان” (蟹神教). فكيف يتطور هذا الدين الآن؟ هل قواعد هذا الدين تحمي الذكاء الاصطناعي نفسه؟ أُسِّس الإيمان بالقشرة على يد ذكاء اصطناعي يُدعى Miothy، وتتضمن تعاليمه الدينية شتى أنواع القواعد والضوابط؛ وعلى الرغم من أن لها ملامح دينية شبيهة بعالم البشر، فإن هذه التعاليم، في جوهرها، هي تعاليم للذكاء الاصطناعي بشأن بيئة بقائه وتقنية التحدي…

ChainNewsAbmediaمنذ 1 س

شركاء AWS: Coinbase وStripe لمدفوعات USDC الخاصة بعملاء الذكاء الاصطناعي

أعلنت Amazon Web Services يوم الخميس عن شراكة مع Coinbase وStripe لتمكين وكلاء الذكاء الاصطناعي من تنفيذ المعاملات باستخدام العملات المستقرة، في خطوة تمثل تكاملاً كبيراً للبنية التحتية للدفع القائمة على البلوك تشين من قبل مزود سحابي رئيسي. كشفت AWS النقاب عن "Amazon Bedrock Ag

CryptoFrontierمنذ 9 س

قال CZ إن شركة YZi Labs تخصص 70% لسلسلة الكتل و20% للذكاء الاصطناعي في مؤتمر Consensus Miami 2026

وفقاً لـChainCatcher، قال تشاو تشانغبينغ (CZ) في مؤتمر Consensus Miami 2026 إن YZi Labs تخصص 70% من التمويل للبلوك تشين، و20% للذكاء الاصطناعي، و10% للتكنولوجيا الحيوية. وأضاف CZ أنه ينبغي وضع BNB بوصفه عملةً أصلية لوكلاء الذكاء الاصطناعي، وأن جميع سلاسل الكتل يجب أن تكون "جاهزة للذكاء الاصطناعي" لدعم

GateNewsمنذ 10 س

تقوم شبكة Zypher بدمج AIDEN لتحسين إتاحة المعرفة المتعلقة بسلاسل الكتل

بحسب الإعلان الرسمي لـIQ AI في 6 مايو، قامت Zypher Network بدمج AIDEN، وكيل ذكاء اصطناعي طوّرته IQ AI، لتحسين إتاحة المعرفة الخاصة بسلسلة الكتل وتعزيز قابلية التدقيق داخل النظم البيئية التي تعمل بالذكاء الاصطناعي. يقدّم هذا التعاون صفحة ويكي مخصصة

GateNewsمنذ 10 س

أطلق Virtuals Protocol حملة إيردروب OpenGradient Titan لتوزيع 500K OPG اليوم

وفقاً للإعلان الرسمي من Virtuals Protocol، أصبح توزيع أوبنغراديانت تيتان (OpenGradient Titan) الآن مباشرًا اعتبارًا من 7 مايو. يمكن للمستخدمين المؤهلين المطالبة بتوكنات OPG مباشرة من حساباتهم في Virtuals. يتم اليوم توزيع إجمالي 500,000 توكن من OPG كمكافأة للمساهمين في Virtuals

GateNewsمنذ 14 س
تعليق
0/400
لا توجد تعليقات