0
| 本文作者: 劉伊倫 | 2025-12-16 14:00 |
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))消息,2025年12月15日,英偉達(dá)正式對(duì)外發(fā)布Nemotron 3系列開(kāi)放模型及配套的數(shù)據(jù)集與工具庫(kù),這一舉措精準(zhǔn)切入全球企業(yè)AI轉(zhuǎn)型的核心訴求,為行業(yè)帶來(lái)了兼具透明度與高效能的代理式AI開(kāi)發(fā)解決方案。
隨著AI技術(shù)在產(chǎn)業(yè)場(chǎng)景的深度滲透,企業(yè)對(duì)AI的應(yīng)用需求已從單一對(duì)話交互升級(jí)為復(fù)雜工作流自動(dòng)化,協(xié)作式多智能體系統(tǒng)成為必然趨勢(shì)。
然而,開(kāi)發(fā)者在轉(zhuǎn)型過(guò)程中始終面臨三重核心困境:智能體間通信開(kāi)銷過(guò)高、長(zhǎng)任務(wù)推理易出現(xiàn)上下文漂移、推理成本居高不下,同時(shí),模型透明度不足也讓企業(yè)和開(kāi)發(fā)者難以放心將核心業(yè)務(wù)托付給AI系統(tǒng)。
Nemotron 3的推出正直面這些挑戰(zhàn)。
Nemotron 3模型推出Nano、Super和Ultra三種規(guī)模,突破性異構(gòu)潛在混合專家(MoE)架構(gòu)是核心亮點(diǎn),既守住了專業(yè)化代理式AI所需的性能,又堅(jiān)持開(kāi)放特質(zhì),讓開(kāi)發(fā)者無(wú)需在“性能強(qiáng)度”與“使用自由度”間做取舍,成為高效的開(kāi)發(fā)底座。
“開(kāi)放創(chuàng)新是AI進(jìn)步的基礎(chǔ)。通過(guò)Nemotron,我們將先進(jìn)AI轉(zhuǎn)化成開(kāi)放平臺(tái),為開(kāi)發(fā)者提供構(gòu)建大規(guī)模代理式系統(tǒng)所需的透明度與效率。”英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示。
Nemotron并非孤立的模型發(fā)布,而是英偉達(dá)主權(quán)AI戰(zhàn)略的關(guān)鍵支撐。
埃森哲、德勤、安永、ServiceNow、西門子、Zoom等12家企業(yè)已經(jīng)成為Nemotron早期用戶,從制造業(yè)的智能產(chǎn)線優(yōu)化,到網(wǎng)絡(luò)安全的威脅閉環(huán)應(yīng)對(duì),再到媒體通信的高效協(xié)作,這些行業(yè)標(biāo)桿企業(yè)正將這款開(kāi)放模型深度融入核心AI工作流,一場(chǎng)跨領(lǐng)域的智能升級(jí)浪潮已悄然拉開(kāi)序幕。
Token吞吐量提高4倍、減少60%推理Token生成量,Nemotron 3讓每一分算力「物超所值」
在多智能體AI系統(tǒng)愈發(fā)深入產(chǎn)業(yè)的今天,開(kāi)發(fā)者面臨很現(xiàn)實(shí)的問(wèn)題:既要依賴專有模型的前沿推理能力支撐復(fù)雜任務(wù),又希望借助開(kāi)放模型的高效與可定制性控制成本。
Nemotron 3的出現(xiàn),正在解決這種“性能與經(jīng)濟(jì)不可兼得”的困境。
任務(wù)路由技術(shù)成為關(guān)鍵。在單一工作流中,開(kāi)發(fā)者可通過(guò)智能調(diào)度,讓日常高效型任務(wù)交由Nemotron 3這樣的開(kāi)放模型處理,而核心復(fù)雜的前沿推理則聯(lián)動(dòng)專有模型,既保證了智能體的能力,又優(yōu)化了Token經(jīng)濟(jì)效益。這一模式并非理論構(gòu)想,已在Perplexity的實(shí)踐中落地。
作為AI瀏覽器領(lǐng)域的創(chuàng)新者,Perplexity正將Nemotron 3 Ultra納入其智能體路由器的核心選項(xiàng)。
“Perplexity的構(gòu)建理念是當(dāng)精準(zhǔn)AI融入先進(jìn)工具時(shí)(例如 AI 助手),人類的好奇心將被放大。通過(guò)我們的智能體路由器,可以將工作負(fù)載定向到領(lǐng)先的精細(xì)調(diào)優(yōu)開(kāi)放模型,如Nemotron 3 Ultra,或在任務(wù)能夠從其獨(dú)特能力中受益時(shí),利用領(lǐng)先的專有模型,以此確保我們的AI助手能夠以卓越的速度、效率和規(guī)模運(yùn)行?!盤erplexity首席執(zhí)行官Aravind Srinivas表示。
如果說(shuō)大企業(yè)借助Nemotron 3實(shí)現(xiàn)了效率升級(jí),那么這款開(kāi)放模型對(duì)初創(chuàng)公司而言,更像是一把加速創(chuàng)新的“鑰匙”。General Catalyst和Mayfield旗下的諸多創(chuàng)業(yè)公司,正借助Nemotron 3搭建人機(jī)協(xié)作的AI隊(duì)友,實(shí)現(xiàn)工作效能的快速提高。
這背后離不開(kāi)NVIDIA全生態(tài)的支撐。
Mayfield管理合伙人Navin Chaddha表示:“英偉達(dá)的開(kāi)放模型堆棧與初創(chuàng)加速計(jì)劃為初創(chuàng)公司提供了各類模型、工具及經(jīng)濟(jì)高效的基礎(chǔ)設(shè)施,助力其開(kāi)展試驗(yàn)、實(shí)現(xiàn)差異化發(fā)展并快速擴(kuò)展規(guī)模。Nemotron 3可以讓創(chuàng)始人在構(gòu)建代理式AI應(yīng)用和AI隊(duì)友方面取得先機(jī),并幫助他們利用英偉達(dá)龐大的用戶基礎(chǔ)?!?/p>
Nemotron 3系列MoE模型包含三種規(guī)模:
Nemotron 3 Nano:是一款具備300億參數(shù)的小型模型,每次運(yùn)行最多激活30億參數(shù),適用于針對(duì)性、高效的任務(wù)。
Nemotron 3 Super:是一款具備約1000億參數(shù)的高精度推理模型,每個(gè)Token最多激活100億參數(shù),適用于多智能體應(yīng)用。
Nemotron 3 Ultra:是一款具備約5000億參數(shù)的大型推理引擎,每個(gè)Token最多激活500億參數(shù),適用于復(fù)雜的AI應(yīng)用。
Nemotron 3 Nano已正式上線,是計(jì)算成本效益極高的模型,其針對(duì)軟件調(diào)試、內(nèi)容摘要、AI助手工作流及信息檢索等任務(wù)進(jìn)行了優(yōu)化,同時(shí)保持了較低的推理成本。并且,模型采用獨(dú)特的異構(gòu)MoE架構(gòu),以實(shí)現(xiàn)效率與可擴(kuò)展性的提升。
這一設(shè)計(jì)使其Token吞吐量較Nemotron 2 Nano至高提升4倍,并減少了多達(dá)60%的推理Token生成量,大大降低了推理成本。同時(shí),具備100萬(wàn)Token的上下文處理能力,Nemotron 3 Nano具有更強(qiáng)的記憶能力,在處理長(zhǎng)時(shí)間多步驟任務(wù)時(shí)能更精準(zhǔn)地關(guān)聯(lián)信息。

獨(dú)立AI基準(zhǔn)測(cè)試機(jī)構(gòu)Artificial Analysis評(píng)定該模型為同等規(guī)模模型中兼具極高開(kāi)放性和效率及卓越精度的模型。
在需要多智能體協(xié)作完成低延遲復(fù)雜任務(wù)的應(yīng)用中,Nemotron 3 Super表現(xiàn)出色。Nemotron 3 Ultra則作為高級(jí)推理引擎,服務(wù)于需要深度研究和策略規(guī)劃的AI工作流。
Nemotron 3 Super與Ultra采用基于英偉達(dá)Blackwell架構(gòu)的超高效4位NVFP4訓(xùn)練格式,可顯著降低顯存需求并加速訓(xùn)練進(jìn)程。這種效率使更大規(guī)模模型能在現(xiàn)有基礎(chǔ)設(shè)施上進(jìn)行訓(xùn)練,不會(huì)因更高精度格式而犧牲準(zhǔn)確性。
借助Nemotron 3系列模型,開(kāi)發(fā)者可根據(jù)特定工作負(fù)載選擇適配的開(kāi)放模型,在數(shù)十至數(shù)百個(gè)智能體間靈活擴(kuò)展,同時(shí)在復(fù)雜工作流中獲得更快速、精準(zhǔn)的長(zhǎng)時(shí)推理能力。
3萬(wàn)億Token數(shù)據(jù)、NeMo開(kāi)源工具庫(kù)發(fā)布,英偉達(dá)為開(kāi)發(fā)者按下 「加速鍵」
英偉達(dá)還發(fā)布了面向?qū)I(yè)AI智能體開(kāi)發(fā)者的訓(xùn)練數(shù)據(jù)集與前沿強(qiáng)化學(xué)習(xí)庫(kù)集合。
3萬(wàn)億Token規(guī)模的全新Nemotron預(yù)訓(xùn)練、后訓(xùn)練及強(qiáng)化學(xué)習(xí)數(shù)據(jù)集,為開(kāi)發(fā)高性能特定領(lǐng)域智能體提供了豐富的推理、編碼及多步驟工作流范例。Nemotron Agentic Safety Dataset則提供真實(shí)場(chǎng)景的遙測(cè)數(shù)據(jù),幫助團(tuán)隊(duì)評(píng)估并提升復(fù)雜智能體系統(tǒng)的安全性。
為加速開(kāi)發(fā)進(jìn)程,英偉達(dá)發(fā)布了NeMo Gym與NeMo RL開(kāi)源庫(kù),為Nemotron模型提供訓(xùn)練環(huán)境及后訓(xùn)練基礎(chǔ),同時(shí)還推出用于驗(yàn)證模型安全性和性能的NeMo Evaluator。所有工具及數(shù)據(jù)集現(xiàn)已上線GitHub和Hugging Face平臺(tái)。
Nemotron 3已獲得LM Studio、llama.cpp、SGLang和vLLM支持。此外,Prime Intellect與Unsloth正將NeMo Gym 的即用型訓(xùn)練環(huán)境直接集成至其工作流,使團(tuán)隊(duì)能夠更加快速、便捷地獲得強(qiáng)大的強(qiáng)化學(xué)習(xí)訓(xùn)練能力。
目前,Nemotron 3 Nano已上線Hugging Face平臺(tái),并通過(guò)Baseten、Deepinfra、Fireworks、FriendliAI、OpenRouter、Together AI等推理服務(wù)商提供。
Nemotron還上線了多個(gè)企業(yè)級(jí)AI與數(shù)據(jù)基礎(chǔ)設(shè)施平臺(tái),包括Couchbase、DataRobot、H2O.ai、JFrog、Lambda 及 UiPath。Nemotron 3 Nano將通過(guò)Amazon Bedrock(無(wú)服務(wù)器模式)在亞馬遜云科技 (AWS) 平臺(tái)上提供給使用公有云的客戶,并且也即將支持Google Cloud、Coreweave、Crusoe、Microsoft Foundry、Nebius、Nscale及Yotta。
Nemotron 3 Nano同時(shí)以NVIDIA NIM形式提供,可以在英偉達(dá)加速基礎(chǔ)設(shè)施上進(jìn)行安全、可擴(kuò)展的部署,具有極高的隱私性與可控性。Nemotron 3 Super和Ultra預(yù)計(jì)將于 2026 年上半年推出。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。