英偉達(dá)Rubin平臺量產(chǎn):六芯片協(xié)同,推理成本驟降10倍
當(dāng)?shù)貢r間1月5日,英偉達(dá)在CES2026展會上發(fā)布了NVIDIA Rubin平臺,正式開啟了下一代人工智能時代包含六款全新芯片,旨在打造一臺性能卓越的人工智能超級計算機(jī)。

作為繼Hopper、Blackwell之后的最新一代AI計算平臺,NVIDIA Rubin不僅是一次硬件升級,更是一場由六款全新芯片深度協(xié)同構(gòu)建的系統(tǒng)級革命。其核心目標(biāo)直指當(dāng)前AI發(fā)展的最大瓶頸:高昂的推理成本與訓(xùn)練效率。
據(jù)英偉達(dá)方面數(shù)據(jù),Rubin平臺可將每個Token的推理成本降低高達(dá)10倍,訓(xùn)練混合專家(MoE)模型所需的GPU數(shù)量減少至四分之一。
Rubin平臺的突破性在于其“全棧協(xié)同設(shè)計”理念——不再孤立優(yōu)化單一芯片,而是將Vera CPU、Rubin GPU、NVLink 6交換機(jī)、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6以太網(wǎng)交換機(jī)六大組件無縫集成,形成一臺性能驚人的AI超級計算機(jī)。
“Rubin的推出恰逢其時,因為人工智能的訓(xùn)練和推理計算需求正呈爆炸式增長,”英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示。“憑借我們每年推出新一代人工智能超級計算機(jī)的節(jié)奏,以及六款全新芯片的深度協(xié)同設(shè)計,Rubin的推出標(biāo)志著我們向人工智能的下一個前沿領(lǐng)域邁出了巨大的一步。”
Rubin平臺以美國先驅(qū)天文學(xué)家Vera Florence Cooper Rubin的名字命名,她的發(fā)現(xiàn)改變了人類對宇宙的理解。該平臺包括NVIDIA Vera Rubin NVL72機(jī)架式解決方案和NVIDIA HGX Rubin NVL8系統(tǒng)。
英偉達(dá)介紹,Rubin平臺旨在滿足復(fù)雜AI工作負(fù)載的需求,其五項突破性技術(shù)包括:
第六代 NVIDIA NVLink:提供當(dāng)今大規(guī)模MoE模型所需的快速、無縫的GPU間通信。每個GPU提供3.6TB/s的帶寬,而Vera Rubin NVL72機(jī)架則提供260TB/s的帶寬——比整個互聯(lián)網(wǎng)的帶寬還要大。NVIDIA NVLink 6交換機(jī)內(nèi)置網(wǎng)絡(luò)內(nèi)計算能力,可加速集體操作,并新增多項功能以增強(qiáng)可維護(hù)性和彈性,從而實現(xiàn)更快、更高效的大規(guī)模AI訓(xùn)練和推理。
NVIDIA Vera CPU:專為智能推理而設(shè)計,NVIDIA Vera是面向大規(guī)模AI工廠的最高效能CPU。這款NVIDIA CPU采用88 個 NVIDIA定制Olympus內(nèi)核,完全兼容Armv9.2架構(gòu),并具備超高速NVLink-C2C連接。Vera提供卓越的性能、帶寬和業(yè)界領(lǐng)先的能效,可支持各種現(xiàn)代數(shù)據(jù)中心工作負(fù)載。
NVIDIA Rubin GPU: Rubin GPU采用第三代Transformer引擎,具備硬件加速自適應(yīng)壓縮功能,可為AI推理提供50 petaflops的NVFP4計算能力。
第三代NVIDIA機(jī)密計算:Vera Rubin NVL72是首個提供NVIDIA機(jī)密計算的機(jī)架級平臺,可在CPU、GPU和NVLink域中維護(hù)數(shù)據(jù)安全,從而保護(hù)全球最大的專有模型、訓(xùn)練和推理工作負(fù)載。
第二代RAS引擎:Rubin平臺涵蓋GPU、CPU和NVLink,具備實時健康檢查、容錯和主動維護(hù)功能,可最大限度地提高系統(tǒng)效率。機(jī)架采用模塊化、無線纜托盤設(shè)計,組裝和維護(hù)速度比Blackwell快18倍。
目前,NVIDIA Rubin已全面投入生產(chǎn),基于Rubin的產(chǎn)品將于2026年下半年通過合作伙伴推出。
盡管Rubin尚未正式出貨,但已獲得全球頂級生態(tài)支持。AWS、谷歌云、微軟Azure、甲骨文OCI四大云廠商將于2026年下半年率先上線Rubin實例;CoreWeave、Lambda、Nebius等AI原生云服務(wù)商同步跟進(jìn)。微軟更宣布在其下一代“Fairwater AI超級工廠”中大規(guī)模部署Vera Rubin NVL72系統(tǒng),支撐其Copilot+生態(tài)。
硬件方面,戴爾、HPE、聯(lián)想、超微、思科等服務(wù)器廠商將推出基于Rubin的HGX NVL8(8-GPU)和DGX SuperPOD參考架構(gòu),覆蓋從企業(yè)私有云到國家級AI實驗室的全場景需求。