訂閱
糾錯
加入自媒體

GTC 2026|英偉達(dá)正在把整個世界變成 AI 算力網(wǎng)絡(luò)

芝能智芯出品

2026 年 3 月,NVIDIA GTC 在美國圣何塞 SAP Center 開幕。

這場大會過去幾年已經(jīng)從一個 GPU 技術(shù)會議,演變?yōu)槿?AI 產(chǎn)業(yè)的年度風(fēng)向標(biāo)。Hopper、Blackwell,每一次架構(gòu)發(fā)布幾乎都會重新定義 AI 計算的產(chǎn)業(yè)格局。今年發(fā)布的,是英偉達(dá)下一代計算平臺 Vera Rubin。

黃仁勛完整展示了英偉達(dá)未來三年的 AI 技術(shù)路線:從下一代芯片架構(gòu),到"AI 工廠"基礎(chǔ)設(shè)施,再到物理世界中的機器人、自動駕駛,甚至延伸到太空計算。

Part 1算力躍遷——Vera Rubin 與 AI 工廠

● Vera Rubin:不是一顆芯片,是一套系統(tǒng)

本次 GTC 最重要的發(fā)布,是英偉達(dá)下一代 AI 平臺 Vera Rubin。

理解這個發(fā)布,需要先糾正一個直覺:Vera Rubin 不是一顆 GPU,而是一整套計算系統(tǒng)架構(gòu)——包含 Vera CPU、Rubin GPU、BlueField-4 DPU、NVLink 互聯(lián)網(wǎng)絡(luò)、光子以太網(wǎng),以及 HBM4 高帶寬內(nèi)存。

每一個環(huán)節(jié)都是英偉達(dá)自研或深度整合的,整體設(shè)計邏輯是讓計算、存儲、網(wǎng)絡(luò)在系統(tǒng)層面協(xié)同優(yōu)化,而不是各自為政。

相比 Blackwell Ultra,Vera Rubin 平臺的 AI 推理性能將實現(xiàn)數(shù)倍提升,計算密度進一步提高,每 token 推理成本也將顯著下降。預(yù)計 2026 年下半年量產(chǎn)。單靠 GPU 算力的堆疊,已經(jīng)越來越難以解決 AI 計算的瓶頸。

真正的限制往往來自內(nèi)存帶寬、互聯(lián)延遲、以及計算與存儲之間的協(xié)調(diào)效率。Vera Rubin 的設(shè)計,正是針對這些瓶頸的系統(tǒng)級回應(yīng)。

● NVL144:一個機架就是一臺超算

在機架級部署上,英偉達(dá)推出了 NVL144 系統(tǒng),可以在單個機架內(nèi)集成 144 個 Rubin GPU 與 Vera CPU 節(jié)點。整體推理性能達(dá)到 3.6 ExaFLOPS 級別。2012 年全球最快的超級計算機 Titan,峰值算力約為 27 PetaFLOPS。NVL144 的推理算力,超過了 100 臺 Titan 疊加在一起。

當(dāng)然,浮點運算精度的定義不同,這個對比并不嚴(yán)格,但它仍然說明了一件事:AI 計算的密度正在進入一個從前只有國家級超算才能觸及的規(guī)模區(qū)間,而現(xiàn)在一個標(biāo)準(zhǔn)機架就能實現(xiàn)。

● AI 工廠:數(shù)據(jù)中心的定義被重寫

黃仁勛反復(fù)使用"AI Factory"這個詞,這是一個重新定義數(shù)據(jù)中心功能的概念框架。

傳統(tǒng)數(shù)據(jù)中心的核心功能是存儲數(shù)據(jù)、運行軟件。而 AI 工廠的核心功能是生產(chǎn) token——訓(xùn)練和推理模型,持續(xù)輸出計算結(jié)果。

計算能力在這個框架下變成了一種類似電力的工業(yè)資源,可以被量化、被售賣、被按需調(diào)度。

圍繞這一概念,英偉達(dá)推出了 DSX AI Factory 參考架構(gòu),提供從服務(wù)器設(shè)計、網(wǎng)絡(luò)拓?fù)涞诫娏ι岬耐暾麛?shù)據(jù)中心方案。

配套的 Omniverse AI Factory Blueprint 則通過數(shù)字孿生技術(shù),允許在虛擬環(huán)境中提前模擬整個數(shù)據(jù)中心的運行狀態(tài)——功耗分布、GPU 負(fù)載調(diào)度、網(wǎng)絡(luò)瓶頸——在建設(shè)之前就完成優(yōu)化。

這是一種工業(yè)設(shè)計的思維方式:像設(shè)計汽車或芯片一樣設(shè)計數(shù)據(jù)中心。

● 從訓(xùn)練到推理:算力需求的結(jié)構(gòu)性轉(zhuǎn)移

是 AI 產(chǎn)業(yè)正在從訓(xùn)練時代進入推理時代,過去幾年,絕大多數(shù) AI 算力消耗在訓(xùn)練大模型上。

但隨著模型能力趨于穩(wěn)定,未來的計算增量將更多來自推理——也就是把模型部署到真實世界中,為 AI 搜索、AI 助手、自動駕駛、企業(yè)代理持續(xù)提供服務(wù)。

推理與訓(xùn)練的需求特征完全不同:低延遲、高并發(fā)、長時間運行。

英偉達(dá)發(fā)布了 Groq 3 LPX 系統(tǒng),結(jié)合 Rubin 架構(gòu) GPU 與專用推理處理器,目標(biāo)是實現(xiàn)每秒 700M tokens 的吞吐能力,相比上一代架構(gòu)提升超過 350 倍。

訓(xùn)練是建造工廠,推理是開動生產(chǎn)線。英偉達(dá)這次 GTC,重心已經(jīng)從前者轉(zhuǎn)向后者。

Part 2AI 走進物理世界

● 自動駕駛:從軟件到鋼鐵的跨越

加入英偉達(dá)自動駕駛生態(tài)的車企包括比亞迪、吉利、現(xiàn)代、日產(chǎn),覆蓋了中日韓三大汽車工業(yè)體系——自動駕駛的"英偉達(dá)化"正在從軟件滲透進整車供應(yīng)鏈。

英偉達(dá)在自動駕駛領(lǐng)域的核心價值不是攝像頭或雷達(dá),而是仿真體系。通過 Omniverse 平臺構(gòu)建的虛擬駕駛環(huán)境,可以生成數(shù)以億計的訓(xùn)練場景,覆蓋真實道路上極難遇到的長尾情況。

這是一套用算力換安全邊際的邏輯,而英偉達(dá)正是這套邏輯的基礎(chǔ)設(shè)施提供者。

● 機器人:Physical AI Data Factory

機器人是本次 GTC 篇幅最長的物理 AI 場景之一。

ABB、KUKA、Universal Robots 等工業(yè)機器人廠商宣布加入英偉達(dá)生態(tài),而背后的基礎(chǔ)設(shè)施是英偉達(dá)發(fā)布的 Physical AI Data Factory——專門用于訓(xùn)練機器人視覺和控制模型的數(shù)據(jù)生產(chǎn)體系。

這套體系解決的是機器人 AI 訓(xùn)練中最棘手的問題:真實世界數(shù)據(jù)太稀缺,且難以覆蓋所有工況。

通過數(shù)字孿生環(huán)境大規(guī)模合成訓(xùn)練數(shù)據(jù),可以顯著降低機器人進入新場景的開發(fā)成本。這與自動駕駛的邏輯如出一轍——英偉達(dá)在用同一套基礎(chǔ)設(shè)施框架,打通從駕駛到制造的物理 AI 版圖。

● DLSS 5:神經(jīng)渲染重寫圖形學(xué)

英偉達(dá)此次也沒有忽視傳統(tǒng)優(yōu)勢領(lǐng)域。

DLSS 5 引入了神經(jīng)渲染(Neural Rendering)概念,將 AI 模型直接引入圖像生成流程,用于處理人物面部紋理、頭發(fā)細(xì)節(jié)、布料材質(zhì)等傳統(tǒng)光柵化管線難以高效渲染的內(nèi)容。

傳統(tǒng)游戲渲染的流程是幾何→光照→材質(zhì)→像素,每一步都是確定性的數(shù)學(xué)計算。而神經(jīng)渲染允許 AI 在這個流程中直接參與生成,以更低的算力代價輸出更高質(zhì)量的畫面。

英偉達(dá)將其定位為自實時光線追蹤以來圖形學(xué)最大的一次技術(shù)躍遷,預(yù)計 2026 年秋季正式推出。

● 太空計算:軌道數(shù)據(jù)中心

英偉達(dá)展示了 Space-1 Vera Rubin Module——一個將 AI 計算部署到軌道數(shù)據(jù)中心的計劃,通過太陽能供電實現(xiàn)高性能 AI 計算,并與地面保持低延遲通信。

這個方向目前仍處于早期,但其邏輯值得關(guān)注:隨著 AI 對算力的需求持續(xù)增長,地面數(shù)據(jù)中心在土地、電力、散熱上的限制將日益明顯,而軌道計算提供了一種從物理約束中突破的可能性。

英偉達(dá)選擇在 GTC 上提出這個方向,更多是在宣示邊界——AI 基礎(chǔ)設(shè)施的版圖,不止于地球表面。

Part 3英偉達(dá)在賭什么

● 從 GPU 公司到 AI 操作系統(tǒng)

如果回顧英偉達(dá)過去十年的戰(zhàn)略演進,可以看到一條非常清晰的路徑:GPU 計算→AI 訓(xùn)練平臺→AI 基礎(chǔ)設(shè)施→AI 操作系統(tǒng)。每一次升級,英偉達(dá)都在向更高的軟件層移動,同時把更多的硬件能力納入自己的生態(tài)控制范圍。

CUDA 是這個戰(zhàn)略的起點,它讓英偉達(dá)的 GPU 成為 AI 研究的事實標(biāo)準(zhǔn)。

NVLink 和 InfiniBand 是下一步,它讓多 GPU 系統(tǒng)的組織方式進入英偉達(dá)的設(shè)計管轄。

Vera Rubin 是這條路線的最新延伸:CPU、GPU、DPU、互聯(lián)網(wǎng)絡(luò),全部自研或深度整合,整個計算系統(tǒng)成為英偉達(dá)可以定義和優(yōu)化的對象。

"It all starts here." 這句話的含義比聽起來更深:英偉達(dá)正在把自己定義為 AI 時代的計算原點,而不只是供應(yīng)商。

2025 至 2027 年,AI 硬件市場規(guī)模將達(dá)到 1 萬億美元,而英偉達(dá)預(yù)計將在 Blackwell 和 Rubin 平臺上拿下其中相當(dāng)大的份額。

這個數(shù)字是否成立,取決于幾個前提:AI 推理需求是否真如預(yù)期爆發(fā),數(shù)據(jù)中心資本支出是否持續(xù)增加,以及英偉達(dá)的市場份額能否在競爭中守住。

目前英偉達(dá)的 AI 生態(tài)已經(jīng)覆蓋 AWS、Google Cloud、Microsoft、Oracle 等主要云廠商,以及自動駕駛、醫(yī)療、機器人、制造等垂直行業(yè)。但這個生態(tài)的穩(wěn)定性,正在被越來越多的挑戰(zhàn)者測試。

● 競爭格局:沉默的對手們

本次 GTC,英偉達(dá)的競爭對手們保持了相對低調(diào)。但這并不意味著威脅在消退。

◎ AMD MI400 系列正在向英偉達(dá)的高端推理市場發(fā)起進攻,在某些特定工作負(fù)載上已經(jīng)具備競爭力。

◎ Google 的 TPU v5 和 AWS Trainium 2 則代表了另一條路線——超大規(guī)模云廠商正在用自研芯片替代外購 GPU,從英偉達(dá)的最大客戶逐漸變成潛在的競爭者。

這種"既是買家又是對手"的結(jié)構(gòu)性矛盾,是英偉達(dá)未來幾年最難處理的戰(zhàn)略問題之一。

Vera Rubin 平臺的核心硬件之一是 HBM4 高帶寬內(nèi)存,而這個市場目前由三家公司控制:SK 海力士、三星、美光。

HBM 的供應(yīng)能力直接決定了 AI 芯片的產(chǎn)能天花板。過去兩年 Blackwell 的供貨緊張,部分原因正是 HBM 產(chǎn)能的制約。隨著 Vera Rubin 量產(chǎn),這場圍繞高帶寬內(nèi)存的供應(yīng)鏈博弈將進一步加劇。

誰能在 HBM4 上率先實現(xiàn)大規(guī)模量產(chǎn),將直接影響英偉達(dá)乃至整個 AI 算力市場的爬坡速度。這是 GTC 臺上沒有被提及,但臺下最多人在談的話題。

小結(jié)

GTC 每年都在用新的詞匯描述一個更大的野心。從 GPU 到加速計算,從加速計算到 AI 工廠,從 AI 工廠到物理 AI,再到軌道數(shù)據(jù)中心,每一次擴張,英偉達(dá)都在把"計算"這個詞的邊界往外推。

       原文標(biāo)題 : GTC 2026|英偉達(dá)正在把整個世界變成 AI 算力網(wǎng)絡(luò)

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號