訂閱
糾錯
加入自媒體

賣鏟人的新戰(zhàn)事:黃仁勛眼中萬億美元的AI“Token工廠”

作者 | 王凌方

編輯 | 章漣漪

在GTC 2026舞臺上,英偉達(dá)CEO黃仁勛這次講演的重點不再是芯片,而是向全世界展示了一張圖——一張關(guān)于“工廠”的藍(lán)圖。

這座工廠不生產(chǎn)鋼鐵,不組裝汽車,它的產(chǎn)品是一種看不見摸不著的東西:Token。黃仁勛告訴在場所有人,到2027年,全球?qū)@座工廠產(chǎn)出的需求,將至少達(dá)到1萬億美元。“我確定,實際的計算需求會比這高得多。”

這是對2026財年四季報電話會他透露的增長路徑的具體回應(yīng),他用兩個小時拆解了這個需求。

至此,英偉達(dá)正式從一家“芯片公司”轉(zhuǎn)型為“AI基礎(chǔ)設(shè)施和工廠公司”。

當(dāng)然,芯片依然要升級,黃仁勛也在講演中,劇透了下一代架構(gòu)——Feynman,采用臺積1.6nm制程,引入光通信技術(shù),相比現(xiàn)有架構(gòu),將實現(xiàn)算力的大幅提升和能耗的顯著降低,這是支撐百萬倍算力需求的硬件核心。

01

英偉達(dá)的身份躍遷

“去年這個時候,我說過,我們看到了5000億美元的高確信度需求。現(xiàn)在,就在此時此地,我看到到2027年至少有1萬億美元的需求。”黃仁勛在演講時這樣說道。

不過,這次敘事邏輯變了,不是賣了多少GPU。他講的是如何建造低成本“Token工廠”。

“每一座數(shù)據(jù)中心、每一座工廠,從定義上來說都是受電力限制的。一座1GW的工廠永遠(yuǎn)不會變成2GW,這是物理和原子的定律。”黃仁勛說,“在固定的功率下,誰的每瓦Token吞吐量最高,誰的生產(chǎn)成本就最低。”

這是一個徹底的思維轉(zhuǎn)變:數(shù)據(jù)中心不再是存放文件的倉庫,而是生產(chǎn)Token的工廠。英偉達(dá)不再只是提供“生產(chǎn)設(shè)備”的供應(yīng)商,而是整座工廠的設(shè)計者、建設(shè)者和運維標(biāo)準(zhǔn)的制定者。

Vera Rubin系統(tǒng)的發(fā)布正是這一改變的體現(xiàn)。“過去提到Hopper,我會舉起一塊芯片,那很可愛。但提到Vera Rubin,大家想到的是整個系統(tǒng)。”黃仁勛說。

這個100%液冷、徹底消滅傳統(tǒng)線纜的系統(tǒng),將機架安裝時間從兩天縮短到兩小時。更關(guān)鍵的是,1吉瓦AI工廠的token生成速率將從200萬token/秒提升至7億token/秒,提升了350倍。作為對比,摩爾定律在同期的提升幅度,只有約1.5倍。

這不是“賣芯片”的邏輯,這是“賣整廠”的邏輯。

02

Token成為新石油

支撐這1萬億美元預(yù)期的,是黃仁勛提出的“Token工廠經(jīng)濟學(xué)”。

他將未來的AI服務(wù)劃分為五個商業(yè)層級:免費層(高吞吐、低速度)、中級層(約每百萬token3美元)、高級層(約每百萬token6美元)、高速層(約每百萬token45美元)、超高速層(約每百萬token150美元)。

“在這個Token工廠里,你的吞吐量和Token生成速度,將直接轉(zhuǎn)化為你明年的精確收入。”黃仁勛這樣說道。

這是一套將算力轉(zhuǎn)化為可定價商品的完整邏輯。Token成為像石油、電力一樣的“大宗商品”,而英偉達(dá)的架構(gòu),決定了客戶能以多低的成本生產(chǎn)這種商品。

以簡化模型估算,將25%占有率平均分配給四個層級,Grace Blackwell可比Hopper多產(chǎn)生5倍的收入。在最高價值的推理層級,性能提升達(dá)到驚人的35倍。

這正是黃仁勛所說的“成本最低的基礎(chǔ)設(shè)施”的真正含義。由于英偉達(dá)能運行幾乎所有領(lǐng)域的AI模型,這種通用性使得客戶投入的“基建”能夠被充分利用,并保持長久的生命周期。

目前,英偉達(dá)60%的業(yè)務(wù)來自全球前五大超大規(guī)模云服務(wù)商,剩余40%遍布區(qū)域云、主權(quán)云、企業(yè)、工業(yè)、機器人、邊緣計算等各個領(lǐng)域。“AI的覆蓋廣度本身就是其韌性所在,”黃仁勛說,“這毫無疑問是一次全新的計算平臺變革。”

03

硬件、軟件與生態(tài)的協(xié)同

英偉達(dá)的“鏟子”不是單一產(chǎn)品,而是一個硬件、軟件和生態(tài),三位一體的體系,更難取代。

硬件方面,Vera Rubin是一個完整的、端到端優(yōu)化的系統(tǒng),專為智能體(Agentic)工作負(fù)載設(shè)計。

全新Vera CPU是專為極高單線程性能設(shè)計,采用LPDDR5內(nèi)存,兼具卓越能效,是全球唯一使用LPDDR5的數(shù)據(jù)中心CPU,適合AI智能體工具調(diào)用。

存儲系統(tǒng)方面,BlueField 4+CX 9,面向AI時代的全新存儲平臺,全球存儲行業(yè)100%加入。

CPO Spectrum X交換機是全球首款共封裝光學(xué)以太網(wǎng)交換機,已全面量產(chǎn)。

Kyber機架是全新機架系統(tǒng),支持144塊GPU組成單一NVLink域,前端計算、后端NVLink交換,形成一臺巨型計算機。

Rubin Ultra作為下一代超算節(jié)點,豎插式設(shè)計,配合Kyber機架,支持更大規(guī)模NVLink互聯(lián)。

但更值得關(guān)注的,是英偉達(dá)對Groq的整合。

Groq芯片擁有500MB的SRAM,而一顆Rubin芯片擁有288GB的內(nèi)存。兩者特性截然不同。英偉達(dá)通過Dynamo軟件系統(tǒng),將需要海量計算和顯存的“預(yù)填充”階段交給Vera Rubin,將對延遲極度敏感的“解碼”階段交給Groq。

“如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高價值的編程級別的Token生成需求,拿出25%的數(shù)據(jù)中心規(guī)模給Groq。”黃仁勛給出了這樣的配置建議。

據(jù)透露,由三星代工的Groq LP30芯片已在量產(chǎn),預(yù)計今年第三季度出貨,而首個Vera Rubin機架已在微軟Azure云上運行。

軟件方面,二十年磨一劍的CUDA護城河。

“今年是CUDA誕生二十周年。”黃仁勛在演講中特別強調(diào)。

歷經(jīng)二十年,全球已積累數(shù)億塊運行CUDA的GPU和計算系統(tǒng),覆蓋所有云平臺,服務(wù)于幾乎所有計算機廠商和行業(yè)。

“裝機量吸引開發(fā)者,開發(fā)者創(chuàng)造新算法并取得突破,突破催生全新市場,新市場形成新生態(tài)并吸引更多企業(yè)加入,進而擴大裝機量——這個飛輪正在持續(xù)加速。”

這個飛輪帶來的直接結(jié)果是,英偉達(dá)GPU的實際使用價值極高。黃仁勛舉了一個反常識的例子:六年前發(fā)布的Ampere架構(gòu)GPU,其云端價格反而在上漲。

“原因顯而易見:NVIDIA CUDA上可運行的應(yīng)用極為豐富,涵蓋AI生命周期的每個階段、各類數(shù)據(jù)處理平臺,以及各種科學(xué)原理求解器。因此,一旦安裝了英偉達(dá)GPU,其使用價值極高。”

在結(jié)構(gòu)化數(shù)據(jù)處理方面,英偉達(dá)推出了cuDF和cuVS兩個基礎(chǔ)庫,與IBM、Dell、GoogleCloud達(dá)成合作,幫助Snapchat將計算成本降低近80%。在非結(jié)構(gòu)化數(shù)據(jù)方面,向量數(shù)據(jù)庫、PDF、視頻、音頻的處理能力,讓過去無法被利用的數(shù)據(jù)現(xiàn)在成為AI的養(yǎng)料。

生態(tài)方面,與云廠商的深度捆綁。

“英偉達(dá)與全球云服務(wù)商建立了特殊的合作關(guān)系——我們將客戶引入云端,這是一種互利共贏的生態(tài)。”

在GoogleCloud,英偉達(dá)加速VertexAI和BigQuery,與JAX/XLA深度集成,將Base10、CrowdStrike、Puma、Salesforce等客戶引入生態(tài)。

在AWS,英偉達(dá)加速EMR、SageMaker和Bedrock,今年更將把OpenAI引入AWS,幫助其擴展區(qū)域部署和計算規(guī)模。

在Microsoft Azure,英偉達(dá)100PFLOPS超算是第一臺部署在Azure上的超算,奠定了與OpenAI合作的重要基礎(chǔ)。英偉達(dá)GPU還是全球首批支持保密計算的GPU,可支持OpenAI和Anthropic模型在全球各地區(qū)云環(huán)境中的保密部署。

在Oracle,英偉達(dá)是第一個AI客戶。“我為能夠第一次向Oracle解釋AI云的概念感到自豪。”黃仁勛說。

此外,Core Weave成為全球第一家AI原生云,Palantir與Dell聯(lián)合打造了可在任何國家、任何氣隙隔離環(huán)境下完全本地化部署的AI平臺。

“英偉達(dá)是全球第一家垂直整合、橫向開放的公司。”黃仁勛這樣定義自己的戰(zhàn)略,“我們必須理解應(yīng)用,理解領(lǐng)域,深刻理解算法,并能夠?qū)⑵洳渴鹪谌魏螆鼍跋?mdash;—數(shù)據(jù)中心、云端、本地、邊緣乃至機器人系統(tǒng)。同時,英偉達(dá)保持橫向開放,愿意將技術(shù)整合進任何合作伙伴的平臺。”

04

重構(gòu)企業(yè)IT與職場規(guī)則

黃仁勛將開源項目OpenClaw形容為“人類歷史上最受歡迎的開源項目”,稱其僅用幾周時間就超越了Linux在過去30年取得的成就。他直言:“OpenClaw本質(zhì)上就是智能體計算機的操作系統(tǒng)。”

OpenClaw能夠管理資源,訪問工具、文件系統(tǒng)和大型語言模型,執(zhí)行調(diào)度和定時任務(wù),將問題逐步分解并調(diào)用子智能體,支持任意模態(tài)的輸入輸出。

“Windows讓個人計算機成為可能,OpenClaw讓個人智能體成為可能。”黃仁勛說,“每一家企業(yè)都需要制定自己的OpenClaw戰(zhàn)略,正如我們都需要Linux策略、HTML策略、Kubernetes策略一樣。”

這帶來的是一場企業(yè)IT的全面重塑。黃仁勛斷言:“每一個SaaS公司都將變成AaaS(智能體即服務(wù))公司。”

但智能體能夠訪問敏感數(shù)據(jù)、執(zhí)行代碼、與外部通信,這帶來了全新的安全挑戰(zhàn)。為此,英偉達(dá)與Peter合作,將安全性融入企業(yè)級版本,推出NeMoClaw參考設(shè)計和OpenShield安全層。

“這是企業(yè)IT的文藝復(fù)興,”黃仁勛說,“一個原本2萬億美元規(guī)模的產(chǎn)業(yè),即將成長為數(shù)萬億美元規(guī)模,從提供工具轉(zhuǎn)向提供專業(yè)化的AI智能體服務(wù)。”

他甚至描繪了未來職場的新形態(tài):“在未來,我們公司的每一位工程師都需要一個年度Token預(yù)算。他們的基礎(chǔ)年薪可能是幾十萬美元,我會在此基礎(chǔ)上再拿出大約一半的金額作為Token額度給他們,讓他們實現(xiàn)10倍效率提升。這已經(jīng)是硅谷的新招聘籌碼了:你的offer里帶多少Token?”

未來的軟件,不再是 “人操作工具”,而是 “智能代理與人協(xié)作”,而英偉達(dá)的技術(shù),就是為這種全新的軟件形態(tài)打造的核心支撐。

05

未來戰(zhàn)場:物理AI與機器人、太空數(shù)據(jù)中心

數(shù)字智能體在數(shù)字世界中行動,而物理AI則是具身化的智能體——機器人。

本次GTC共有110款機器人亮相,幾乎囊括全球所有機器人研發(fā)企業(yè)。

自動駕駛方面,黃仁勛宣布四家新合作伙伴加入英偉達(dá)Robotaxi Ready平臺:比亞迪、現(xiàn)代、日產(chǎn)、吉利,合計年產(chǎn)量1800萬輛。加上此前的奔馳、豐田、通用,陣容進一步壯大。同時與Uber達(dá)成重大合作,將在多個城市部署并接入RoboTaxi Ready車輛。

工業(yè)機器人方面,ABB、UniversalRobotics、KUKA等企業(yè)與英偉達(dá)合作,將物理AI模型與仿真系統(tǒng)相結(jié)合。

電信領(lǐng)域,卡特彼勒和T-Mobile也在合作之列。未來無線基站將不再是通信節(jié)點,而是NVIDIAAerialAIRAN——能夠?qū)崟r感知流量、調(diào)整波束成形,實現(xiàn)節(jié)能增效的智能化邊緣計算平臺。

特別引人注目的是與Disney合作的Olaf機器人亮相。這個在Omniverse中學(xué)會走路的雪人,基于NVIDIAWarp運行的Newton求解器(與Disney和DeepMind聯(lián)合開發(fā)),能夠適應(yīng)真實的物理世界。

“你能想象嗎?未來的迪士尼樂園——所有這些機器人角色在園區(qū)里自由漫步。”黃仁勛說。

而更令人遐想的是,英偉達(dá)正在進軍太空。Thor芯片已通過輻射認(rèn)證,正在衛(wèi)星中運行。此外,英偉達(dá)正在研發(fā)部署在太空的數(shù)據(jù)中心計算機“Vera Rubin Space-1”,徹底打開了AI算力向地球之外延伸的想象空間。

回望19世紀(jì)的淘金熱,賣鏟人賺到了最多的錢。但今天的英偉達(dá),遠(yuǎn)不止是賣鏟人。

它通過一系列技術(shù)革新和生態(tài)建設(shè),讓全世界相信:挖金子必須用它的鏟子。

在黃仁勛的敘事里,未來的每一家企業(yè)——無論是做模型的、做Agent的、造機器人的、開數(shù)據(jù)中心的——都將成為英偉達(dá)“Token工廠”體系中的一個車間。而黃仁勛,站在這個萬億工廠的總控室里,靜靜看著每一度電、每一枚Token,最終變成它的財報數(shù)字。

-END-

       原文標(biāo)題 : 賣鏟人的新戰(zhàn)事:黃仁勛眼中萬億美元的AI“Token工廠”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號