訂閱
糾錯
加入自媒體

英偉達GTC:AI界春晚,滿心期待、掃興而歸?

2026-03-17 17:03
海豚研究
關注

2026年3月16日,英偉達創(chuàng)始人兼CEO黃仁勛在GTC 2026大會上發(fā)表主題演講,核心議題涵蓋CUDA平臺20周年、推理拐點與算力需求爆發(fā)、Vera Rubin系統(tǒng)架構、Groq集成、OpenClaw代理革命及物理AI與機器人。

一、GTC2026核心要點

1)數(shù)據(jù)中心營收展望:2025-2027年數(shù)據(jù)中心累計收入達到1萬億美元(去年GTC大會給的是2025-2026年累計收入5000億美元),符合預期。市場主流預期本身已經(jīng)提升至1萬億美元以上,更期待的是公司能給出明確訂單等方面的信息。

2)性能和成本:在tokens/watt(吞吐量)和token速度(智能度)兩個維度上,英偉達均為全球最高性能;英偉達的token成本全球最低。

3)數(shù)據(jù)中心成為"token工廠":每個工廠受限于功率(如1GW),需要管理token生產(chǎn)的吞吐量和速度。

token將像大宗商品一樣細分層級:免費層(高吞吐、低速度)->$3/百萬token層->$6/百萬token層->$45/百萬token層->$150/百萬token層(頂級低延遲、高帶寬算力)。

以1GW數(shù)據(jù)中心為例,每25%功率分配一個層級:Grace Blackwell可比Hopper生成5倍收入,Vera Rubin可再提升5倍。

4)Vera Rubin:在此前6類芯片基礎上,新增了Groq 3 LPU。

①Vera Rubin:100%液冷(45°C熱水冷卻),所有線纜取消,安裝時間從兩天縮短至兩小時;

②CPO(共封裝光學)Spectrum-X交換機:已全面量產(chǎn),與TSMC共同研發(fā);

③CPU:世界上唯一使用LPDDR5的數(shù)據(jù)中心CPU,獨立售賣,將成為數(shù)十億美元級業(yè)務;

Vera CPU Tray用于Agentic workload, 單個Vera Compute Tray集成了8顆Vera處理器, 每個處理器88核, 同時支持8通道的LPDDR5x內(nèi)存, 單個socket支持1.2TB/s的內(nèi)存帶寬。CPU Tray上集成了2塊BF4-DPU。

④Vera Rubin:已在Microsoft Azure上線運行(第一個rack)。英偉達供應鏈已可每周生產(chǎn)數(shù)千套系統(tǒng),每月數(shù)GW級AI工廠產(chǎn)能;

⑤Rubin Ultra:Rubin是橫向滑入機柜,Rubin Ultra要垂直放入新機架Kyber,其中144 GPU在一個NVLink域內(nèi),中板后方用NVLink交換機替代銅纜。

5)Groq 3 LPU(新增芯片):Groq和HBM并用,符合預期

技術來自于收購的Groq團隊,Groq LP30由三星制造,預計三季度發(fā)貨。

單顆Groq芯片500MB SRAM vs 單顆Rubin芯片288GB,Groq單獨無法承載主流大模型的參數(shù)和KV Cache。

解決方案:推出了一個Dynamo軟件,把推理步驟分解出來:

1. 預填充階段:也稱Prefill,也是模型批量處理用戶輸入的Prompt的階段,主要是以計算為主,因此在Vera Rubin上完成;

2. 解碼的注意力環(huán)節(jié):主要是計算當前產(chǎn)生的token與歷史tokens(KV Cache,對話存儲的記憶)的關系,是計算和存儲并重的工作性質,也是在Vera Rubin上完成,頻繁讀取Rubin上的HBM內(nèi)存單元。

3. 解碼的前饋網(wǎng)絡(FNN):在Attention環(huán)節(jié)確定上下文關系后,前饋網(wǎng)絡負責基于前Token來輸出下一個Token的概率分布,并選出下一Token,即“吐字”。

這個環(huán)節(jié)的每一層都要讀取模型的權重參數(shù),讀一次只能處理一個Token,原本參數(shù)放在HBM中,計算單元一直在等著數(shù)據(jù)從HBM搬運過來,這也是“內(nèi)存墻”的真正堵點。

把解碼分成用軟件拆出兩個階段后,等于把模型在工作的“上下文記憶”仍然保留在HBM上,但把大部分模型參數(shù)轉移到了Groq的SRAM上,芯片上內(nèi)嵌的存儲層SRAM能夠以極低的延遲讀取這些權重參數(shù),從而解決推理吐字慢的問題。

Rubin和Groq之間用以太網(wǎng)緊密耦合,RDMA特殊連接模式可以讓兩芯片之間的交互延遲降低約一半。

6)Feynman:全新GPU + LP40(LPU)+ Rosa CPU(以Rosalind命名)+ BlueField-5 + CX10。

Kyber銅纜scale-up + Kyber CPO scale-up(首次同時支持銅纜和CPO scale-up)。這意味即使在Feynman階段,也將同時支持銅和CPO的混合方式。

雖然英偉達長期看好CPO方案,但客戶方面傾向于將銅纜方案用到極致后再切換CPO(部署/維護更簡單)。

7)其他信息:

①太空數(shù)據(jù)中心:針對能源不足問題,英偉達宣布Vera Rubin Space-1,計劃將數(shù)據(jù)中心部署到太空(需解決輻射散熱問題,太空中無傳導和對流,僅有輻射);

②OpenClaw:每家SaaS公司將變成GaaS公司(Agent-as-a-Service)。

代理系統(tǒng)在企業(yè)網(wǎng)絡中可以訪問敏感信息、執(zhí)行代碼、對外通信——這需要企業(yè)級安全。英偉達與OpenClaw創(chuàng)始人Peter Steinberger合作推出NemoClaw(OpenClaw的企業(yè)安全參考設計),集成OpenShell技術,包含網(wǎng)絡護欄(network guardrail)和隱私路由器(privacy router),可連接各SaaS公司的策略引擎;

③物理AI與機器人:自動駕駛方面, 比亞迪/吉利/現(xiàn)代/日產(chǎn)等廠家加入Robtaxi, 并與Uber合作。然后機器人方面KUKA/ABB等廠商, 還有很多機器人/無人機平臺等。

總體來說,這次發(fā)布會,除了澄清了銅纜和CPO會并用,主要就是新加入了一個服務器中新加入了Groq的LPU選項。這個在Groq被買后,市場已有充分預期;甚至指引的三年一萬億美金收入,市場實際其實也已經(jīng)超過這個數(shù)字了。

整體上從英偉達的產(chǎn)品迭代可以看到:最近幾年的迭代重心不再芯片微架構的創(chuàng)新,從Hopper到Blackwell解決主要是組合和連接的問題,英偉達主要是完成了賣芯片到賣系統(tǒng)和服務的切換。

而從Blackwell到Rubin,無論是新加入的DPU(NAND芯片),還是這次新買來后緊急放進來的LPU(SRAM),主要完成的是AI進入推理和Agent時代,內(nèi)存墻的問題。 

二、英偉達的近況:大會指引平淡,需要“成長性新故事”

英偉達的股價表現(xiàn),在近半年的時間內(nèi)基本上一直都在170-200美元的區(qū)間內(nèi)震蕩。即便下游大廠增加資本開支、公司業(yè)績持續(xù)超預期,公司股價也沒能實現(xiàn)向上突破,主要是市場有以下幾方面擔心:

1)大廠資本開支持續(xù)性:Meta、谷歌等廠商都明確增加了2026年的資本開支,四大核心云廠商在2026年的資本開支有望達到6600億美元以上,同比增長60%。但值得注意的是,大廠資本開支在收入中的占比處于達到了相對較高的位置。

以Mete為例,公司預期2026年資本開支將達到1150-1350億美元,資本開支/年度收入將達到50%以上,進一步提升的空間相對有限。即使各家大廠增加了2026年的投入展望,但依然難以打消市場對后續(xù)資本開支增長持續(xù)性的擔心。

2)AI芯片市場份額:當前英偉達在AI芯片市場的份額維持在75%以上,較高的價格和“近乎壟斷”的市場結構,促使下游云廠商尋求“替代方案”。

在谷歌之外,博通AVGO已經(jīng)明確收獲了Anthropic、Open AI等的大額訂單,多個客戶也都開啟了自研方案。即便英偉達后續(xù)還有Rubin新品,但市場普遍預期公司在AI芯片市場的份額將逐步下滑。

3)產(chǎn)品競爭力:當前谷歌TPUv7在FP8等領域的表現(xiàn)大致已經(jīng)接近于英偉達的B200(2024年四季度量產(chǎn)),谷歌TPU大致落后于英偉達一年左右。

英偉達在Blackwell系列中引入了NVFP4 格式,能使推理性能在FP8的基礎上再翻一倍。但其實FP8滿足了當前市場大部分的需求,TPUv7已經(jīng)是一個“替代選項”。          

為了對抗行業(yè)競爭,英偉達正在通過戰(zhàn)略投資和算力擴容,來鎖死供應鏈上下游,比如說,以芯片部署為前提的戰(zhàn)略投資Open AI(300億美元)和Anthropic(100億美元)、為Meta旗下全新 AI 實驗室MSL提供數(shù)百萬塊GPU的算力支持,其中部分協(xié)議有一定的降價鎖定客戶需求的意味。

結合上述的市場擔心,公司估值也處于相對較低的位置。海豚君按照截止25-27自然年數(shù)據(jù)中心收入1.15萬億(高于公司目前指引的1萬億),英偉達當前市值(4.4萬億美元),對應2028財年(接近2027自然年)凈利潤約為13倍PE左右(假定營收兩年復合增速64%,毛利率72%,稅率18%)。

英偉達上季度交出了超預期的財報,但公司股價并未迎來上漲。這主要是因為2027年收入預期已經(jīng)全部打進去后,市場擔心下游云廠商在資本開支強度拉到50%以上的之后,進一步拉高資本開支的空間非常有限。

理論上,處于云廠商二級導上的英偉達,即使客戶資本開支高位維持,英偉達來自云客戶的收入會就變成零增長,市場不敢給2027年之后的英偉達高估值,導致英偉達當前只有27年利潤13X的PE,建籌的興趣也不高。

結合本次GTC大會的內(nèi)容來看,老黃給出的“至2027年數(shù)據(jù)中心累計收入達到1萬億美元以上”,其實市場預期早已拉到比這個數(shù)還更高一些。

會議中更多的時間,給到了英偉達的產(chǎn)品推銷和路線規(guī)劃,對產(chǎn)業(yè)鏈公司的影響更多(CPO和銅仍將混合使用、LPU與HBM分擔不同的工作),對公司自身的增量信息并不多。

未來英偉達公司的PE再次提升,海豚君認為除了AI應用上能夠更大規(guī)模、更快速度落地之后,還需要新的“成長曲線”來拉動,比如“Physic AI”、“太空算力”等。

本次GTC大會詳細內(nèi)容,海豚君會持續(xù)更新在長橋App「動態(tài)-深度(投研)」欄目,歡迎關注。

- END -

/轉載開白

本文為海豚研究原創(chuàng)文章,如需轉載請獲得授權。

/免責聲明及一般披露提示

本報告僅作一般綜合數(shù)據(jù)之用,旨在海豚研究及其關聯(lián)機構之用戶作一般閱覽及數(shù)據(jù)參考,並未考慮接獲本報告之任何人士之特定投資目標、投資產(chǎn)品偏好、風險承受能力、財務狀況及特別需求投資者若基於此報告做出投資前,必須諮詢獨立專業(yè)顧問的意見。任何因使用或參考本報告提及內(nèi)容或信息做出投資決策的人士,需自行承擔風險。海豚研究毋須承擔因使用本報告所載數(shù)據(jù)而可能直接或間接引致之任何責任或損失。本報告所載信息及數(shù)據(jù)基於已公開的資料,僅作參考用途,海豚研究力求但不保證相關信息及數(shù)據(jù)的可靠性、準確性和完整性。

本報告中所提及之信息或所表達之觀點,在任何司法管轄權下的地方均不可被作為或被視作證券出售邀約或證券買賣之邀請,也不構成對有關證券或相關金融工具的建議、詢價及推薦等。本報告所載資訊、工具及資料並非用作或擬作分派予在分派、刊發(fā)、提供或使用有關資訊、工具及資料抵觸適用法例或規(guī)例之司法權區(qū)或導致海豚研究及/或其附屬公司或聯(lián)屬公司須遵守該司法權區(qū)之任何註冊或申領牌照規(guī)定的有關司法權區(qū)的公民或居民。

本報告僅反映相關創(chuàng)作人員個人的觀點、見解及分析方法,並不代表海豚研究及/或其關聯(lián)機構的立場。

本報告由海豚研究製作,版權僅為海豚研究所有。任何機構或個人未經(jīng)海豚研究事先書面同意的情況下,均不得(i)以任何方式製作、拷貝、複製、翻版、轉發(fā)等任何形式的複印件或複製品,及/或(ii)直接或間接再次分發(fā)或轉交予其他非授權人士,海豚研究將保留一切相關權利。

       原文標題 : 英偉達GTC:AI界春晚,滿心期待、掃興而歸?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號