被捧高的CPO，沒那么神

2025-07-25 18:15

隨著AI 技術尤其是大語言模型的快速發(fā)展，AI 算力需求呈爆發(fā)式增長。OpenAI 測算顯示，全球 AI 訓練算力需求每 3.4 個月翻一番，2012 年以來已增長超 500,000 倍。這種迅猛的增長態(tài)勢對數據中心的算力和數據傳輸能力帶來了前所未有的挑戰(zhàn)。數據中心作為 AI 算力的承載核心，需要處理海量的數據，這使得其內部的數據流量呈指數級增長。例如，大規(guī)模的 AI 訓練集群中，服務器之間需要頻繁地交換大量的數據，以支持模型的訓練和優(yōu)化。傳統(tǒng)的數據傳輸方式在面對如此巨大的數據流量時，逐漸顯露出其局限性。

光模塊作為數據中心中實現光電信號轉換的關鍵組件，其性能直接影響著數據傳輸的速率、容量和效率。在高算力需求的背景下，傳統(tǒng)光模塊面臨著諸多挑戰(zhàn)。

隨著數據量的不斷增加，對光模塊的傳輸速率要求越來越高。從早期的10G、25G，到如今的 100G、400G，甚至向 1.6T 及更高速率邁進，傳統(tǒng)光模塊在提升速率方面遇到了技術瓶頸。其次，高速率傳輸帶來的高功耗問題也日益突出。高功耗不僅增加了數據中心的運營成本，還對散熱系統(tǒng)提出了更高的要求，增加了數據中心的建設和維護難度。此外，傳統(tǒng)光模塊在尺寸和集成度方面也難以滿足數據中心日益緊湊的布局需求。為了應對這些挑戰(zhàn)，共封裝光學（CPO）技術應運而生。

01優(yōu)勢亮眼，短板也明顯

CPO其核心在于將光引擎與交換芯片通過先進的封裝技術集成在同一基板上。在傳統(tǒng)的可插拔光模塊方案中，光模塊通過可插拔接口與交換機的印刷電路板（PCB）相連，電信號需要經過數厘米長的 PCB 走線才能到達光模塊進行光電轉換。這一過程中，電信號會受到 PCB 走線的電阻、電容和電感等因素的影響，導致信號衰減、失真和延遲增加。而 CPO 技術通過將光引擎與交換芯片緊密集成，極大地縮短了電信號在芯片和光引擎之間的傳輸距離，通�？蓪鬏斁嚯x縮短至毫米級。這種短距離的傳輸方式能夠有效減少信號在傳輸過程中的損耗和干擾，提高信號的完整性和傳輸質量。

但其目前也存在著一些短板。

技術上還不夠成熟，導致成本一直下不來，這是個大問題�，F在產業(yè)鏈還有不少難關要過：臺積電的硅光晶圓良率才 65%，光迅科技測試發(fā)現，CPO 模塊端到端的耦合損耗波動有 ±2dB，比可插拔模塊的 ±0.5dB 差遠了。這些技術問題直接讓單個模塊的生產成本比老方案高 3-5 倍，1.6T 端口的 CPO 方案總成本要 2800 美元一個端口，是可插拔模塊的 2.3 倍。就算以后量產規(guī)模上去了，想把成本差距縮小，估計也得 3-5 年。

運維方面的變化也是個麻煩事。因為不能像傳統(tǒng)光模塊那樣隨便插拔，CPO 模塊少了即插即用的方便。Facebook 模擬測試過，用 CPO 架構的話，得多配 30% 的冗余交換芯片來應對故障，這樣一來，總體成本就得多花 18%。思科也研究過，CPO 模塊壞了，平均要 72 小時才能修好，是可插拔模塊的 6 倍。對于那些要求 99.999% 可用性的金融數據中心來說，這是致命的問題，搞不好一小時就得損失幾十萬美元。

還有就是行業(yè)標準太亂，也拖慢了 CPO 產業(yè)化的腳步。現在 CPO 領域有 COBO、OIF、OpenEye 等好幾個標準陣營，封裝尺寸從 35mm×35mm 到 58mm×58mm 不等，供電規(guī)范從 3.3V 到 12V 都有，熱管理方案里液冷占比也從 30% 到 100% 不一樣。這種混亂讓設備商十分頭疼，得為不同方案開發(fā)適配接口，研發(fā)成本平白多了 40% 以上。比如有頭部交換機廠商，為了兼容三種主流標準，光測試環(huán)節(jié)就多花了 2000 萬美元，這顯然會拖慢技術落地的速度。

02誰在主導CPO？

在 CPO 技術的研發(fā)和應用方面，眾多行業(yè)巨頭積極布局，發(fā)揮著引領作用。

AMD 與 Ranovus 的合作始于 CPO 技術的早期探索。2020 年 OFC 上，Ranovus 首次展示了基于多波長量子點激光器（QDL）和磁共振器技術的 Odin 系列硅光子學引擎，其功耗和成本較當時的替代方案顯著降低。2021 年，Ranovus 推出第二代 CPO 光學引擎，采用模擬驅動方法消除重定時器需求，進一步優(yōu)化成本與功耗，并將相關元件集成到單個電子光子 IC 中。2022 年，雙方合作展示了 Xilinx Versal 自適應計算加速平臺的 CPO 實現，利用 Odin 800-Gbps CPO 2.0 技術，簡化電路板布線并降低功耗。到 2023 年 OFC，兩家公司又演示了 Versal 自適應 SoC 與 Odin 800G 直接驅動光學引擎及第三方模塊的互操作性，其光學引擎基于 GlobalFoundries 的硅光子平臺構建，為超大規(guī)模數據中心的 AI/ML 工作負載提供了靈活且低功耗的解決方案。

博通則積極推動 CPO 技術從交換機側向服務器側滲透。2021 年，博通提前宣布了配備 CPO 光學器件的下一代交換芯片系列，包括計劃于 2022 年底上市的 25.6Tb Humboldt 和后續(xù)的 51.2T Bailly，并提及與 CPU、GPU 共同封裝的未來規(guī)劃。2023 年 OFC 上，博通展示了基于 Tomahawk5 的 51.2T Bailly CPO 原型系統(tǒng)和基于 Tomahawk4 的 25.6T Humboldt CPO 系統(tǒng)，其全 CMOS EIC 集成了低功耗 TIA 和光學 MUX/DEMUX，將光引擎帶寬提升至 6.4T，顯著降低光互連功率。2024 年 3 月，博通向客戶交付了業(yè)界首臺 51.2T CPO 以太網交換機，集成 8 個 6.4Tbps 硅光子學光學引擎與 Tomahawk 5 交換芯片，功耗較可插拔光模塊解決方案大幅降低，未來還計劃將 CPO 技術拓展至算力芯片，追求更高帶寬。

思科對 CPO 技術的落地節(jié)奏有著明確判斷，認為其三大支柱在于移除部分 DSP 以節(jié)省電力、采用遠程光源和依托生產驗證的硅光子學平臺，這些創(chuàng)新可將連接所需功率降低最多 50%，使固定系統(tǒng)總功率降低 25-30%。2023 年 OFC 上，思科的 CPO 演示展現了關鍵技術優(yōu)勢，其在硅光子學 IC 上實現了 400G FR4 所需的多路復用 / 解復用器，解決了光學元件小型化難題，能支持多種數據中心光學器件類型。思科預計，CPO 的試用部署將與 51.2Tb 交換周期同步，在 101.2Tb 交換周期實現更大規(guī)模應用。

IBM 與 Finisar 合作開發(fā)的 MOTION 項目，以獨特的激光光源 2:1 冗余備份設計為亮點，適用于 LGA 及焊接式組裝，旨在提升系統(tǒng)整體可靠性，與博通采用的外置可插拔光源方案形成差異。

英特爾自 2020 年起布局 CPO，以光計算互連（OCI）為最終目標。憑借在硅光子學領域的深厚積累，英特爾專注于可插拔光收發(fā)器和微環(huán)調制器技術研發(fā)，并利用自身獨特的硅光子學工藝平臺開發(fā)基于微環(huán)調制器的 CPO 系統(tǒng)。

Marvell 的 CPO 技術平臺兼顧可插拔與共封裝需求。2022 年 OFC 上，其第一代云優(yōu)化 CPO 平臺亮相，整合 2.5D/3D 高度集成硅光子學元件，包括激光器、TIA、驅動器及 PAM4 DSP，為 51.2T 交換機的 3.2T CPO 平臺奠定基礎。2023 年，Marvell 展示的新型每通道 200G 硅光子學光引擎，集成數百個組件，可靈活作為可插拔光學模塊或 CPO 光學解決方案。

英偉達作為 GPU 領域領導者，同時布局交換機側及 GPU 側 CPO。其首席科學家 Bill Dally 在 2022 年 OFC 演講中，詳細闡述了采用密集波分復用（DWDM）的共封裝光學器件目標，以及利用硅光子學交叉連接不同機架 GPU 計算引擎的構想。英偉達與 AyarLabs 合作，致力于開發(fā)高帶寬、低延遲、超低功耗的光互連技術，以支持 AI/ML 架構的橫向擴展，應對數據量快速增長的需求。

臺積電則通過推出 COUPE 光學平臺布局 CPO 領域。在 2024 年北美技術研討會上，臺積電介紹了基于硅光子的解決方案，目標是實現高達 12.8 Tbps 的帶寬。其 COUPE 引擎采用 SoIC-X 封裝技術，將 65nm 電子集成電路（EIC）與光子集成電路（PIC）結合，憑借低阻抗的 SoIC-X 互連實現高效用電，為數據中心未來的高帶寬需求提供關鍵技術支撐。

03棋逢對手

面對 CPO 技術的競爭，傳統(tǒng)可插拔模塊也在不斷創(chuàng)新，以提升自身性能。

在速率突破層面，可插拔模塊通過高階調制與集成技術的協(xié)同，穩(wěn)步向 1.6T 及以上速率演進。16QAM 等調制方式提升單波長數據密度，硅光子集成技術將光引擎尺寸壓縮至標準封裝范圍內，使模塊在保持 2km 級跨機架傳輸能力的同時，無需對現有數據中心的物理布線架構進行改造。這種技術路徑的核心在于，在不打破成熟封裝標準的前提下實現速率躍遷，其背后是對存量數據中心升級成本的精準控制 —— 避免因架構重構導致的額外投入，這對于中大型數據中心的平滑過渡具有不可替代的價值。

功耗優(yōu)化的邏輯則體現了技術選擇的務實性。不同于 CPO 通過縮短電信號路徑實現的極致降耗，可插拔模塊聚焦于現有架構下的能效提升：通過動態(tài)功率管理算法匹配數據流量波動，新型低熱阻封裝材料降低熱耗散損耗，配合低功耗激光器驅動電路設計，在中短距離傳輸場景中實現單位帶寬功耗的階梯式下降。這種優(yōu)化雖未觸及傳輸距離的物理限制，卻在技術成熟度與能效比之間找到了平衡，尤其適合對改造成本敏感的規(guī)�；渴饒鼍�。

未來，這兩種技術并非“非此即彼” 的替代關系，而是將在數據中心的 “層級化網絡” 中各司其職：CPO 憑借低延遲、高集成優(yōu)勢，主導機架內部的高密度互聯(lián)；可插拔模塊則依托靈活性與兼容性，覆蓋跨機架、跨機房的中遠距離傳輸。這種 “分層共存” 的格局，將推動光互連技術向更細分、更高效的方向演進。

同時，為了兼顧可維護性和能效提升，一些混合架構方案開始興起。英偉達在Grace Hopper 超算中采用的 “可插拔 CPO” 架構頗具啟示，通過標準化光電接口，實現光引擎與交換芯片的物理分離但電氣直連。這種設計在保持可維護性的同時，將能效提升至 2.1pJ/bit，為技術過渡提供了新思路。這種混合架構方案在一定程度上融合了可插拔模塊和 CPO 的優(yōu)勢，可能會在未來的市場中占據一席之地。

04結語

在這場“量變”引發(fā)“質變”的技術革命中，共封裝光學（CPO）技術憑借其在傳輸速率、功耗及集成度方面的巨大潛力，無疑成為了萬眾矚目的焦點。

然而，正如本文所闡述的，CPO技術的產業(yè)化之路并非一片坦途，其在技術成熟度、成本控制、運維模式以及行業(yè)標準統(tǒng)一等方面仍面臨嚴峻挑戰(zhàn)。硅光晶圓良率、耦合損耗控制、高昂的初期投入、復雜的故障維護以及標準的混亂，都是橫亙在CPO大規(guī)模商用化面前的“攔路虎”。這些挑戰(zhàn)意味著CPO的全面普及可能還需要3-5年甚至更長時間的技術攻堅與產業(yè)鏈協(xié)同。

原文標題 : 被捧高的CPO，沒那么神