123,123,123

“中國(guó)版Figure AI”，殺出四位候選玩家

2025-10-09 16:04

編者按：

具身智能并非單一技術(shù)的突破，而是一場(chǎng)由資本、工程與場(chǎng)景合力推動(dòng)的全球浪潮。這正如五百年前的地理大發(fā)現(xiàn)，我們正在智能的驅(qū)動(dòng)下，重新繪制物理世界的邊界。

星河頻率特別策劃「具身智能大航�！瓜盗形恼拢⒆闳蛞曇�，錨定通用機(jī)器人、陪伴機(jī)器人、機(jī)器狗、機(jī)器人大模型等核心賽道，深度剖析行業(yè)內(nèi)的頭號(hào)玩家們。

以「大航�！篂槊�，記錄探索者們?nèi)绾务{馭算法、硬件與資本的浪潮，尋找屬于自己的新大陸。

正如每一次大航海都重塑世界格局，具身智能的征程也在重新定義機(jī)器與人的關(guān)系、技術(shù)與社會(huì)的關(guān)系。在這個(gè)系列里，我們不僅關(guān)注誰(shuí)能率先靠岸，更關(guān)心誰(shuí)在指引航向、如何穿越泡沫、何處才有真正值得登陸的未來(lái)。

往期文章：《具身智能百億俱樂(lè)部，全球已有 10 位玩家》

作者 | 毛心如

前不久，F(xiàn)igure AI 用 10 億美元融資，390 億美元估值，為具身智能行業(yè)樹(shù)立了新的里程碑。短短三年，這家公司成為了全球估值最高的初創(chuàng)具身智能公司。

一時(shí)間，F(xiàn)igure AI 也被部分媒體戲稱(chēng)為「美國(guó)版宇樹(shù)」。如果分析這個(gè)標(biāo)簽的評(píng)判標(biāo)準(zhǔn)，其實(shí)不難發(fā)現(xiàn)是基于兩家公司在公眾話(huà)題討論度來(lái)評(píng)定的。而從技術(shù)路線(xiàn)角度，兩家公司顯然有著很大的差別。

宇樹(shù)是典型的「硬件派」公司，其當(dāng)前營(yíng)收的 65% 來(lái)自四足機(jī)器狗業(yè)務(wù)；Figure AI 則是全棧式軟硬一體的公司，硬件端其擁有自研機(jī)器人本體、電池、傳感器等核心部件，軟件端 Helix 機(jī)器人大腦可以支持機(jī)器人完成疊毛巾、包裹分揀等任務(wù)。

毫無(wú)疑問(wèn)，目前任何一家公司想在人形機(jī)器人市場(chǎng)里擁有絕對(duì)的統(tǒng)治力，必須在軟件和硬件上都有絕對(duì)的實(shí)力。正因如此，眾多公司正在積極補(bǔ)齊短板，以增強(qiáng)市場(chǎng)競(jìng)爭(zhēng)力。

而像 Figure AI 這種在「大腦+硬件+資金」都實(shí)力雄厚的公司，也成為了海內(nèi)外具身智能公司對(duì)標(biāo)的對(duì)象。

在這場(chǎng)由中美主導(dǎo)的具身智能競(jìng)賽中，中國(guó)也涌現(xiàn)出四位潛力玩家，有望成為「中國(guó)版 Figure AI」，它們分別是：銀河通用、星動(dòng)紀(jì)元、千尋智能和星塵智能。

星塵智能、千尋智能：大腦端的突圍

在具身智能的世界里，往往硬件的迭代是最清晰的，也是最容易被拆解的，但是決定機(jī)器人智能上限的，是軟件和模型。

換句話(huà)說(shuō)，即便造出再漂亮的手臂與關(guān)節(jié)，沒(méi)有聰明的大腦、小腦與關(guān)節(jié)打配合，機(jī)器人在復(fù)雜真實(shí)世界里依然會(huì)碰壁。

雖然星塵智能和千尋智能在機(jī)器人形態(tài)上選擇輪足式與 Figure AI 的雙足人形不同，但如果只看大腦維度的話(huà)，二者都展現(xiàn)出與 Helix 模型相似的野心。

星塵智能的 DuoCore 采用快慢腦架構(gòu)�？炷X負(fù)責(zé)實(shí)時(shí)反應(yīng)和基礎(chǔ)動(dòng)作控制，慢腦處理復(fù)雜決策和長(zhǎng)期規(guī)劃。這種設(shè)計(jì)與 Figure AI 的 Helix 模型有著相似之處。

把星塵智能的快慢腦與 Figure 的 Helix 對(duì)照，會(huì)發(fā)現(xiàn)兩者都支持需要不同時(shí)間尺度的決策機(jī)制來(lái)兼顧推理與實(shí)時(shí)控制。

Figure 將這種思路包裝為系統(tǒng) 1（快）與系統(tǒng) 2（慢）的組合，系統(tǒng) 1 執(zhí)行高速控制，系統(tǒng) 2 做高層規(guī)劃、語(yǔ)言與場(chǎng)景理解。星塵智能將類(lèi)似分層進(jìn)行「DuoCore +實(shí)時(shí)軌跡生成」模塊化工程，強(qiáng)調(diào)模仿學(xué)習(xí)與末端空間增量式控制等策略來(lái)提升魯棒性。

兩者的差別在于，F(xiàn)igure 的 Helix 側(cè)重于把一個(gè)通用 VLA 應(yīng)用在多種智能體上并通過(guò)大規(guī)模示范數(shù)據(jù)閉環(huán)優(yōu)化；星塵智能更強(qiáng)調(diào)自上而下的軟硬協(xié)同，以及通過(guò)工程化的遙操作與仿真采集實(shí)現(xiàn)大規(guī)模真實(shí)樣本的積累與遷移。

而在媒體公開(kāi)報(bào)道里被稱(chēng)為「中國(guó)版 Figure AI」的千尋智能，在今年先后發(fā)布了大模型 Spirit V1 和人形機(jī)器人 Moz1。前者首次攻克了柔性物體長(zhǎng)程操作難題，后者則是國(guó)內(nèi)首個(gè)高精度全身力控的具身智能機(jī)器人。

與 Figure 的 Helix 相比，千尋智能路徑的共同點(diǎn)在于二者都把端到端 VLA 看作關(guān)鍵能力，目標(biāo)是讓同一套模型能理解自然語(yǔ)言指令、處理感知輸入并輸出連續(xù)動(dòng)作。

同時(shí)，千尋智能也與 Figure 面臨著相似的挑戰(zhàn)，即如何把樣機(jī)上的演示變成能在大量真實(shí)場(chǎng)景中穩(wěn)定運(yùn)行并持續(xù)收集高質(zhì)量訓(xùn)練數(shù)據(jù)。

從架構(gòu)邏輯看，三家模型均通過(guò)「高頻系統(tǒng)處理動(dòng)作執(zhí)行、低頻系統(tǒng)負(fù)責(zé)決策規(guī)劃」的分工，較傳統(tǒng)模型速度與精度不可兼得的問(wèn)題有了提升。

Helix 的優(yōu)勢(shì)在于極致的輕量化與低數(shù)據(jù)依賴(lài)，可在嵌入式 GPU 上運(yùn)行，無(wú)需云端算力支撐

DuoCore 則強(qiáng)化了動(dòng)態(tài)修正能力，250Hz 的快腦響應(yīng)頻率甚至超過(guò) Helix，更適配工業(yè)場(chǎng)景的高精度需求

Spirit V1 的創(chuàng)新點(diǎn)在于柔性物體處理，通過(guò)多源數(shù)據(jù)融合實(shí)現(xiàn)了全流程疊衣服等復(fù)雜長(zhǎng)線(xiàn)任務(wù)，泛化能力更貼近家庭場(chǎng)景

銀河通用：資金+大腦的多維類(lèi)同

在具身智能這種「燒錢(qián)換時(shí)間」的賽道，除了要有過(guò)硬的技術(shù)水平，融資能力也對(duì)技術(shù)迭代起到了重要影響。大筆融資能保證技術(shù)發(fā)展有持續(xù)的資金支撐，同時(shí)充實(shí)的資金也能成為壯大人才隊(duì)伍的關(guān)鍵燃料。

Figure 之所以能收獲高度關(guān)注，一方面靠技術(shù)敘事，另一方面也得益于其連續(xù)獲得大額融資，為其打造樣機(jī)、構(gòu)建大數(shù)據(jù)閉環(huán)提供了充足彈藥。

在資金這一點(diǎn)上，中國(guó)的銀河通用無(wú)疑有著跟 Figure 類(lèi)同的基因，兩家公司都通過(guò)少數(shù)輪次、單筆巨額的融資方式，實(shí)現(xiàn)了估值的快速飆升。

銀河通用成立 2 年，收獲 3 輪融資，累計(jì)融資額超 24 億元，估值來(lái)到 100 億元人民幣，躋身國(guó)內(nèi)具身智能公司估值前三。Figure AI 成立 3 年，收獲 4 輪融資，累計(jì)融資額超 17.54 億美金，估值達(dá)到 390 億美元。

除此之外，兩家公司也都明顯吃到了投資方帶來(lái)的「資本-產(chǎn)業(yè)」紅利。例如銀河通用 Pre-A 輪領(lǐng)投方寧德時(shí)代，為其提供了在真實(shí)工廠環(huán)境中部署機(jī)器人和收集數(shù)據(jù)的場(chǎng)景。

而 Figure 此次 C 輪融資的參與方之一、全球頂級(jí)另類(lèi)資產(chǎn)管理公司 Brookfield，則將協(xié)助其構(gòu)建全球規(guī)模最大、最多樣化的人形機(jī)器人預(yù)訓(xùn)練數(shù)據(jù)集，并開(kāi)放大量真實(shí)的家庭場(chǎng)景以供測(cè)試。

除了「投人」和「投故事」之外，這兩家公司強(qiáng)大的「吸金」能力，歸根結(jié)底離不開(kāi)它們?cè)谀Ｐ蛯用娴挠矊?shí)力。

銀河通用選擇的機(jī)器人形態(tài)和星塵智能、千尋智能一樣，都是輪足式的機(jī)器人，跟 Figure 的雙足人形有所區(qū)別。但銀河通用的大模型 GraspVLA 跟 Helix 一樣，采用的都是端到端 VLA 的思路，并在業(yè)內(nèi)獲得了廣泛關(guān)注。

GraspVLA 的最大特點(diǎn)是泛化性極強(qiáng)，是全球首個(gè)僅需預(yù)訓(xùn)練就能實(shí)現(xiàn)零樣本泛化的模型，可適應(yīng)高度、平面位置、物體類(lèi)別、光照、干擾物、背景等環(huán)境條件的變化，且具備自主決策能力與強(qiáng)抗干擾能力。

與 Helix 不同，GraspVLA 更有場(chǎng)景針對(duì)性，銀河通用主攻的是藥店、零售等商業(yè)化場(chǎng)景，目前已經(jīng)簽約了 100 家智慧藥店。銀河通用的思路是先解決某類(lèi)場(chǎng)景的規(guī)模化問(wèn)題，再追求模型的更大通用性。

機(jī)器人行業(yè)遠(yuǎn)看是萬(wàn)億市場(chǎng)，近看是一萬(wàn)個(gè)「一億市場(chǎng)」，所以銀河通用選擇先切入可計(jì)量且可控性高的商業(yè)場(chǎng)景。

而 Figure 的 Helix 模型則更強(qiáng)調(diào)通用性，致力于在多樣化環(huán)境中執(zhí)行各類(lèi)任務(wù)，目標(biāo)是在工廠和家庭中都能大規(guī)模應(yīng)用。

從 Figure 早期與寶馬工廠的合作，到近期與 Brookfield 的合作，踐行的是「從工廠到家庭」的通用化路徑。這條路徑前期投入更大、周期更長(zhǎng)、風(fēng)險(xiǎn)更高，但潛在的回報(bào)也更為驚人

星動(dòng)紀(jì)元：軟硬件全棧路線(xiàn)的相似

在四位玩家里，星動(dòng)紀(jì)元在產(chǎn)品設(shè)計(jì)上最接近 Figure AI 的全棧式布局。星動(dòng)紀(jì)元同時(shí)研發(fā)了人形機(jī)器人 L7、輪式機(jī)器人 Q5 和靈巧手 XHAND1，形成了完整的產(chǎn)品矩陣。

這種多元硬件策略與 Figure AI 專(zhuān)注于雙足人形機(jī)器人略有差別，背后的邏輯是中國(guó)公司對(duì)市場(chǎng)需求的靈活適應(yīng)。

在本體形態(tài)、大腦架構(gòu)和場(chǎng)景落地這三個(gè)維度上，星動(dòng)紀(jì)元全面對(duì)標(biāo) Figure AI，構(gòu)建了「硬件接近、軟件對(duì)齊、場(chǎng)景相似」的完整框架。

在本體設(shè)計(jì)上，星動(dòng)紀(jì)元的人形機(jī)器人 L7 在今年的世界人形機(jī)器人運(yùn)動(dòng)會(huì)上獲得了跳高冠軍，展現(xiàn)了機(jī)器人的爆發(fā)力和運(yùn)動(dòng)性能，同時(shí)在功能展示里 L7 也能完成包裹分揀、智能裝配、跳舞、調(diào)酒等多項(xiàng)任務(wù)。

而 Figure 的人形機(jī)器人 Figure 02 同樣展示了包裹分揀、疊毛巾、使用洗碗機(jī)等能力，在 Helix 大腦的加持下，甚至能實(shí)現(xiàn)雙機(jī)器人協(xié)同工作。

盡管 Figure 的機(jī)器人未過(guò)多展示其運(yùn)動(dòng)能力，但在工廠這類(lèi)結(jié)構(gòu)化或半結(jié)構(gòu)化場(chǎng)景中，兩家公司的機(jī)器人均熟練掌握了包裹分揀等同類(lèi)技能。

硬件端另一個(gè)重要的共同點(diǎn)是，兩家公司均使用自研靈巧手來(lái)展示精細(xì)操作能力。這種從機(jī)器人本體到關(guān)鍵執(zhí)行部件的全鏈條自研能力，也是它們贏得市場(chǎng)高度認(rèn)可的核心原因之一。

兩家公司的人形機(jī)器人能有高性能表現(xiàn)離不開(kāi)高性能模型的支撐。星動(dòng)紀(jì)元同樣押注的是端到端 VLA 模型，其 ERA-42 模型將視覺(jué)、理解、預(yù)測(cè)和行動(dòng)整合為一體。

與 Figure 的 Helix 相比，兩者擁有三處共同點(diǎn)：

具備高頻響應(yīng)能力，ERA-42 的推理頻率達(dá) 30Hz 以上，雖低于 Helix 的 200Hz，但已能滿(mǎn)足實(shí)時(shí)動(dòng)作反饋需求，可通過(guò)視頻預(yù)測(cè)提前規(guī)劃動(dòng)作，避免操作失誤

遵循數(shù)據(jù)驅(qū)動(dòng)邏輯，兩者均通過(guò)觀看人類(lèi)操作視頻學(xué)習(xí)技能，ERA-42 可直接從視頻中提煉操作邏輯，大幅降低數(shù)據(jù)成本，這與 Helix 的自動(dòng)化標(biāo)注技術(shù)異曲同工

采用端到端架構(gòu)，均無(wú)需中間環(huán)節(jié)轉(zhuǎn)換，直接將自然語(yǔ)言指令轉(zhuǎn)化為動(dòng)作，簡(jiǎn)化了應(yīng)用開(kāi)發(fā)流程

雖然在融資方面，星動(dòng)紀(jì)元的融資額不能在中國(guó)玩家里排到絕對(duì)的第一梯隊(duì)，但是其在訂單層面已經(jīng)搭建起全球化生態(tài)，目前其已交付 300 臺(tái)訂單，另有 500 臺(tái)訂單待交付。

此外，全球市值 TOP10 的科技巨頭中已有 9 家是星動(dòng)紀(jì)元的客戶(hù)，國(guó)內(nèi)像聯(lián)想、海爾、北自科技等公司也都是其合作方。這種市場(chǎng)認(rèn)可度與 Figure AI 獲得寶馬訂單的邏輯一致，都體現(xiàn)了「技術(shù)實(shí)力-場(chǎng)景落地-市場(chǎng)認(rèn)可」的正向循環(huán)的運(yùn)轉(zhuǎn)。

誰(shuí)更像中國(guó)版 Figure AI

將星塵智能、千尋智能、銀河通用和星動(dòng)紀(jì)元這四家公司與 Figure AI 進(jìn)行對(duì)比后，我們可以把「像 Figure AI」拆解成三個(gè)更加具體的維度：

是否有端到端的 VLA 大模型能力并在多場(chǎng)景驗(yàn)證

是否在硬件上具備與模型耦合的工程能力

是否有充足的資金與產(chǎn)業(yè)鏈通道支撐長(zhǎng)期的迭代

把四家公司放進(jìn)這三個(gè)維度的交叉里，會(huì)發(fā)現(xiàn)沒(méi)有誰(shuí)能做到真正的「復(fù)刻」。

銀河通用在資金和場(chǎng)景化落地上具備優(yōu)勢(shì)，其仿真數(shù)據(jù)大模型、門(mén)店試點(diǎn)訂單和充足的資金給了它難以撼動(dòng)的競(jìng)爭(zhēng)力。

星塵智能在模型架構(gòu)上具有方法論上的可比性，它押注軟件架構(gòu)將決定最終上限；千尋智能在技術(shù)路線(xiàn)上也與 Figure 的技術(shù)路線(xiàn)有不少交叉，但它需要在真實(shí)世界樣機(jī)和場(chǎng)景驗(yàn)證上交出更多可核驗(yàn)的答卷。

星動(dòng)紀(jì)元在硬件和軟件上都與 Figure 最為接近，無(wú)論是技術(shù)路線(xiàn)的對(duì)齊、全棧能力閉環(huán)，還是都選擇先進(jìn)入工業(yè)場(chǎng)景的商業(yè)化選擇。

當(dāng)然，我們不可忽視的是，今年才剛剛開(kāi)啟具身智能的量產(chǎn)元年，對(duì)于這一長(zhǎng)戰(zhàn)線(xiàn)行業(yè)，或許現(xiàn)在下定義也有點(diǎn)太早，但我們也能從四項(xiàng)硬指標(biāo)里來(lái)窺見(jiàn)企業(yè)的發(fā)展情況。

第一，機(jī)器人在真實(shí)場(chǎng)景的長(zhǎng)期運(yùn)營(yíng)數(shù)據(jù)。秀 Demo 雖然在行業(yè)內(nèi)已經(jīng)見(jiàn)怪不怪，但怎么把單次演示變成穩(wěn)定執(zhí)行才是性能提升的關(guān)鍵。尤其是在真實(shí)場(chǎng)景下，同一套系統(tǒng)能否在多家門(mén)店、車(chē)間，甚至家庭保持低故障率的同時(shí)長(zhǎng)期運(yùn)行。

第二，企業(yè)真實(shí)的量產(chǎn)交付數(shù)據(jù)。今年以來(lái)，越來(lái)越多企業(yè)宣布簽署訂單，保守估計(jì)，今年我國(guó)人形機(jī)器人銷(xiāo)量有望突破 1 萬(wàn)臺(tái)。

與此同時(shí)，許多投資人也表示今年年底到明年年初是交卷期，企業(yè)最終能交付多少臺(tái)機(jī)器人，交付后的運(yùn)維、口碑，都是對(duì)企業(yè)供應(yīng)鏈、服務(wù)能力的考驗(yàn)。

第三，「模型-硬件」閉環(huán)的提升效率。企業(yè)能否把仿真、遙操等數(shù)據(jù)真實(shí)、高效地轉(zhuǎn)化為模型更新并下發(fā)到真實(shí)機(jī)器，是提升機(jī)器人智能程度的關(guān)鍵，智能程度提升到一定程度，機(jī)器人可以實(shí)現(xiàn)在陌生環(huán)境里實(shí)現(xiàn)任何指令，這也是業(yè)內(nèi)一直期待的機(jī)器人的「ChatGPT 時(shí)刻」。

王興興預(yù)測(cè)行業(yè)最快 1-2 年內(nèi)可能迎來(lái)這一時(shí)刻，而哪家公司能成為這一時(shí)刻的敲鐘人，就能獲得加速前進(jìn)的核心燃料。

第四，資金與產(chǎn)業(yè)資源的可持續(xù)性。眾擎的趙同陽(yáng)曾表示，公司賬面沒(méi)有 50 億元，很可能因資金鏈斷裂而被迫退出競(jìng)爭(zhēng)。所以誰(shuí)能在多輪迭代中既保住研發(fā)節(jié)奏，又能兼顧降本、量產(chǎn)和供應(yīng)鏈掌握，誰(shuí)更有長(zhǎng)線(xiàn)競(jìng)爭(zhēng)力。

綜上所述，無(wú)論是星動(dòng)紀(jì)元的全面布局，還是銀河通用的資本實(shí)力，抑或是星塵智能、千尋智能的算法優(yōu)勢(shì)，這四家企業(yè)的不同選擇，其實(shí)折射出了中國(guó)具身智能賽道的多元化生態(tài)。

隨著行業(yè)泡沫的逐漸消退，真正的競(jìng)爭(zhēng)將體現(xiàn)在每家公司在「技術(shù)-場(chǎng)景-數(shù)據(jù)-商業(yè)化落地」的協(xié)同能力上。

而這場(chǎng)競(jìng)逐的終局，絕對(duì)不是誕生一個(gè)「一模一樣的 Figure AI」，而是看誰(shuí)走出更符合產(chǎn)業(yè)需求的發(fā)展路徑。

甚至可能，最后真正的贏家，不是某家單一公司，而是那些能把大腦、身體與商業(yè)化閉環(huán)同時(shí)打通的玩家，或者通過(guò)合作把不同優(yōu)勢(shì)整合起來(lái)的生態(tài)體。

畢竟，這場(chǎng)智能革命的終局，從來(lái)不是單一模式的勝利，而是多元技術(shù)路徑共同開(kāi)辟的未來(lái)。

原文標(biāo)題 : “中國(guó)版Figure AI”，殺出四位候選玩家