訂閱
糾錯
加入自媒體

“中國版Figure AI”,殺出四位候選玩家

編者按:

具身智能并非單一技術(shù)的突破,而是一場由資本、工程與場景合力推動的全球浪潮。這正如五百年前的地理大發(fā)現(xiàn),我們正在智能的驅(qū)動下,重新繪制物理世界的邊界。

星河頻率特別策劃「具身智能大航海」系列文章,立足全球視野,錨定通用機(jī)器人、陪伴機(jī)器人、機(jī)器狗、機(jī)器人大模型等核心賽道,深度剖析行業(yè)內(nèi)的頭號玩家們。

以「大航!篂槊,記錄探索者們?nèi)绾务{馭算法、硬件與資本的浪潮,尋找屬于自己的新大陸。

正如每一次大航海都重塑世界格局,具身智能的征程也在重新定義機(jī)器與人的關(guān)系、技術(shù)與社會的關(guān)系。在這個系列里,我們不僅關(guān)注誰能率先靠岸,更關(guān)心誰在指引航向、如何穿越泡沫、何處才有真正值得登陸的未來。

往期文章:《具身智能百億俱樂部,全球已有 10 位玩家》

作者 | 毛心如

前不久,F(xiàn)igure AI 用 10 億美元融資,390 億美元估值,為具身智能行業(yè)樹立了新的里程碑。短短三年,這家公司成為了全球估值最高的初創(chuàng)具身智能公司。

一時間,F(xiàn)igure AI 也被部分媒體戲稱為「美國版宇樹」。如果分析這個標(biāo)簽的評判標(biāo)準(zhǔn),其實不難發(fā)現(xiàn)是基于兩家公司在公眾話題討論度來評定的。而從技術(shù)路線角度,兩家公司顯然有著很大的差別。

宇樹是典型的「硬件派」公司,其當(dāng)前營收的 65% 來自四足機(jī)器狗業(yè)務(wù);Figure AI 則是全棧式軟硬一體的公司,硬件端其擁有自研機(jī)器人本體、電池、傳感器等核心部件,軟件端 Helix 機(jī)器人大腦可以支持機(jī)器人完成疊毛巾、包裹分揀等任務(wù)。

毫無疑問,目前任何一家公司想在人形機(jī)器人市場里擁有絕對的統(tǒng)治力,必須在軟件和硬件上都有絕對的實力。正因如此,眾多公司正在積極補(bǔ)齊短板,以增強(qiáng)市場競爭力。

而像 Figure AI 這種在「大腦+硬件+資金」都實力雄厚的公司,也成為了海內(nèi)外具身智能公司對標(biāo)的對象。

在這場由中美主導(dǎo)的具身智能競賽中,中國也涌現(xiàn)出四位潛力玩家,有望成為「中國版 Figure AI」,它們分別是:銀河通用、星動紀(jì)元、千尋智能和星塵智能。

星塵智能、千尋智能:大腦端的突圍

在具身智能的世界里,往往硬件的迭代是最清晰的,也是最容易被拆解的,但是決定機(jī)器人智能上限的,是軟件和模型。

換句話說,即便造出再漂亮的手臂與關(guān)節(jié),沒有聰明的大腦、小腦與關(guān)節(jié)打配合,機(jī)器人在復(fù)雜真實世界里依然會碰壁。

雖然星塵智能和千尋智能在機(jī)器人形態(tài)上選擇輪足式與 Figure AI 的雙足人形不同,但如果只看大腦維度的話,二者都展現(xiàn)出與 Helix 模型相似的野心。

星塵智能的 DuoCore 采用快慢腦架構(gòu)?炷X負(fù)責(zé)實時反應(yīng)和基礎(chǔ)動作控制,慢腦處理復(fù)雜決策和長期規(guī)劃。這種設(shè)計與 Figure AI 的 Helix 模型有著相似之處。

把星塵智能的快慢腦與 Figure 的 Helix 對照,會發(fā)現(xiàn)兩者都支持需要不同時間尺度的決策機(jī)制來兼顧推理與實時控制。

Figure 將這種思路包裝為系統(tǒng) 1(快)與系統(tǒng) 2(慢)的組合,系統(tǒng) 1 執(zhí)行高速控制,系統(tǒng) 2 做高層規(guī)劃、語言與場景理解。星塵智能將類似分層進(jìn)行「DuoCore +實時軌跡生成」模塊化工程,強(qiáng)調(diào)模仿學(xué)習(xí)與末端空間增量式控制等策略來提升魯棒性。

兩者的差別在于,F(xiàn)igure 的 Helix 側(cè)重于把一個通用 VLA 應(yīng)用在多種智能體上并通過大規(guī)模示范數(shù)據(jù)閉環(huán)優(yōu)化;星塵智能更強(qiáng)調(diào)自上而下的軟硬協(xié)同,以及通過工程化的遙操作與仿真采集實現(xiàn)大規(guī)模真實樣本的積累與遷移。

而在媒體公開報道里被稱為「中國版 Figure AI」的千尋智能,在今年先后發(fā)布了大模型 Spirit V1 和人形機(jī)器人 Moz1。前者首次攻克了柔性物體長程操作難題,后者則是國內(nèi)首個高精度全身力控的具身智能機(jī)器人。

與 Figure 的 Helix 相比,千尋智能路徑的共同點在于二者都把端到端 VLA 看作關(guān)鍵能力,目標(biāo)是讓同一套模型能理解自然語言指令、處理感知輸入并輸出連續(xù)動作。

同時,千尋智能也與 Figure 面臨著相似的挑戰(zhàn),即如何把樣機(jī)上的演示變成能在大量真實場景中穩(wěn)定運行并持續(xù)收集高質(zhì)量訓(xùn)練數(shù)據(jù)。

從架構(gòu)邏輯看,三家模型均通過「高頻系統(tǒng)處理動作執(zhí)行、低頻系統(tǒng)負(fù)責(zé)決策規(guī)劃」的分工,較傳統(tǒng)模型速度與精度不可兼得的問題有了提升。

Helix 的優(yōu)勢在于極致的輕量化與低數(shù)據(jù)依賴,可在嵌入式 GPU 上運行,無需云端算力支撐

DuoCore 則強(qiáng)化了動態(tài)修正能力,250Hz 的快腦響應(yīng)頻率甚至超過 Helix,更適配工業(yè)場景的高精度需求

Spirit V1 的創(chuàng)新點在于柔性物體處理,通過多源數(shù)據(jù)融合實現(xiàn)了全流程疊衣服等復(fù)雜長線任務(wù),泛化能力更貼近家庭場景

銀河通用:資金+大腦的多維類同

在具身智能這種「燒錢換時間」的賽道,除了要有過硬的技術(shù)水平,融資能力也對技術(shù)迭代起到了重要影響。大筆融資能保證技術(shù)發(fā)展有持續(xù)的資金支撐,同時充實的資金也能成為壯大人才隊伍的關(guān)鍵燃料。

Figure 之所以能收獲高度關(guān)注,一方面靠技術(shù)敘事,另一方面也得益于其連續(xù)獲得大額融資,為其打造樣機(jī)、構(gòu)建大數(shù)據(jù)閉環(huán)提供了充足彈藥。

在資金這一點上,中國的銀河通用無疑有著跟 Figure 類同的基因,兩家公司都通過少數(shù)輪次、單筆巨額的融資方式,實現(xiàn)了估值的快速飆升。

銀河通用成立 2 年,收獲 3 輪融資,累計融資額超 24 億元,估值來到 100 億元人民幣,躋身國內(nèi)具身智能公司估值前三。Figure AI 成立 3 年,收獲 4 輪融資,累計融資額超 17.54 億美金,估值達(dá)到 390 億美元。

除此之外,兩家公司也都明顯吃到了投資方帶來的「資本-產(chǎn)業(yè)」紅利。例如銀河通用 Pre-A 輪領(lǐng)投方寧德時代,為其提供了在真實工廠環(huán)境中部署機(jī)器人和收集數(shù)據(jù)的場景。

而 Figure 此次 C 輪融資的參與方之一、全球頂級另類資產(chǎn)管理公司 Brookfield,則將協(xié)助其構(gòu)建全球規(guī)模最大、最多樣化的人形機(jī)器人預(yù)訓(xùn)練數(shù)據(jù)集,并開放大量真實的家庭場景以供測試。

除了「投人」和「投故事」之外,這兩家公司強(qiáng)大的「吸金」能力,歸根結(jié)底離不開它們在模型層面的硬實力。

銀河通用選擇的機(jī)器人形態(tài)和星塵智能、千尋智能一樣,都是輪足式的機(jī)器人,跟 Figure 的雙足人形有所區(qū)別。但銀河通用的大模型 GraspVLA 跟 Helix 一樣,采用的都是端到端 VLA 的思路,并在業(yè)內(nèi)獲得了廣泛關(guān)注。

GraspVLA 的最大特點是泛化性極強(qiáng),是全球首個僅需預(yù)訓(xùn)練就能實現(xiàn)零樣本泛化的模型,可適應(yīng)高度、平面位置、物體類別、光照、干擾物、背景等環(huán)境條件的變化,且具備自主決策能力與強(qiáng)抗干擾能力。

與 Helix 不同,GraspVLA 更有場景針對性,銀河通用主攻的是藥店、零售等商業(yè)化場景,目前已經(jīng)簽約了 100 家智慧藥店。銀河通用的思路是先解決某類場景的規(guī);瘑栴},再追求模型的更大通用性。

機(jī)器人行業(yè)遠(yuǎn)看是萬億市場,近看是一萬個「一億市場」,所以銀河通用選擇先切入可計量且可控性高的商業(yè)場景。

而 Figure 的 Helix 模型則更強(qiáng)調(diào)通用性,致力于在多樣化環(huán)境中執(zhí)行各類任務(wù),目標(biāo)是在工廠和家庭中都能大規(guī)模應(yīng)用。

從 Figure 早期與寶馬工廠的合作,到近期與 Brookfield 的合作,踐行的是「從工廠到家庭」的通用化路徑。這條路徑前期投入更大、周期更長、風(fēng)險更高,但潛在的回報也更為驚人

星動紀(jì)元:軟硬件全棧路線的相似

在四位玩家里,星動紀(jì)元在產(chǎn)品設(shè)計上最接近 Figure AI 的全棧式布局。星動紀(jì)元同時研發(fā)了人形機(jī)器人 L7、輪式機(jī)器人 Q5 和靈巧手 XHAND1,形成了完整的產(chǎn)品矩陣。

這種多元硬件策略與 Figure AI 專注于雙足人形機(jī)器人略有差別,背后的邏輯是中國公司對市場需求的靈活適應(yīng)。

在本體形態(tài)、大腦架構(gòu)和場景落地這三個維度上,星動紀(jì)元全面對標(biāo) Figure AI,構(gòu)建了「硬件接近、軟件對齊、場景相似」的完整框架。

在本體設(shè)計上,星動紀(jì)元的人形機(jī)器人 L7 在今年的世界人形機(jī)器人運動會上獲得了跳高冠軍,展現(xiàn)了機(jī)器人的爆發(fā)力和運動性能,同時在功能展示里 L7 也能完成包裹分揀、智能裝配、跳舞、調(diào)酒等多項任務(wù)。

而 Figure 的人形機(jī)器人 Figure 02 同樣展示了包裹分揀、疊毛巾、使用洗碗機(jī)等能力,在 Helix 大腦的加持下,甚至能實現(xiàn)雙機(jī)器人協(xié)同工作。

盡管 Figure 的機(jī)器人未過多展示其運動能力,但在工廠這類結(jié)構(gòu)化或半結(jié)構(gòu)化場景中,兩家公司的機(jī)器人均熟練掌握了包裹分揀等同類技能。

硬件端另一個重要的共同點是,兩家公司均使用自研靈巧手來展示精細(xì)操作能力。這種從機(jī)器人本體到關(guān)鍵執(zhí)行部件的全鏈條自研能力,也是它們贏得市場高度認(rèn)可的核心原因之一。

兩家公司的人形機(jī)器人能有高性能表現(xiàn)離不開高性能模型的支撐。星動紀(jì)元同樣押注的是端到端 VLA 模型,其 ERA-42 模型將視覺、理解、預(yù)測和行動整合為一體。

與 Figure 的 Helix 相比,兩者擁有三處共同點:

具備高頻響應(yīng)能力,ERA-42 的推理頻率達(dá) 30Hz 以上,雖低于 Helix 的 200Hz,但已能滿足實時動作反饋需求,可通過視頻預(yù)測提前規(guī)劃動作,避免操作失誤

遵循數(shù)據(jù)驅(qū)動邏輯,兩者均通過觀看人類操作視頻學(xué)習(xí)技能,ERA-42 可直接從視頻中提煉操作邏輯,大幅降低數(shù)據(jù)成本,這與 Helix 的自動化標(biāo)注技術(shù)異曲同工

采用端到端架構(gòu),均無需中間環(huán)節(jié)轉(zhuǎn)換,直接將自然語言指令轉(zhuǎn)化為動作,簡化了應(yīng)用開發(fā)流程

雖然在融資方面,星動紀(jì)元的融資額不能在中國玩家里排到絕對的第一梯隊,但是其在訂單層面已經(jīng)搭建起全球化生態(tài),目前其已交付 300 臺訂單,另有 500 臺訂單待交付。

此外,全球市值 TOP10 的科技巨頭中已有 9 家是星動紀(jì)元的客戶,國內(nèi)像聯(lián)想、海爾、北自科技等公司也都是其合作方。這種市場認(rèn)可度與 Figure AI 獲得寶馬訂單的邏輯一致,都體現(xiàn)了「技術(shù)實力-場景落地-市場認(rèn)可」的正向循環(huán)的運轉(zhuǎn)。

誰更像中國版 Figure AI

將星塵智能、千尋智能、銀河通用和星動紀(jì)元這四家公司與 Figure AI 進(jìn)行對比后,我們可以把「像 Figure AI」拆解成三個更加具體的維度:

是否有端到端的 VLA 大模型能力并在多場景驗證

是否在硬件上具備與模型耦合的工程能力

是否有充足的資金與產(chǎn)業(yè)鏈通道支撐長期的迭代

把四家公司放進(jìn)這三個維度的交叉里,會發(fā)現(xiàn)沒有誰能做到真正的「復(fù)刻」。

銀河通用在資金和場景化落地上具備優(yōu)勢,其仿真數(shù)據(jù)大模型、門店試點訂單和充足的資金給了它難以撼動的競爭力。

星塵智能在模型架構(gòu)上具有方法論上的可比性,它押注軟件架構(gòu)將決定最終上限;千尋智能在技術(shù)路線上也與 Figure 的技術(shù)路線有不少交叉,但它需要在真實世界樣機(jī)和場景驗證上交出更多可核驗的答卷。

星動紀(jì)元在硬件和軟件上都與 Figure 最為接近,無論是技術(shù)路線的對齊、全棧能力閉環(huán),還是都選擇先進(jìn)入工業(yè)場景的商業(yè)化選擇。

當(dāng)然,我們不可忽視的是,今年才剛剛開啟具身智能的量產(chǎn)元年,對于這一長戰(zhàn)線行業(yè),或許現(xiàn)在下定義也有點太早,但我們也能從四項硬指標(biāo)里來窺見企業(yè)的發(fā)展情況。

第一,機(jī)器人在真實場景的長期運營數(shù)據(jù)。秀 Demo 雖然在行業(yè)內(nèi)已經(jīng)見怪不怪,但怎么把單次演示變成穩(wěn)定執(zhí)行才是性能提升的關(guān)鍵。尤其是在真實場景下,同一套系統(tǒng)能否在多家門店、車間,甚至家庭保持低故障率的同時長期運行。

第二,企業(yè)真實的量產(chǎn)交付數(shù)據(jù)。今年以來,越來越多企業(yè)宣布簽署訂單,保守估計,今年我國人形機(jī)器人銷量有望突破 1 萬臺。

與此同時,許多投資人也表示今年年底到明年年初是交卷期,企業(yè)最終能交付多少臺機(jī)器人,交付后的運維、口碑,都是對企業(yè)供應(yīng)鏈、服務(wù)能力的考驗。

第三,「模型-硬件」閉環(huán)的提升效率。企業(yè)能否把仿真、遙操等數(shù)據(jù)真實、高效地轉(zhuǎn)化為模型更新并下發(fā)到真實機(jī)器,是提升機(jī)器人智能程度的關(guān)鍵,智能程度提升到一定程度,機(jī)器人可以實現(xiàn)在陌生環(huán)境里實現(xiàn)任何指令,這也是業(yè)內(nèi)一直期待的機(jī)器人的「ChatGPT 時刻」。

王興興預(yù)測行業(yè)最快 1-2 年內(nèi)可能迎來這一時刻,而哪家公司能成為這一時刻的敲鐘人,就能獲得加速前進(jìn)的核心燃料。

第四,資金與產(chǎn)業(yè)資源的可持續(xù)性。眾擎的趙同陽曾表示,公司賬面沒有 50 億元,很可能因資金鏈斷裂而被迫退出競爭。所以誰能在多輪迭代中既保住研發(fā)節(jié)奏,又能兼顧降本、量產(chǎn)和供應(yīng)鏈掌握,誰更有長線競爭力。

綜上所述,無論是星動紀(jì)元的全面布局,還是銀河通用的資本實力,抑或是星塵智能、千尋智能的算法優(yōu)勢,這四家企業(yè)的不同選擇,其實折射出了中國具身智能賽道的多元化生態(tài)。

隨著行業(yè)泡沫的逐漸消退,真正的競爭將體現(xiàn)在每家公司在「技術(shù)-場景-數(shù)據(jù)-商業(yè)化落地」的協(xié)同能力上。

而這場競逐的終局,絕對不是誕生一個「一模一樣的 Figure AI」,而是看誰走出更符合產(chǎn)業(yè)需求的發(fā)展路徑。

甚至可能,最后真正的贏家,不是某家單一公司,而是那些能把大腦、身體與商業(yè)化閉環(huán)同時打通的玩家,或者通過合作把不同優(yōu)勢整合起來的生態(tài)體。

畢竟,這場智能革命的終局,從來不是單一模式的勝利,而是多元技術(shù)路徑共同開辟的未來。

       原文標(biāo)題 : “中國版Figure AI”,殺出四位候選玩家

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號