訂閱
糾錯
加入自媒體

物理AI競速戰(zhàn)剛打響,小鵬就用“貓步”走到了特斯拉前面?

2025-11-11 09:26
飛說智行
關注

文/周雄飛

馬斯克要跟隨小鵬造飛行汽車了?

這兩天,特斯拉CEO埃隆·馬斯克在一檔播客中,透露特斯拉正在研發(fā)飛行汽車的原型機,并計劃會在今年底前對外展示。“這款飛行汽車會令人難忘”,他這樣高調(diào)介紹道。

此話一經(jīng)曝光,就引發(fā)了行業(yè)的廣泛討論,比如Drive Tesla Cana等外媒就認為特斯拉此舉具有明顯的跟隨性,而跟隨的目標正是被視為“中國版特斯拉”的小鵬汽車。

會有這樣的認知并不意外,畢竟小鵬在飛行汽車領域確實布局已久。早在2013年,小鵬就開始布局飛行汽車,并在之后推出了多代的飛行汽車產(chǎn)品。

時間再回到現(xiàn)在,小鵬在最近舉辦的AI科技日上,不僅發(fā)布了可跨城飛行的全傾轉(zhuǎn)固定翼飛行汽車A868,“陸地航母”也已進入到量產(chǎn)的最后階段,他們預計明年實現(xiàn)規(guī);桓。

不止如此,在這次科技日上,小鵬還發(fā)布了全新一代的人形機器人IRON,不僅率先行業(yè)讓機器人搭載固態(tài)電池,并宣布要在明年底實現(xiàn)IRON的規(guī)模量產(chǎn);以及宣布會在明年推出3款Robotaxi車型,并與高德合作開啟試運營。

這樣看,小鵬與特斯拉在智能車、飛行汽車、機器人和Robotaxi都有各自的布局和規(guī)劃,因為他們都有一個目標——讓AI從數(shù)字世界跨越到物理世界,從而讓AI真正改變?nèi)祟愂澜,而這些產(chǎn)品則是物理AI的載體。

圖片

但從以上業(yè)務的發(fā)展進度來看,小鵬已與特斯拉不相上下,甚至在飛行汽車等領域已領先特斯拉。最近,當馬斯克得知小鵬全新一代IRON走出像人類一樣的“貓步”后,不僅為此點贊,而且還評論道“特斯拉和中國公司將主導(未來的人形機器人)市場”。

這意味著,在這場物理AI世界的競速賽中,小鵬不再是跟隨者,而是在更多領域成為探索和引領者。

為了做到這件事,小鵬已為物理AI世界搭建好了軟硬件協(xié)同的“地基”。

軟件算法層面,在這次科技日上,小鵬發(fā)布了第二代VLA模型,相較于傳統(tǒng)VLA模型去掉了V(Vision,以下簡稱為V)到L(Language,以下簡稱為L)的轉(zhuǎn)譯過程,而是用V+L再到A(Action)的全新架構替代,從而能讓其成為跨越智能汽車、機器人和飛行汽車多領域產(chǎn)品的物理AI基座模型。

硬件方面,小鵬是同樣的邏輯。通過芯片到算子、再到模型的全鏈路優(yōu)化,來讓自研的圖靈AI芯片不僅能搭載在車上,還能應用到機器人和飛行汽車中。再加上小鵬對于算力和數(shù)據(jù)的持續(xù)加碼,支撐了軟硬件的協(xié)同進化。

從VLA模型,到機器人和飛行汽車的快速迭代和達到行業(yè)前列水準,在小鵬汽車CEO何小鵬看來,這就是涌現(xiàn)的結果。

1、機器人+空地一體,小鵬讓AI走入物理世界

“這個機器人里面是真人吧?”

當小鵬全新一代IRON在本次科技日發(fā)布會上,用極其擬人的“貓步”姿態(tài)走了一圈后,網(wǎng)絡上對此的討論一度引爆,其中開頭這個問題成為網(wǎng)友們討論最多的話題之一,何小鵬親口承認他們內(nèi)部都沒有想到會引發(fā)這么大的討論。

為此,不僅是何小鵬親自拍攝視頻來證明IRON是真的機器人,甚至還在第二天的小鵬X9超級增程技術發(fā)布會上,通過直播的形式剪開了IRON身上的皮膚和肌肉,來以此自證。

雖然整件事看上去有點荒誕,但從另一角度也證明相比于上一代,新一代IRON在體態(tài)、動作靈活度和性能上都有了非常明顯的升級,以至于才讓很多普通民眾把IRON當做了由真人扮演的展品。

細化來看,小鵬為新一代IRON的靈巧手研發(fā)了行業(yè)中最小的“諧波關節(jié)”,使靈巧手實現(xiàn)了22個自由度,并且具有溫度、力度和觸覺的傳感器,而整個IRON全身則擁有82個自由度。

圖片

以及IRON還會率先行業(yè)搭載固態(tài)電池,讓整個機身重量降低30%的同時,還能提升安全度和30%的電量。

按照何小鵬透漏,對于新一代IRON的目標是在2026年實現(xiàn)規(guī)模量產(chǎn),會率先進入小鵬總部和各地展廳擔任展廳導覽、銷售導購和前臺導流等工作,由此讓小鵬成為首個量產(chǎn)人形機器人的公司。

除了機器人之外,明年小鵬還有其他的產(chǎn)品計劃,就比如Robotaxi。

與特斯拉在Robotaxi上只推出一款車型不同,小鵬計劃在明年推出3款Robotaxi車型,并在部分城市開啟Robotaxi試運營,就像何小鵬此前表態(tài)“不會自己做運營”,由此他們找來了高德作為合作伙伴一起運營Robotaxi。

雖然在此次科技日上,何小鵬沒有公布這3款Robotaxi的形態(tài)等更多細節(jié),但也說明Robotaxi會面向L4級自動駕駛設計,在算力、轉(zhuǎn)向、感知、能源、剎車、通訊六個系統(tǒng)上準備了2套冗余,最大程度保障行駛安全。

同時,也突破了目前Robotaxi的一些不足,比如可以做到前裝量產(chǎn),不需要高精地圖、車輛成本低、泛化能力強,從而可以讓Robotaxi不挑路線和城市,實現(xiàn)跨城市、跨區(qū)域和全球部署的目標。

小鵬為他們的Robotaxi引入了主動與乘客交互的功能。按照何小鵬介紹,基于VLM大模型的能力,在車內(nèi)遮陽板上創(chuàng)新地設計了車外交互顯示功能,在迎賓、充電、臨停等場景顯示不同的信息,并且會結合語音播報進行主動交互。

L4層面,除了Robotaxi之外,何小鵬還計劃為個人用戶打造L4級汽車,推出全新智駕版本Robo,讓乘用車擁有L4級駕駛體驗。

落到產(chǎn)品層面,就是未來小鵬的車型除了Max和Ultra兩個版本之外,還會有Robo版本,該版本會具備與Robotaxi一樣的3000TOPS有效算力、2套安全冗余和2種智駕模式。

圖片

與機器人和Robotaxi兩大業(yè)務一樣,小鵬的飛行汽車業(yè)務同樣取得了新的進展。

科技日上,匯天的全傾轉(zhuǎn)固定翼飛行汽車A868正式亮相,由于其依靠六個旋翼完成垂直起降和旋轉(zhuǎn)旋翼方向推動飛行的構型,有了“中國版魚鷹”的標簽。從參數(shù)上看,可實現(xiàn)最高500km+續(xù)航,最高實現(xiàn)360km+/h的航速,乘坐最高支持6人。

如果說A868要落地還需要一些時間的話,那么匯天的“陸地航母”將成為全球首款量產(chǎn)飛行汽車。為了支撐明年的量產(chǎn)交付,匯天飛行汽車智造基地已正式啟用,何小鵬稱,目前匯天陸地航母已有7000臺全球訂單,有望創(chuàng)造載人飛行汽車銷量世界紀錄。

圖片

以上無論是機器人,還是Robotaxi和飛行汽車,在何小鵬看來并不是獨立的產(chǎn)品,而是可以組合成一幅物理AI幫助我們?nèi)祟惿畹拿篮脠D景。

或許為了讓大家更好地理解,何小鵬自己出演拍了一段視頻來展現(xiàn):何小鵬先駕駛飛行汽車飛到科技日會場外圍,然后再乘坐Robotaxi來到會場門口,這時IRON已經(jīng)在門口迎接何小鵬。

對于物理AI,目前已成為行業(yè)熱議的話題。在這兩天的特斯拉股東大會上,馬斯克認為“汽車就是機器人”,并提出未來機器人的規(guī)模會“遠超手機”,而自動駕駛、機器人、能源會成為AI從數(shù)字世界跨越到物理世界的主要形式。

但從小鵬的機器人、Robotaxi和飛行汽車進展來看,可以說小鵬在構建物理AI世界的進度上已經(jīng)取得領先,而這背后,則是因為他們已經(jīng)為物理AI世界構建了“地基”。

2、軟硬件協(xié)同進化,物理AI世界的“地基”

VLA和世界模型哪條路線更好,成為目前行業(yè)爭論的關鍵話題。

作為智駕行業(yè)玩家之一的小鵬,也給出了他們的答案——VLA模型和世界模型并不對立,而是可以融合。

在這次科技日上,小鵬發(fā)布了第二代VLA模型,按照何小鵬的介紹,第二代VLA模型既是VLA模型,也是世界模型。

因為不同于傳統(tǒng)VLA模型的V到L、再到A的二次轉(zhuǎn)譯過程,第二代VLA模型選擇去掉了中間L的轉(zhuǎn)譯過程,讓V+L的輸入直接到A的輸出,使整個端到端模型架構更加簡潔。

細化來看,第二代VLA模型中的L并不是完全被舍棄了,而是把現(xiàn)實世界中的語義信息和視覺信息進行隱式Token化,同時用注意力交叉機制進行對齊,最后輸出動作決策。讓模型直接從視覺信息中認識和理解物理世界,然后經(jīng)過推理做出正確的行動。

圖片

小鵬第二代VLA模型架構

在這個過程中,不僅彌補了世界模型缺少處理語義信息的模型,造成對于現(xiàn)實世界識別和理解不足的問題;而且去掉了V到L的顯性轉(zhuǎn)譯過程,大幅降低了模型的延時性,再加上強化學習和自監(jiān)督機制,讓模型效率更高。

翻譯一下,就像傳聲筒游戲,世界模型是你只能看到前面的人給你比劃,但不能說話描述;而傳統(tǒng)VLA模型,則是在你和第一個人之間,還有一個外國人,不僅需要兩次翻譯,還會損失信息。

但小鵬的新一代VLA,就是整個游戲只有兩個人,而且前面的人不僅會說話描述,同時還能比劃,信息傳遞不僅完整,而且很高效。

為了讓第二代VLA模型能“像人”一樣,以視覺為核心理解和推理世界,小鵬投入了3萬卡的算力,還燒了20多億元的訓練費用。從何小鵬的介紹看,該模型已經(jīng)應用到智能駕駛、機器人和飛行汽車多個物理AI領域。

就以IRON的算法架構為例,不僅應用了第二代VLA模型,并且還有VLM和VLT模型進行協(xié)作,形成“大腦+小腦”的整體架構。

“第二代VLA的上限非常高,可以幫助機器人實現(xiàn)螺旋上升。”小鵬汽車機器人副總裁及AI技術委員會負責人米良川這樣對飛說智行表示。另外,何小鵬還透露,未來還會讓VLT模型去支持智能駕駛和飛行汽車領域。

圖片

匯天創(chuàng)始人趙德力告訴飛說智行,“陸地航母”和這次剛發(fā)布的A868飛行汽車也會搭載第二代VLA模型,讓它們在空中不僅可以做到智能駕駛,而且還能像智能車一樣自主感知決策躲避障礙物。

正因這樣,在飛說智行看來,小鵬的第二代VLA模型已成為跨越智能駕駛、Robotaxi、機器人和飛行汽車四大物理AI領域的底層“算法基座模型”。

除了軟件算法之外,小鵬還在“澆筑”物理AI世界的“硬件地基”。

這些年,通用AI芯片很難解決特定AI領域(自動駕駛、具身智能等)問題的討論在行業(yè)中反復被提及,因為通用AI芯片往往是基于CPU設計,雖然性能不錯,但對于自動駕駛等特定場景,卻有著算力和能耗比的瓶頸。

針對這一問題,小鵬自研開發(fā)了以NPU為核心的圖靈AI芯片,實現(xiàn)性能的提升和超越,并且針對第二代VLA模型做了芯片—算子—模型的全鏈路優(yōu)化,讓芯片利用率提升20%,模型推理時延降低超過60%,模型能力提升超20倍。

“要讓如此大規(guī)模模型在本地的圖靈AI芯片上跑到實時,也就是與攝像頭的幀率完全一致。為此,小鵬從頭設計了編譯器和軟件棧,然后榨取了圖靈AI芯片每一比特的算力。” 小鵬汽車自動駕駛負責人劉先明這樣說道。

圖片

正因這樣,可以看到除了在小鵬Ultra和Robo智駕版本之外,IRON也采用了三顆圖靈AI芯片,算力達到2250TOPS;小鵬的Robotaxi甚至搭載了4顆圖靈芯片,算力高達3000TOPS。由此,圖靈AI芯片,也完成了從智能汽車,到機器人和Robotaxi的跨越。

基于以上軟件算法和硬件的協(xié)同進化,可以看到小鵬不僅已成為整個行業(yè)中為數(shù)不多同時在智能車、Robotaxi、機器人和飛行汽車四大物理AI領域布局的玩家,并且還能讓這些領域協(xié)同融合,按照劉先明介紹,目前人形機器人IRON和AI汽車有著70%的技術同源。

這樣做的好處,就是不僅可以降低各領域產(chǎn)品的研發(fā)成本,還能提升各領域協(xié)作融合的效率。

由此,在飛說智行看來,推動AI從數(shù)字世界到物理世界的這一征程中,小鵬應該已站到了行業(yè)前列。而這一大步的跨越,則基于小鵬過去的一步步的積累。

3、跬步千里,小鵬的“涌現(xiàn)”秘訣

涌現(xiàn),是這次小鵬AI科技日的主題。

這個詞主要是指當一個系統(tǒng)的規(guī);蛘邚碗s度達到一個臨界閾值后,會突然展現(xiàn)出其組成部分此前所不具備的全新能力。小鵬的第二代VLA模型和新一代機器人,都經(jīng)歷過這樣的涌現(xiàn)過程。

按照何小鵬介紹,小鵬從2024年開始探索VLA模型,一種是傳統(tǒng)VLA的基座模型,另一種是去掉L轉(zhuǎn)譯過程的創(chuàng)新VLA基座模型,后者是由劉先明帶隊研發(fā),兩條路線并行發(fā)展。

圖片

“這之后,幾乎投入了很多資源,但長時間都沒有突破,內(nèi)部一度想要砍掉這個方向(創(chuàng)新VLA),但直到今年二季度的某一天,劉先明突然跑過來告訴我‘涌現(xiàn)發(fā)生了’。”何小鵬這樣回憶道。

在會后的深度交流中,劉先明向飛說智行說出了更多涌現(xiàn)的細節(jié):記得某一天,當?shù)却t燈轉(zhuǎn)綠前,他發(fā)現(xiàn)測試車開始緩慢向前蠕動,就像很多人類老司機一樣預備著起步。

甚至在面對沒有讀秒的紅綠燈時,測試車也能通過道路兩側的紅綠燈變化情況,對于等待的紅綠燈信號做推測。“像這樣非常擬人的行為,你無法教模型學會,只能是數(shù)據(jù)量大到一定程度時,它自然就會學會。”

就此,劉先明帶領的第二代VLA模型成為了小鵬內(nèi)部的主要研發(fā)方向,讓智能輔助駕駛能力能在高速和城區(qū)、以及小路和園區(qū)做到絲滑駕駛,以至于何小鵬高調(diào)評價第二代VLA模型是“提前開啟物理世界模型的新范式”。

米良川對于IRON的涌現(xiàn)也記憶深刻。“今年3月的一個晚上,IRON在倒退行走時突然變得非常擬人,但我也說不清楚到底是哪次優(yōu)化帶來了變化,只能說當數(shù)據(jù)和算力達到了一定程度,就實現(xiàn)了涌現(xiàn),由此才有了后面上海車展上的亮眼演示。”

不可否認的是,小鵬他們在此次科技日上展現(xiàn)的這些新技術進展和新產(chǎn)品,對于整個行業(yè)來說是具有啟發(fā)和引領作用的。

而像這樣的事情,早已成為小鵬科技日的慣例。

比如在2020年的科技日上,小鵬發(fā)布了高速NGP功能,可支持自動變道、匝道進出、施工路段避讓等能力,就此成為了行業(yè)內(nèi)率先推出此功能的玩家。在這之后,不僅引發(fā)了整個行業(yè)對于高速智能輔助駕駛的追逐,也推動高速智能輔助駕駛功能從“高端選配”向“主流標配”普及。

再到次年的科技日上,小鵬推出了城市NGP功能的規(guī)劃和800V高壓碳化硅平臺技術,前者讓行業(yè)看到了智能輔助駕駛從高速駛入城區(qū)的可能性,而后者則是讓純電行業(yè)進入“高壓超充時代”。

這之后的科技日,小鵬相繼在智駕算法、整車架構、飛行汽車和機器人等領域發(fā)布了新進展和新技術,都給了行業(yè)新的啟發(fā),從而推動了行業(yè)的發(fā)展。就像開頭描述的那樣,馬斯克應該就是受到了小鵬做飛行汽車的啟發(fā),決定對此布局。

圖片

小鵬能一直做到這件事,或許得益于他們對于AI的堅持和持續(xù)投入。

早在2014年,小鵬他們成立之初就把自己定位為“未來出行的探索者”,并且把布局AI作為自身的發(fā)展戰(zhàn)略。

例如在2016年就組建了自動駕駛研發(fā)團隊,一年后何小鵬又親自去硅谷引入了自動駕駛開發(fā)大牛谷俊麗,主導感知算法研發(fā),搭建起基于深度學習的視覺識別框架。

與此同時,可以看到小鵬在AI智駕領域上一直在進化。從最早的XPILOT架構,再到采用BEV+Transformer的XNet架構,以及神經(jīng)網(wǎng)絡XNet+規(guī)控大模型XPlanner+大語言模型XBrain三網(wǎng)合一架構,再到現(xiàn)在的第二代VLA模型。

要實現(xiàn)這樣快速的架構演進,對于算力和數(shù)據(jù)的要求是極高的。按照小鵬官方透露,預計到明年將把云端的算力規(guī)模從目前的3萬張卡擴展至5-10萬張卡,算力預計可提升至16.6-33.3 EFLOPS,這一算力規(guī)模將處于行業(yè)的頭部位置。

數(shù)據(jù)方面,用于第二代VLA訓練的視頻數(shù)據(jù)量接近1億,相當于人類司機駕駛65000年才能遇到的極限場景總和。另外,根據(jù)公開數(shù)據(jù),2024年小鵬研發(fā)員工占比已經(jīng)超過40%,至今累計研發(fā)和制造投入超500億元。

在飛說智行看來,正是有了以上這樣的跬步積累,才讓小鵬在算法模型、機器人等領域?qū)崿F(xiàn)了涌現(xiàn),而這樣的涌現(xiàn)小鵬本身也在發(fā)生著。在這次科技日上,何小鵬提出了小鵬的新定位——物理AI世界的出行探索者,面向全球的具身智能公司。

涌現(xiàn)發(fā)生之前,一般是長久的試錯和焦慮,但正像米良川說的那樣:“之前不能完全看到成功的機會,但我們相信這件事能成,這就是相信的力量”。基于這股力量,飛說智行也相信小鵬他們會在未來迎來更多的涌現(xiàn)。

       原文標題 : 物理AI競速戰(zhàn)剛打響,小鵬就用“貓步”走到了特斯拉前面?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號