訂閱
糾錯(cuò)
加入自媒體

調(diào)侃微軟,瞄準(zhǔn)白領(lǐng):馬斯克的“巨硬”公司如何替你上班

2026年3月11日,馬斯克在X上發(fā)了一條帖子,宣布Tesla和xAI正在聯(lián)合開發(fā)一個(gè)新項(xiàng)目,內(nèi)部代號(hào)叫Macrohard。

這個(gè)名字是在調(diào)侃微軟。Microsoft,微型軟件;Macrohard,宏大硬核。

玩笑歸玩笑,但馬斯克給這個(gè)項(xiàng)目的定義只有一句話:一個(gè)可以模擬整家公司運(yùn)作的AI系統(tǒng)。

這句話值得停下來想一想。不是更聰明的聊天機(jī)器人,不是更好用的代碼助手,馬斯克想干的是模擬整家公司運(yùn)作。AI是要替代那些坐在辦公室里操作電腦的人,馬斯克在瞄準(zhǔn)白領(lǐng)!

● AI干活,難在哪里

過去兩年,大模型改變了很多人寫東西的方式。但有一件事幾乎沒有改變:人仍然要親自操作電腦。

AI寫完文案,你還是要自己打開郵件發(fā)出去;AI生成了報(bào)告,你還是要自己上傳到系統(tǒng)里。這個(gè)AI界的"最后一公里"的問題,催生了一類叫AI Agent的技術(shù)。

OpenAI的Operator、Anthropic的Computer Use,都在嘗試讓AI直接操作電腦——自動(dòng)填表、發(fā)郵件、操作網(wǎng)頁(yè),真正完成任務(wù)而不只是回答問題。

但真正用過的人都知道:慢,而且不穩(wěn)定。

原因在于架構(gòu)。目前主流AI Agent的工作方式是截屏→分析→操作→再截屏,每一步之間都要等大模型反應(yīng)。就像一個(gè)人每點(diǎn)一次鼠標(biāo)都要停下來思考三秒。演示視頻里看起來很流暢,真實(shí)場(chǎng)景里用起來讓人抓狂。

這是一個(gè)還沒被解決的工程問題,不是營(yíng)銷問題。

● 特斯拉式解法

Digital Optimus的架構(gòu)設(shè)計(jì),和現(xiàn)有AI Agent有一個(gè)本質(zhì)區(qū)別。

現(xiàn)有方案把電腦屏幕當(dāng)成一張張截圖來處理;Digital Optimus把屏幕當(dāng)成連續(xù)視頻來處理,實(shí)時(shí)讀取最近5秒的畫面,直接驅(qū)動(dòng)鼠標(biāo)和鍵盤。

這套邏輯直接來自特斯拉自動(dòng)駕駛——汽車在路上面對(duì)的是連續(xù)的世界,不能每隔一秒截圖分析一次,否則早就撞車了。

系統(tǒng)分兩層:執(zhí)行層負(fù)責(zé)實(shí)時(shí)操作,決策層是xAI的Grok模型,負(fù)責(zé)理解任務(wù)、規(guī)劃步驟、在出錯(cuò)時(shí)介入糾正。

心理學(xué)里把這叫系統(tǒng)1和系統(tǒng)2——直覺和理性的分工。人用電腦時(shí),看到熟悉按鈕會(huì)本能點(diǎn)擊,遇到復(fù)雜判斷才會(huì)停下來思考。Digital Optimus試圖復(fù)制的,正是這套人類操作電腦的底層邏輯。

這個(gè)設(shè)計(jì)思路比現(xiàn)有方案聰明。但聰明的設(shè)計(jì)和能跑通的產(chǎn)品之間,還有相當(dāng)長(zhǎng)的距離。

● 為什么先做軟件,不做機(jī)器人

特斯拉的Optimus機(jī)器人已經(jīng)宣傳了三年,但進(jìn)展比預(yù)期慢。原因不復(fù)雜:現(xiàn)實(shí)世界太難了。

一個(gè)搬箱子的動(dòng)作,背后涉及視覺識(shí)別、路徑規(guī)劃、抓取控制、機(jī)械結(jié)構(gòu)和電池續(xù)航,任何一個(gè)環(huán)節(jié)出問題任務(wù)就失敗。

業(yè)內(nèi)有句話:機(jī)器人最貴的一半是手。這也是為什么幾乎所有機(jī)器人展示視頻里,動(dòng)作都出奇地慢——那不是在展示能力,那是在掩蓋局限。

相比之下,電腦世界是一個(gè)極其友好的環(huán)境。沒有摩擦力,沒有重力,不需要電池,失敗了可以立刻重試。而企業(yè)里恰好堆滿了這類工作:錄數(shù)據(jù)、填表單、處理客服、跑ERP流程。

這些工作過去由RPA(機(jī)器人流程自動(dòng)化)處理。RPA的問題是不會(huì)思考,規(guī)則一變它就失效,每次業(yè)務(wù)調(diào)整都要重新編程。Digital Optimus的目標(biāo)是用真正能理解上下文的AI來替代它——不只是執(zhí)行流程,而是理解意圖。

先去軟件世界打工,積累數(shù)據(jù)和經(jīng)驗(yàn),再慢慢走進(jìn)物理世界。

● 底牌:幾百萬輛車的算力

Digital Optimus最容易被忽視的部分,是它的算力來源。

特斯拉目前有幾百萬輛搭載AI芯片的車在路上跑,每輛車的芯片在行駛之外的時(shí)間大量閑置。馬斯克幾年前就提出過一個(gè)設(shè)想:把這些閑置算力組織起來,形成分布式AI推理網(wǎng)絡(luò)。

如果Digital Optimus的推理架構(gòu)足夠輕量,這個(gè)網(wǎng)絡(luò)就可以成為它的算力底座——成本極低,規(guī)模極大,而且隨著特斯拉車隊(duì)擴(kuò)張自動(dòng)增長(zhǎng)。

這是純軟件AI公司在結(jié)構(gòu)上很難復(fù)制的優(yōu)勢(shì)。OpenAI需要租用數(shù)據(jù)中心,成本隨用量線性增長(zhǎng);特斯拉的邊緣算力網(wǎng)絡(luò)一旦激活,邊際成本趨近于零。

當(dāng)然,這個(gè)設(shè)想離落地還很遠(yuǎn),解釋了為什么這個(gè)項(xiàng)目的天花板,比表面看起來高得多。

● 最大的風(fēng)險(xiǎn)不是技術(shù)

馬斯克正式宣布之前,媒體已經(jīng)爆出項(xiàng)目?jī)?nèi)部的一些問題:團(tuán)隊(duì)負(fù)責(zé)人頻繁更換,工程師流失,一個(gè)涉及600名數(shù)據(jù)標(biāo)注人員的訓(xùn)練項(xiàng)目被臨時(shí)叫停。這些是執(zhí)行層面的摩擦,大項(xiàng)目里并不罕見。

真正麻煩的是公司結(jié)構(gòu)。特斯拉是上市公司,xAI是馬斯克的私人公司,Digital Optimus同時(shí)依賴兩邊的核心資產(chǎn)——特斯拉的芯片和車隊(duì),xAI的模型。

項(xiàng)目一旦產(chǎn)生商業(yè)價(jià)值,利益怎么切、技術(shù)歸誰(shuí)所有,這些問題在股東和投資人面前都會(huì)變得非,F(xiàn)實(shí)。

馬斯克同時(shí)掌控兩家公司,可以強(qiáng)行推進(jìn);但這種結(jié)構(gòu)也意味著,任何一邊的壓力都可能打斷項(xiàng)目節(jié)奏。特斯拉股東已經(jīng)多次對(duì)馬斯克的精力分散表達(dá)不滿。技術(shù)路線可以迭代,公司治理的矛盾更難化解。

       原文標(biāo)題 : 調(diào)侃微軟,瞄準(zhǔn)白領(lǐng):馬斯克的“巨硬”公司如何替你上班?

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評(píng)論

暫無評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)