123,123

10億用戶目標(biāo)落空背后：OpenAI的組織、產(chǎn)品問題如何損害ChatGPT?丨T insights

2025-12-29 17:16

創(chuàng)新觀察局

關(guān)注

ChatGPT撞上“技術(shù)進(jìn)步≠用戶體驗(yàn)”的墻。

過去一年間，部分OpenAI員工注意到，用戶對(duì)ChatGPT改進(jìn)的反應(yīng)令人擔(dān)憂。

往年，每當(dāng)驅(qū)動(dòng)ChatGPT的AI進(jìn)行重大升級(jí)時(shí)，用戶量都會(huì)激增——因?yàn)槭褂皿w驗(yàn)更好。

然而今年，盡管ChatGPT吸引了更多用戶，但底層AI模型智能和能力的提升似乎對(duì)大多數(shù)用戶毫無(wú)影響。

這一趨勢(shì)令員工們困惑不已。

公司研究團(tuán)隊(duì)耗時(shí)數(shù)月開發(fā)的新推理模型，在解答數(shù)學(xué)、科學(xué)等復(fù)雜問題時(shí)耗時(shí)遠(yuǎn)超ChatGPT前代模型。

OpenAI曾宣稱其AI今年夏季在2025年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽中展現(xiàn)了金牌級(jí)水準(zhǔn)，秋季又在2025年國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽中拔得頭籌。

但用戶使用ChatGPT時(shí)，大多未能體現(xiàn)這些技術(shù)進(jìn)步的價(jià)值。

AI評(píng)估初創(chuàng)公司LMArena的AI能力主管彼得·戈斯泰夫指出，OpenAI專注于科學(xué)、數(shù)學(xué)、編程等領(lǐng)域，但“似乎與ChatGPT目標(biāo)用戶的需求并不匹配” 。

多數(shù)情況下，ChatGPT用戶“可能只是詢問電影評(píng)分這類簡(jiǎn)單問題，根本不需要模型耗費(fèi)半小時(shí)思考”。

OpenAI九月發(fā)布的ChatGPT查詢數(shù)據(jù)似乎印證了戈斯蒂夫的觀點(diǎn)。

這一問題及其它OpenAI底層技術(shù)與產(chǎn)品間的脫節(jié)，為谷歌等競(jìng)爭(zhēng)對(duì)手創(chuàng)造了超越ChatGPT的機(jī)會(huì)。

因此OpenAI CEO山姆·阿爾特曼本月初發(fā)布“紅色警報(bào)”，要求公司重新聚焦ChatGPT改進(jìn)，以吸引更多用戶。

繁榮下的隱患

用戶對(duì)ChatGPT更新的反應(yīng)變化表明：OpenAI核心AI技術(shù)開發(fā)部門的目標(biāo)，未必能滿足ChatGPT的需求——盡管其貢獻(xiàn)了公司大部分營(yíng)收。

這也表明，隨著谷歌等競(jìng)爭(zhēng)對(duì)手的AI產(chǎn)品功能日益豐富，OpenAI對(duì)ChatGPT的營(yíng)收依賴可能成為其軟肋。

目前，關(guān)于ChatGPT是否會(huì)擊垮谷歌搜索，部分人的觀點(diǎn)與一兩年前相比已發(fā)生了轉(zhuǎn)變：

當(dāng)時(shí)OpenAI和谷歌高管都認(rèn)為ChatGPT可能會(huì)取代主流搜索引擎。（OpenAI發(fā)言人稱ChatGPT全球助手使用率約占70%，榮登蘋果年度免費(fèi)下載榜首，在不到三年時(shí)間內(nèi)占據(jù)10%的搜索市場(chǎng)份額。）

此后谷歌在搜索結(jié)果頂部添加了AI智能解答，并宣稱這正“顯著”推動(dòng)搜索查詢量增長(zhǎng)和營(yíng)收提升，因?yàn)橛脩?ldquo;逐漸認(rèn)識(shí)到谷歌能解答更多問題”。

OpenAI此次重啟ChatGPT推廣，但其雄心勃勃的用戶增長(zhǎng)目標(biāo)面臨著落空風(fēng)險(xiǎn)：

今年初OpenAI周活躍用戶達(dá)3.5億時(shí)，曾宣稱今年要突破10億大關(guān)，但截至本月初周活躍用戶不足9億，該目標(biāo)恐難實(shí)現(xiàn)。

不過，OpenAI在說服更多個(gè)人工作者和企業(yè)訂閱ChatGPT以獲取額外功能和無(wú)限制使用方面，表現(xiàn)令人矚目。

該公司目前年化營(yíng)收已突破190億美元（主要來(lái)自此類訂閱），較今年1月的60億美元大幅增長(zhǎng)。

這表明其有望實(shí)現(xiàn)今年8月設(shè)定的目標(biāo)：年底前達(dá)成200億美元年化營(yíng)收。

ChatGPT收費(fèi)模式：每百名周活躍用戶中，約五人付費(fèi)使用Pro或Plus服務(wù)。（注：現(xiàn)有數(shù)據(jù)。虛線表示新功能。數(shù)據(jù)來(lái)源：《The Information》）

OpenAI還有望提前實(shí)現(xiàn)2025年130億美元的營(yíng)收目標(biāo)（去年約為40億美元），并計(jì)劃以7500億美元估值融資（比兩個(gè)月前股權(quán)融資時(shí)的估值高出50%）。

按大多數(shù)標(biāo)準(zhǔn)衡量，這些數(shù)字都堪稱驚人且令人艷羨。

但要實(shí)現(xiàn)其預(yù)期的2030年2000億美元營(yíng)收目標(biāo)，OpenAI可能需要想辦法將周活躍用戶轉(zhuǎn)化為日活躍用戶。

因?yàn)檫@樣才能增加投放廣告的機(jī)會(huì)，或從ChatGPT促成的產(chǎn)品銷售中抽成。

文本界面的局限

想要達(dá)成目標(biāo)，OpenAI需要解決其組織架構(gòu)和產(chǎn)品層面的挑戰(zhàn)。

據(jù)悉，OpenAI研究部門（有超千名成員，基本與公司其他部門隔離）今年主要專注于開發(fā)推理模型，而非專門改進(jìn)ChatGPT。

但知情人透露，推理模型對(duì)ChatGPT作用有限，因?yàn)橛脩羝毡樽非罂焖佾@得答案。

推理模型回答問題往往耗時(shí)數(shù)秒至數(shù)分鐘，這對(duì)習(xí)慣谷歌即時(shí)搜索結(jié)果的用戶而言堪稱漫長(zhǎng)。

OpenAI表示，推理模型更適合完成復(fù)雜的多步驟任務(wù)、審查海量代碼或從企業(yè)文檔庫(kù)中檢索特定信息。

ChatGPT面臨的困境遠(yuǎn)不止推理模型問題：用戶似乎沒能充分理解其能解答的知識(shí)邊界——這限制了用戶的使用時(shí)長(zhǎng)。

尤其是ChatGPT基于文本的設(shè)計(jì)使用戶難以發(fā)現(xiàn)其非文本功能，例如分析機(jī)械或計(jì)算機(jī)錯(cuò)誤圖像并提供修復(fù)建議的能力。

ChatGPT產(chǎn)品主管尼克·特利指出，當(dāng)前界面類似于1980年代微軟推出的PC純文本操作系統(tǒng)MS-DOS。（直到微軟推出更具視覺吸引力且直觀的Windows操作系統(tǒng)后，PC革命才真正起飛。）

OpenAI其他高管也表達(dá)了類似觀點(diǎn)，認(rèn)為ChatGPT必須改變界面設(shè)計(jì)才能贏得更多青睞。

OpenAI應(yīng)用負(fù)責(zé)人菲吉·西莫透露，ChatGPT正“從以文本對(duì)話為主，向基于用戶操作需求動(dòng)態(tài)生成組件的完整生成式界面轉(zhuǎn)型”。

上周OpenAI為ChatGPT用戶推出了全新圖像生成模型，并宣布將增強(qiáng)文本回復(fù)中的視覺元素。

產(chǎn)品并非終極目標(biāo)

但負(fù)責(zé)ChatGPT等應(yīng)用的西莫（數(shù)月前從Instacart加入OpenAI）似乎深知公司內(nèi)部的局限性。她近期在博客中寫道，OpenAI本質(zhì)上仍是專注研究的公司，“產(chǎn)品本身并非目標(biāo)”。

與OpenAI（核心產(chǎn)品主要面向消費(fèi)者）不同，其部分競(jìng)爭(zhēng)對(duì)手并未出現(xiàn)研究與產(chǎn)品脫節(jié)的現(xiàn)象。

例如Anthropic主要將研發(fā)資源投入面向企業(yè)的應(yīng)用程序接口（API）。目前該公司的模型越智能（尤其在生成計(jì)算機(jī)代碼方面），其面向其他企業(yè)和應(yīng)用開發(fā)者的API銷售額就越高。

在OpenAI，模型改進(jìn)同樣能推動(dòng)API銷售，但其營(yíng)收僅占當(dāng)前及預(yù)期總營(yíng)收的極小部分。

據(jù)悉，今年大部分時(shí)間里，阿爾特曼似乎以O(shè)penAI已征服聊天機(jī)器人市場(chǎng)的姿態(tài)運(yùn)營(yíng)公司：他啟動(dòng)了非常多其他產(chǎn)品項(xiàng)目，包括Sora視頻應(yīng)用、音樂生成AI、網(wǎng)頁(yè)瀏覽器、專用AI代理、消費(fèi)級(jí)硬件設(shè)備、機(jī)器人等。

多位OpenAI研究人員指出，這些項(xiàng)目分散了提升ChatGPT大眾吸引力的資源。

近期，OpenAI管理層已日益意識(shí)到ChatGPT可能面臨風(fēng)險(xiǎn)，這令許多人感到不安。阿爾特曼在發(fā)布“紅色警報(bào)”時(shí)表示，計(jì)劃讓部分員工回歸ChatGPT研發(fā)。

OpenAI發(fā)言人表示：“產(chǎn)品與研究深度互聯(lián)而非對(duì)立。研究突破塑造產(chǎn)品，產(chǎn)品反饋反哺研究。這是構(gòu)建并安全部署日益強(qiáng)大模型的統(tǒng)一戰(zhàn)略，而非對(duì)立陣營(yíng)的割裂。”

推理模型的局限

過去一年間，OpenAI研究團(tuán)隊(duì)與ChatGPT產(chǎn)品團(tuán)隊(duì)的分歧逐漸顯現(xiàn)。

公司此前采用的傳統(tǒng)訓(xùn)練方法在改進(jìn)大語(yǔ)言模型方面成效不佳，因此將重心轉(zhuǎn)向推理模型，以期最終實(shí)現(xiàn)具備或超越人類能力的通用AI。

最初研究人員認(rèn)為推理模型也能提升ChatGPT性能，但今年初，當(dāng)OpenAI將其最先進(jìn)的推理模型轉(zhuǎn)換為ChatGPT可用版本時(shí)，模型性能反而下降。

事實(shí)證明，將模型改造成聊天版本意外削弱了其智能水平。

最終OpenAI仍設(shè)法將推理模型引入了ChatGPT。目前這些模型為ChatGPT的“思考模式”和“深度研究”智能體（今年2月推出，能生成報(bào)告），以及OpenAI的編程助手應(yīng)用Codex提供支持。

但事實(shí)上，在ChatGPT近9億的周活躍用戶中，定期使用這些功能的用戶比例極低。

OpenAI內(nèi)部研究人員指出，推理模型能否推動(dòng)通用人工智能（AGI）發(fā)展仍存在巨大不確定性。

OpenAI近期對(duì)ChatGPT的調(diào)整暗示推理模型正成為ChatGPT的負(fù)擔(dān)。（本月早些時(shí)候OpenAI悄然撤銷了免費(fèi)及最低價(jià)ChatGPT訂閱層級(jí)中自動(dòng)將用戶問題轉(zhuǎn)至推理模型的功能。）

OpenAI在為ChatGPT引入改進(jìn)模型時(shí)還面臨其他障礙：即便是非推理AI模型也可能與ChatGPT功能產(chǎn)生沖突。

據(jù)悉，發(fā)布旗艦級(jí)大語(yǔ)言模型GPT-5（為OpenAI產(chǎn)品提供支持）前的數(shù)周內(nèi)，研究人員發(fā)現(xiàn)該模型在編程等特定任務(wù)上的表現(xiàn)，在集成至聊天機(jī)器人后反而下降。

這是因?yàn)楫?dāng)用戶向ChatGPT發(fā)送查詢時(shí)，它會(huì)結(jié)合自身掌握的用戶信息（如職業(yè)）來(lái)個(gè)性化回答。然而，這些個(gè)人信息有時(shí)會(huì)干擾模型對(duì)用戶提問的理解，導(dǎo)致回答錯(cuò)誤。

雖然公司在發(fā)布GPT-5前修復(fù)了該問題，但部分員工認(rèn)為新模型與ChatGPT功能間的干擾仍將持續(xù)存在。

谷歌的反擊

OpenAI內(nèi)部研究與產(chǎn)品部門的裂痕另有跡象。

據(jù)悉，今年OpenAI降低了圖像生成模型的開發(fā)優(yōu)先級(jí)（該模型曾在3月短暫提升了ChatGPT的使用量和用戶數(shù)）。

雖無(wú)法得知決策緣由，但當(dāng)谷歌8月推出廣受好評(píng)的圖像生成AI “Nano Banana”后，OpenAI高管緊急決定提升圖像技術(shù)。

這引發(fā)了阿爾特曼與研究主管馬克·陳的分歧：前者認(rèn)為圖像生成能力對(duì)ChatGPT發(fā)展至關(guān)重要，后者則主張優(yōu)先推進(jìn)其他項(xiàng)目。

谷歌Nano Banana生成的圖像

本月初阿爾特曼在“紅色警報(bào)”中強(qiáng)調(diào)圖像生成將是優(yōu)化ChatGPT的核心方向，上周OpenAI為ChatGPT發(fā)布了全新圖像生成模型。

作為OpenAI的競(jìng)爭(zhēng)對(duì)手，谷歌能通過搜索引擎、Chrome瀏覽器及Gmail等辦公應(yīng)用讓AI觸達(dá)用戶，在AI普及方面占據(jù)優(yōu)勢(shì)。

近期谷歌的AI模型已顯著提升，在圖像生成和計(jì)算機(jī)代碼編寫等能力上基本與ChatGPT持平，使得谷歌的Gemini及其他AI產(chǎn)品更具吸引力。

這使OpenAI領(lǐng)導(dǎo)層擔(dān)憂普通用戶難以辨別ChatGPT與谷歌Gemini的差異：與Facebook、Instagram等社交應(yīng)用不同，聊天機(jī)器人通常不具備網(wǎng)絡(luò)效應(yīng)。

OpenAI還面臨另一重劣勢(shì)：財(cái)務(wù)狀況。

為訓(xùn)練和運(yùn)行包括ChatGPT在內(nèi)的AI，OpenAI正以每年數(shù)十億美元的速度消耗現(xiàn)金，不斷租賃更多服務(wù)器。

盡管OpenAI正著力開發(fā)自有數(shù)據(jù)中心和服務(wù)器芯片以降低長(zhǎng)期成本，但谷歌憑借十年前就啟動(dòng)的AI專用服務(wù)器研發(fā)計(jì)劃，如今已具備更高效的運(yùn)營(yíng)能力。

編輯：邊慧婷

來(lái)源：The Information

END

原文標(biāo)題 : 10億用戶目標(biāo)落空背后：OpenAI的組織、產(chǎn)品問題如何損害ChatGPT?丨T insights

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

立即登錄即可訪問所有OFweek服務(wù)

忘記密碼

其他方式

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無(wú)評(píng)論

圖片新聞