訂閱
糾錯(cuò)
加入自媒體

10億用戶目標(biāo)落空背后:OpenAI的組織、產(chǎn)品問題如何損害ChatGPT?丨T insights

ChatGPT撞上“技術(shù)進(jìn)步≠用戶體驗(yàn)”的墻。

過去一年間,部分OpenAI員工注意到,用戶對(duì)ChatGPT改進(jìn)的反應(yīng)令人擔(dān)憂。

往年,每當(dāng)驅(qū)動(dòng)ChatGPT的AI進(jìn)行重大升級(jí)時(shí),用戶量都會(huì)激增——因?yàn)槭褂皿w驗(yàn)更好。

然而今年,盡管ChatGPT吸引了更多用戶,但底層AI模型智能和能力的提升似乎對(duì)大多數(shù)用戶毫無(wú)影響。

這一趨勢(shì)令員工們困惑不已。

公司研究團(tuán)隊(duì)耗時(shí)數(shù)月開發(fā)的新推理模型,在解答數(shù)學(xué)、科學(xué)等復(fù)雜問題時(shí)耗時(shí)遠(yuǎn)超ChatGPT前代模型。

OpenAI曾宣稱其AI今年夏季在2025年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽中展現(xiàn)了金牌級(jí)水準(zhǔn),秋季又在2025年國(guó)際大學(xué)生程序設(shè)計(jì)競(jìng)賽中拔得頭籌。

但用戶使用ChatGPT時(shí),大多未能體現(xiàn)這些技術(shù)進(jìn)步的價(jià)值。

AI評(píng)估初創(chuàng)公司LMArena的AI能力主管彼得·戈斯泰夫指出,OpenAI專注于科學(xué)、數(shù)學(xué)、編程等領(lǐng)域,但“似乎與ChatGPT目標(biāo)用戶的需求并不匹配” 。

多數(shù)情況下,ChatGPT用戶“可能只是詢問電影評(píng)分這類簡(jiǎn)單問題,根本不需要模型耗費(fèi)半小時(shí)思考”。

OpenAI九月發(fā)布的ChatGPT查詢數(shù)據(jù)似乎印證了戈斯蒂夫的觀點(diǎn)。

這一問題及其它OpenAI底層技術(shù)與產(chǎn)品間的脫節(jié),為谷歌等競(jìng)爭(zhēng)對(duì)手創(chuàng)造了超越ChatGPT的機(jī)會(huì)。

因此OpenAI CEO山姆·阿爾特曼本月初發(fā)布“紅色警報(bào)”,要求公司重新聚焦ChatGPT改進(jìn),以吸引更多用戶。

繁榮下的隱患

用戶對(duì)ChatGPT更新的反應(yīng)變化表明:OpenAI核心AI技術(shù)開發(fā)部門的目標(biāo),未必能滿足ChatGPT的需求——盡管其貢獻(xiàn)了公司大部分營(yíng)收。

這也表明,隨著谷歌等競(jìng)爭(zhēng)對(duì)手的AI產(chǎn)品功能日益豐富,OpenAI對(duì)ChatGPT的營(yíng)收依賴可能成為其軟肋。

目前,關(guān)于ChatGPT是否會(huì)擊垮谷歌搜索,部分人的觀點(diǎn)與一兩年前相比已發(fā)生了轉(zhuǎn)變:

當(dāng)時(shí)OpenAI和谷歌高管都認(rèn)為ChatGPT可能會(huì)取代主流搜索引擎。(OpenAI發(fā)言人稱ChatGPT全球助手使用率約占70%,榮登蘋果年度免費(fèi)下載榜首,在不到三年時(shí)間內(nèi)占據(jù)10%的搜索市場(chǎng)份額。)

此后谷歌在搜索結(jié)果頂部添加了AI智能解答,并宣稱這正“顯著”推動(dòng)搜索查詢量增長(zhǎng)和營(yíng)收提升,因?yàn)橛脩?ldquo;逐漸認(rèn)識(shí)到谷歌能解答更多問題”。

OpenAI此次重啟ChatGPT推廣,但其雄心勃勃的用戶增長(zhǎng)目標(biāo)面臨著落空風(fēng)險(xiǎn):

今年初OpenAI周活躍用戶達(dá)3.5億時(shí),曾宣稱今年要突破10億大關(guān),但截至本月初周活躍用戶不足9億,該目標(biāo)恐難實(shí)現(xiàn)。

不過,OpenAI在說服更多個(gè)人工作者和企業(yè)訂閱ChatGPT以獲取額外功能和無(wú)限制使用方面,表現(xiàn)令人矚目。

該公司目前年化營(yíng)收已突破190億美元(主要來(lái)自此類訂閱),較今年1月的60億美元大幅增長(zhǎng)。

這表明其有望實(shí)現(xiàn)今年8月設(shè)定的目標(biāo):年底前達(dá)成200億美元年化營(yíng)收。

image.png

ChatGPT收費(fèi)模式:每百名周活躍用戶中,約五人付費(fèi)使用Pro或Plus服務(wù)。(注:現(xiàn)有數(shù)據(jù)。虛線表示新功能。數(shù)據(jù)來(lái)源:《The Information》)

OpenAI還有望提前實(shí)現(xiàn)2025年130億美元的營(yíng)收目標(biāo)(去年約為40億美元),并計(jì)劃以7500億美元估值融資(比兩個(gè)月前股權(quán)融資時(shí)的估值高出50%)。

按大多數(shù)標(biāo)準(zhǔn)衡量,這些數(shù)字都堪稱驚人且令人艷羨。

但要實(shí)現(xiàn)其預(yù)期的2030年2000億美元營(yíng)收目標(biāo),OpenAI可能需要想辦法將周活躍用戶轉(zhuǎn)化為日活躍用戶。

因?yàn)檫@樣才能增加投放廣告的機(jī)會(huì),或從ChatGPT促成的產(chǎn)品銷售中抽成。

文本界面的局限

想要達(dá)成目標(biāo),OpenAI需要解決其組織架構(gòu)和產(chǎn)品層面的挑戰(zhàn)。

據(jù)悉,OpenAI研究部門(有超千名成員,基本與公司其他部門隔離)今年主要專注于開發(fā)推理模型,而非專門改進(jìn)ChatGPT。

但知情人透露,推理模型對(duì)ChatGPT作用有限,因?yàn)橛脩羝毡樽非罂焖佾@得答案。

推理模型回答問題往往耗時(shí)數(shù)秒至數(shù)分鐘,這對(duì)習(xí)慣谷歌即時(shí)搜索結(jié)果的用戶而言堪稱漫長(zhǎng)。

OpenAI表示,推理模型更適合完成復(fù)雜的多步驟任務(wù)、審查海量代碼或從企業(yè)文檔庫(kù)中檢索特定信息。

ChatGPT面臨的困境遠(yuǎn)不止推理模型問題:用戶似乎沒能充分理解其能解答的知識(shí)邊界——這限制了用戶的使用時(shí)長(zhǎng)。

尤其是ChatGPT基于文本的設(shè)計(jì)使用戶難以發(fā)現(xiàn)其非文本功能,例如分析機(jī)械或計(jì)算機(jī)錯(cuò)誤圖像并提供修復(fù)建議的能力。

ChatGPT產(chǎn)品主管尼克·特利指出,當(dāng)前界面類似于1980年代微軟推出的PC純文本操作系統(tǒng)MS-DOS。(直到微軟推出更具視覺吸引力且直觀的Windows操作系統(tǒng)后,PC革命才真正起飛。)

OpenAI其他高管也表達(dá)了類似觀點(diǎn),認(rèn)為ChatGPT必須改變界面設(shè)計(jì)才能贏得更多青睞。

OpenAI應(yīng)用負(fù)責(zé)人菲吉·西莫透露,ChatGPT正“從以文本對(duì)話為主,向基于用戶操作需求動(dòng)態(tài)生成組件的完整生成式界面轉(zhuǎn)型”。

上周OpenAI為ChatGPT用戶推出了全新圖像生成模型,并宣布將增強(qiáng)文本回復(fù)中的視覺元素。

產(chǎn)品并非終極目標(biāo)

但負(fù)責(zé)ChatGPT等應(yīng)用的西莫(數(shù)月前從Instacart加入OpenAI)似乎深知公司內(nèi)部的局限性。她近期在博客中寫道,OpenAI本質(zhì)上仍是專注研究的公司,“產(chǎn)品本身并非目標(biāo)”。

與OpenAI(核心產(chǎn)品主要面向消費(fèi)者)不同,其部分競(jìng)爭(zhēng)對(duì)手并未出現(xiàn)研究與產(chǎn)品脫節(jié)的現(xiàn)象。

例如Anthropic主要將研發(fā)資源投入面向企業(yè)的應(yīng)用程序接口(API)。目前該公司的模型越智能(尤其在生成計(jì)算機(jī)代碼方面),其面向其他企業(yè)和應(yīng)用開發(fā)者的API銷售額就越高。

在OpenAI,模型改進(jìn)同樣能推動(dòng)API銷售,但其營(yíng)收僅占當(dāng)前及預(yù)期總營(yíng)收的極小部分。

據(jù)悉,今年大部分時(shí)間里,阿爾特曼似乎以O(shè)penAI已征服聊天機(jī)器人市場(chǎng)的姿態(tài)運(yùn)營(yíng)公司:他啟動(dòng)了非常多其他產(chǎn)品項(xiàng)目,包括Sora視頻應(yīng)用、音樂生成AI、網(wǎng)頁(yè)瀏覽器、專用AI代理、消費(fèi)級(jí)硬件設(shè)備、機(jī)器人等。

多位OpenAI研究人員指出,這些項(xiàng)目分散了提升ChatGPT大眾吸引力的資源。

近期,OpenAI管理層已日益意識(shí)到ChatGPT可能面臨風(fēng)險(xiǎn),這令許多人感到不安。阿爾特曼在發(fā)布“紅色警報(bào)”時(shí)表示,計(jì)劃讓部分員工回歸ChatGPT研發(fā)。

OpenAI發(fā)言人表示:“產(chǎn)品與研究深度互聯(lián)而非對(duì)立。研究突破塑造產(chǎn)品,產(chǎn)品反饋反哺研究。這是構(gòu)建并安全部署日益強(qiáng)大模型的統(tǒng)一戰(zhàn)略,而非對(duì)立陣營(yíng)的割裂。”

推理模型的局限

過去一年間,OpenAI研究團(tuán)隊(duì)與ChatGPT產(chǎn)品團(tuán)隊(duì)的分歧逐漸顯現(xiàn)。

公司此前采用的傳統(tǒng)訓(xùn)練方法在改進(jìn)大語(yǔ)言模型方面成效不佳,因此將重心轉(zhuǎn)向推理模型,以期最終實(shí)現(xiàn)具備或超越人類能力的通用AI。

最初研究人員認(rèn)為推理模型也能提升ChatGPT性能,但今年初,當(dāng)OpenAI將其最先進(jìn)的推理模型轉(zhuǎn)換為ChatGPT可用版本時(shí),模型性能反而下降。

事實(shí)證明,將模型改造成聊天版本意外削弱了其智能水平。

最終OpenAI仍設(shè)法將推理模型引入了ChatGPT。目前這些模型為ChatGPT的“思考模式”和“深度研究”智能體(今年2月推出,能生成報(bào)告),以及OpenAI的編程助手應(yīng)用Codex提供支持。

但事實(shí)上,在ChatGPT近9億的周活躍用戶中,定期使用這些功能的用戶比例極低。

OpenAI內(nèi)部研究人員指出,推理模型能否推動(dòng)通用人工智能(AGI)發(fā)展仍存在巨大不確定性。

OpenAI近期對(duì)ChatGPT的調(diào)整暗示推理模型正成為ChatGPT的負(fù)擔(dān)。(本月早些時(shí)候OpenAI悄然撤銷了免費(fèi)及最低價(jià)ChatGPT訂閱層級(jí)中自動(dòng)將用戶問題轉(zhuǎn)至推理模型的功能。)

OpenAI在為ChatGPT引入改進(jìn)模型時(shí)還面臨其他障礙:即便是非推理AI模型也可能與ChatGPT功能產(chǎn)生沖突。

據(jù)悉,發(fā)布旗艦級(jí)大語(yǔ)言模型GPT-5(為OpenAI產(chǎn)品提供支持)前的數(shù)周內(nèi),研究人員發(fā)現(xiàn)該模型在編程等特定任務(wù)上的表現(xiàn),在集成至聊天機(jī)器人后反而下降。

這是因?yàn)楫?dāng)用戶向ChatGPT發(fā)送查詢時(shí),它會(huì)結(jié)合自身掌握的用戶信息(如職業(yè))來(lái)個(gè)性化回答。然而,這些個(gè)人信息有時(shí)會(huì)干擾模型對(duì)用戶提問的理解,導(dǎo)致回答錯(cuò)誤。

雖然公司在發(fā)布GPT-5前修復(fù)了該問題,但部分員工認(rèn)為新模型與ChatGPT功能間的干擾仍將持續(xù)存在。

谷歌的反擊

OpenAI內(nèi)部研究與產(chǎn)品部門的裂痕另有跡象。

據(jù)悉,今年OpenAI降低了圖像生成模型的開發(fā)優(yōu)先級(jí)(該模型曾在3月短暫提升了ChatGPT的使用量和用戶數(shù))。

雖無(wú)法得知決策緣由,但當(dāng)谷歌8月推出廣受好評(píng)的圖像生成AI “Nano Banana”后,OpenAI高管緊急決定提升圖像技術(shù)。

這引發(fā)了阿爾特曼與研究主管馬克·陳的分歧:前者認(rèn)為圖像生成能力對(duì)ChatGPT發(fā)展至關(guān)重要,后者則主張優(yōu)先推進(jìn)其他項(xiàng)目。

image.png

谷歌Nano Banana生成的圖像

本月初阿爾特曼在“紅色警報(bào)”中強(qiáng)調(diào)圖像生成將是優(yōu)化ChatGPT的核心方向,上周OpenAI為ChatGPT發(fā)布了全新圖像生成模型。

作為OpenAI的競(jìng)爭(zhēng)對(duì)手,谷歌能通過搜索引擎、Chrome瀏覽器及Gmail等辦公應(yīng)用讓AI觸達(dá)用戶,在AI普及方面占據(jù)優(yōu)勢(shì)。

近期谷歌的AI模型已顯著提升,在圖像生成和計(jì)算機(jī)代碼編寫等能力上基本與ChatGPT持平,使得谷歌的Gemini及其他AI產(chǎn)品更具吸引力。

這使OpenAI領(lǐng)導(dǎo)層擔(dān)憂普通用戶難以辨別ChatGPT與谷歌Gemini的差異:與Facebook、Instagram等社交應(yīng)用不同,聊天機(jī)器人通常不具備網(wǎng)絡(luò)效應(yīng)。

OpenAI還面臨另一重劣勢(shì):財(cái)務(wù)狀況。

為訓(xùn)練和運(yùn)行包括ChatGPT在內(nèi)的AI,OpenAI正以每年數(shù)十億美元的速度消耗現(xiàn)金,不斷租賃更多服務(wù)器。

盡管OpenAI正著力開發(fā)自有數(shù)據(jù)中心和服務(wù)器芯片以降低長(zhǎng)期成本,但谷歌憑借十年前就啟動(dòng)的AI專用服務(wù)器研發(fā)計(jì)劃,如今已具備更高效的運(yùn)營(yíng)能力。

編輯:邊慧婷

來(lái)源:The Information

END

       原文標(biāo)題 : 10億用戶目標(biāo)落空背后:OpenAI的組織、產(chǎn)品問題如何損害ChatGPT?丨T insights

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)