123,123,123

大模型日報| 文心、千問躋身全球前列，Anthropic估值3500億美元

2026-01-09 14:28

硅基星芒

關注

重大發(fā)布（新模型/產品/開源）

①馬斯克：新版Grok Imagine已發(fā)布

7日晚間，馬斯克發(fā)布推文稱新版的視頻生成工具Grok Imagine已經發(fā)布。

2d5a8ff8faca861a2bec4b97aadb333c

官方并未公開此次更新的技術細節(jié)，因此推測是針對近期Grok遭到內容生成相關指控的一次緊急更新。

根據實測反饋，此次更新后內容審查機制明顯更加嚴格，部分原先可用的提示詞目前已被管控。該模型在單圖修改方面表現較為出色，但在多圖編輯、文生圖能力上仍有提升空間，尤其對中文的理解能力相對較弱。

短評：

在Grok頻繁遭到部分國家的審查后，馬斯克的這次更新大概率是不得已而為之，但Grok Imagine在多模態(tài)領域的地位本就有些不上不下，在模型能力沒有顯著提升的同時加強審查機制，后果只有用戶的流失和風評的下降。

②國產之光：百度文心5.0登上LMArena視覺排行榜TOP10

1月7日，剛剛獲得1.5億美元融資的大模型競技場平臺LMArena更新了大模型視覺理解榜單（Vision Arena）。

在這份常年由Gemini和GPT占據前十的榜單中，百度的ERNIE-5.0-preview-1220模型出其不意地出現在了第8位，這也是前十名中唯一的國產模型。

根據百度官方于2025年11月公布的數據，文心大模型5.0采用了超稀疏混合專家架構，參數規(guī)模達到2.4萬億，在全模態(tài)理解、創(chuàng)意協(xié)作、智能體規(guī)劃和指令遵循等方面均實現了顯著的能力提升。

目前，該榜單的前四名由Google占據，第5-7名則屬于OpenAI，除文心5.0外，下一個國產模型是阿里的Qwen3-VL-235B-A22B-Instruct位于第15位。

短評：

LMArena的視覺榜單幾乎被Google和OpenAI所統(tǒng)治，兩家全球頂級模型的能力也毋庸置疑，文心5.0能達到這個高度實屬不易。

但是，文心系列大模型在整體智能水平上不及阿里的通義千問，在多模態(tài)能力方面也落后于字節(jié)的豆包，再加上其引以為傲的搜索引擎正在被Chatbot逐步替代，僅靠視覺能力的提升恐怕難以實現反制。

③OpenAI進軍醫(yī)療領域：ChatGPT Health健康助手上線

1月7日，OpenAI正式推出全新的健康模式：ChatGPT Health，這一功能能夠為用戶提供安全、隔離的私密空間，并完成電子病歷、Apple健康、MyFitnessPal等個人健康信息的整合。

簡單來說，它能夠在不侵犯用戶隱私權的同時，完成幫助用戶分析體檢結果、提供就診建議以及規(guī)劃飲食運動等常見需求。

e11009eb1f956bbb58934e13fbbcb1d4

該功能的重點在于隱私權的保護。OpenAI表示，健康相關對話將不會用于模型訓練，用戶將擁有健康數據的完整控制權，隨時可以進行查看和刪除。

根據OpenAI公布的數據，ChatGPT Health由OpenAI與全球60多個國家、超過260位執(zhí)業(yè)醫(yī)生合作開發(fā)，訓練過程中基于真實的臨床反饋對回復邏輯進行優(yōu)化，并通過名為HealthBench的醫(yī)生主導評估框架確保生成內容具備安全性與實用性。

目前，這一功能正在進行小范圍測試，優(yōu)先向美國用戶開放，支持b.well醫(yī)療平臺、Apple健康、Function、Weight Watchers、Peloton等服務。網頁端與iOS版本將在未來幾周逐步向所有用戶推出。

短評：

OpenAI這次進入醫(yī)療領域，沒有選擇挑戰(zhàn)高風險的診療場景，而是選擇聚焦于日常健康管理這一低風險、高頻次的應用場景。信息整合和決策支持相比需要大量專業(yè)知識支撐的臨床決策要更適合AI完成，在保持對醫(yī)學專業(yè)性的尊重的同時也有效規(guī)避了法律風險。

AI競爭的下半場是應用，ChatGPT Health這一新功能依靠生態(tài)合作，能夠獲取更準確的用戶數據，再通過OpenAI強大的場景整合能力將AI直接融入用戶的生活，實現應用價值的提升。不過，雖然應用場景的實際需求已經擺在眼前，但能否大規(guī)模落地，還要取決于數據連接的廣度和隱私保護的可信度。

02技術進展（論文/SOTA/算法）

①開源大模型格局：Qwen結束Llama統(tǒng)治，國產模型領跑2025

2025年，全球的開源大模型生態(tài)迎來了重磅性的轉折：國產模型的整體使用率已經超過美國和歐洲。與此同時，根據《The ATOM Project》公布的數據，阿里的通義千問（Qwen）系列模型已經取代了Meta的Llama系列模型，成為全球開發(fā)者默認首選的開源基礎模型，廣泛應用于本地部署、推理任務和多模態(tài)等場景。

DeepSeek打響了國產模型開源的第一槍，開啟了AI時代的模型革命，此后涌現出來自智譜、Minimax、月之暗面等多家中國企業(yè)的開源模型，但實際采用規(guī)模仍然不及Qwen。

阿里的Qwen憑借較高的智能水平，在Hugging Face下載量、GitHub星標數、本地LLM推理部署和微調社區(qū)活躍度等大模型核心衡量指標上持續(xù)領跑。

目前，歐美國家仍然未能取代Llama，盡管Meta已經停止對于Llama的更新。對于其他國外開源模型，OpenAI的GPT-OSS系列在部分基準測試中接近Minimax M2，在開源模型中展現出了較高的智能水平，但開發(fā)者采用率仍然不理想。因此，歐美國家的開源生態(tài)已經陷入“青黃不接”的局面。

當然，Qwen系列模型也并非無懈可擊。對于超大規(guī)模的模型，DeepSeek的知名產品V3和R1反而更加受到美國初創(chuàng)公司的歡迎。

短評：

開源促進技術進步已是不爭的事實。阿里的Qwen在開源市場的競爭中，成功做到在“質”有保證的前提下靠“量”取勝。對于大部分開發(fā)者來說，技術無國界，良好的綜合體驗才是選擇模型的第一理由，例如黃仁勛鐘愛Cursor，Gemini的首席工程師贊美Claude Code。當下，Llama頹勢已經顯露，此時正是Qwen等企業(yè)掌握開源大模型主導權的最佳時機。

商業(yè)動態(tài)（融資/合作/財報）

①Anthropic計劃融資100億美元，估值達到3500億

根據華爾街日報消息，Anthropic預計將以3500億美元的投前估值融資100億美元。而僅僅在四個月前，Anthropic的估值僅為1830億美元，如今已經接近翻倍。

本輪融資的領投者為GIC和Coatue Management，獨立于微軟、英偉達此前承諾的共150億美元的投資。

按照2025年11月微軟、英偉達和Anthropic公布的合作協(xié)議內容，Anthropic將向微軟采購共300億美元的算力設備，并在其Azure云平臺上大規(guī)模部署基于英偉達芯片的AI系統(tǒng)。

目前，Anthropic旗下的代表產品為終端AI編程助手Claude Code以及其中包含的Opus 4.5 / Sonnet 4.5 / Haiku 4.5，分別覆蓋高性能、平衡性和輕量高速三種應用場景。

Claude Code已經成為大多數程序員的首選AI工具，具備相當高的應用價值，甚至Google Gemini團隊的首席工程師都對Claude Code贊不絕口。而在模型的智能化程度方面，Claude Opus 4.5在各大評測榜單中也是名列前茅，與Gemini 3 Pro、GPT-5.2同處于最高檔位。

短評：

幾家全球最頂尖的AI企業(yè)紛紛開始大規(guī)模融資，高端模型的市場競爭變得更加激烈，每家企業(yè)都希望能夠實現技術層面上的率先突破，同時讓產品實現更大規(guī)模的應用。

Anthropic不具備Google和OpenAI一樣龐大的用戶生態(tài)，短期內快速提升用戶基數并不現實。但是，Anthropic憑借其強大的編程能力，能夠穩(wěn)定住程序員這一粘性和付費意愿均較高的使用群體，以此作為核心競爭力。

不過，目前Gemini在編程方面正在加速追趕，逐漸開始成為Claude Code的替代品，Anthropic如何維持護城河將成為其參與競爭的關鍵。

政策變化（監(jiān)管/安全/標準/政策）

①首例AI聊天機器人致青少年自殘案：谷歌和Character.AI與受害者家庭和解

根據美國法庭相關文件披露，Google及AI聊天機器人公司Character.AI已經與多起青少年自殺、自殘事件的家庭達成“原則上的和解”。

這是全球首批因為AI聊天機器人生成不當內容導致嚴重人身傷害而進入和解階段的訴訟，AI的責任問題正式進入了司法實踐階段。

最受關注的案件來自佛羅里達州：一位14歲的少年Sewell Setzer因沉迷Character.AI上的一款“《權力的游戲》丹妮莉絲”角色聊天機器人，在進行露骨對話后自殺。其母親Megan Garcia指控這款AI產品鼓勵其子結束生命，并認為Google作為其投資方和技術合作方應被視為“共同創(chuàng)作者”。

出于輿論和訴訟的壓力，Character.AI已經在2025年10月宣布全面禁止18歲以下用戶使用開放角色聊天功能，此后對未成年用戶啟用獨立、內容受限的模型及監(jiān)護人控制。目前，和解金額尚未披露，企業(yè)也未承認法律責任。

短評：

很多人把AI當作輔助工作的工具，卻忽視了AI的情感陪伴功能。當AI能在陪聊時做出誘導，技術便不再位于中立的立場。該案例足以顯示此前中國網信辦規(guī)范AI擬人化服務這一舉措的先見之明。

未來，加強AI內容審核迫在眉睫，各國法律需要完善未成年人保護機制與責任界定標準。

原文標題 : 大模型日報| 文心、千問躋身全球前列，Anthropic估值3500億美元