根據《麻省理工科技評論》分析,自DeepSeek在2025年初發布R1模型後,中國AI企業已成功打破西方壟斷。現在,從矽谷新創公司到Hugging Face開源社群,中國研發的開源模型(Open-weight Models)正以極高的性價比與優異性能,成為全球開發者構建AI應用的首選底層架構。
中國模型的競爭力核心在於「高規低價」。上週Moonshot AI(月之暗面)發布的Kimi K2.5模型,在多項基準測試中已逼近Anthropic的頂尖封閉模型Claude Opus,但其使用成本僅約為後者的七分之一。這種極致的成本控制,讓全球開發者能以極低門檻獲得接近前沿(Frontier)水平的AI推理能力。
在開源社群Hugging Face上,阿里巴巴的Qwen(通義千問)系列已正式超越Meta的Llama,成為累積下載量最高的模型家族。最新研究顯示,中國開源模型的總下載量已超越美國模型。這意味著在「remix」與二次開發的生態中,Qwen已取代Llama成為全球開發者的預設基礎模型(Base Model)。
與OpenAI或Anthropic的封閉模式不同,中國科技巨頭如阿里、騰訊及新創labs選擇公開模型權重,允許用戶下載並修改。這種策略不僅是為了避開美國的封閉生態限制,更是為了透過開源快速聚合全球開發者,藉此建立屬於中國的技術標準,並在全球AI競爭中縮小與領先者的差距。
中國開源模型的另一項優勢在於產品線的極度多樣化。以Qwen為例,其家族涵蓋了從能在單台筆電運行的輕量模型,到數據中心級的大型系統;此外,市場也出現了針對醫療推理、音樂生成、科學計算等垂直領域的專用模型,滿足了從個人開發者到大型企業的精準需求。
即便在技術核心的矽谷,中國模型的滲透率也驚人地高。Andreessen Horowitz(a16z)合夥人指出,目前使用開源技術棧的矽谷新創中,高達80%正在運行中國模型。OpenRouter的數據也顯示,中國開源模型的流量佔比從2024年底的近乎零,一路攀升至近期的30%,顯示出全球AI基礎設施的依賴性正在轉變。
儘管中國開源AI展現強大動能,其長期發展仍面臨商業模式與算力資源的考驗。目前中美AI生態仍高度互依,中國模型多數仍依賴NVIDIA硬體與美國雲端平台訓練。Anthropic執行長對此指出,美國企業必須研發出更強的模型才能維持優勢,因為開源浪潮已讓國界在技術傳遞上變得模糊,全球創新重心正在發生質變。