根据《麻省理工科技评论》分析,自DeepSeek在2025年初发布R1模型後,中国AI企业已成功打破西方垅断。现在,从矽谷新创公司到Hugging Face开源社群,中国研发的开源模型(Open-weight Models)正以极高的性价比与优异性能,成为全球开发者构建AI应用的首选底层架构。
中国模型的竞争力核心在於「高规低价」。上周Moonshot AI(月之暗面)发布的Kimi K2.5模型,在多项基准测试中已逼近Anthropic的顶尖封闭模型Claude Opus,但其使用成本仅约为後者的七分之一。这种极致的成本控制,让全球开发者能以极低门槛获得接近前沿(Frontier)水平的AI推理能力。
在开源社群Hugging Face上,阿里巴巴的Qwen(通义千问)系列已正式超越Meta的Llama,成为累积下载量最高的模型家族。最新研究显示,中国开源模型的总下载量已超越美国模型。这意味着在「remix」与二次开发的生态中,Qwen已取代Llama成为全球开发者的预设基础模型(Base Model)。
与OpenAI或Anthropic的封闭模式不同,中国科技巨头如阿里、腾讯及新创labs选择公开模型权重,允许用户下载并修改。这种策略不仅是为了避开美国的封闭生态限制,更是为了透过开源快速聚合全球开发者,藉此建立属於中国的技术标准,并在全球AI竞争中缩小与领先者的差距。
中国开源模型的另一项优势在於产品线的极度多样化。以Qwen为例,其家族涵盖了从能在单台笔电运行的轻量模型,到数据中心级的大型系统;此外,市场也出现了针对医疗推理、音乐生成、科学计算等垂直领域的专用模型,满足了从个人开发者到大型企业的精准需求。
即便在技术核心的矽谷,中国模型的渗透率也惊人地高。Andreessen Horowitz(a16z)合夥人指出,目前使用开源技术栈的矽谷新创中,高达80%正在运行中国模型。OpenRouter的数据也显示,中国开源模型的流量占比从2024年底的近??零,一路攀升至近期的30%,显示出全球AI基础设施的依赖性正在转变。
尽管中国开源AI展现强大动能,其长期发展仍面临商业模式与算力资源的考验。目前中美AI生态仍高度互依,中国模型多数仍依赖NVIDIA硬体与美国云端平台训练。Anthropic执行长对此指出,美国企业必须研发出更强的模型才能维持优势,因为开源浪潮已让国界在技术传递上变得模糊,全球创新重心正在发生质变。