自美国对华高阶AI晶片出囗管制以来,NVIDIA为了维持中国市场供应,设计出所谓「中国合规版」H20(或称为对中贩售的H20变体),将部分功能与规格下修以符合美方限制。H20并非NVIDIA最顶级的Blackwell/H200系列,而是定位为次一级、可供大规模资料中心做推论与部分训练工作的加速卡;但即便是「变体」,其在大规模模型训练与高并行推理上的价值仍然相当明显。
 |
| /news/2025/08/11/1257370380S.jpg |
政治与财务的新条件成为重返市场的代价。根据多家媒体与官方管道报导,NVIDIA与AMD在取得对华出囗许可的同时,被要求将其在中国市场销售AI晶片的营收,依某种安排上缴美国政府15%作为回报或条件之一;这项非典型安排引发国安、经济与制度层面的争议,也改变了供货价格与利润计算。对NVIDIA而言,放宽出囗能快速换回庞大营收,但同时也意味着未来在中国市场的利润被进一步稀释与政治化。
市场面上,H20的实务表现与期待也出现落差报导。有测试与拆解资讯指出,面向中国市场的H20在核心数、记忆体频宽或某些加速单元上被节制,相较於NVIDIA在全球其他市场的旗舰卡有明显缩水,这也导致部分用户与分析师认为其效能「不若预期」,尤其是在极大型模型训练(大量HBM频宽需求)上影响更明显。如此性能与价格的落差,成为中国买家在采购决策时需权衡的关键。
为何中国仍需H20?原因可分为三点:第一,计算力缺囗大型生成式AI与大型语言模型(LLM)训练、微调与推理都需要稳定、成熟且软生态支援良好的GPU平台,NVIDIA的生态(CUDA、软体工具链、成熟的资料中心部署经验)短期内仍难被替代。第二,速度与兼容性很多中国AI研发与云端业者已有大量基於NVIDIA软硬体堆叠的投资,短期切换到完全不同架构会产生高昂的转换成本与开发风险。第三,供应与效率即便H20是变体,其在特定训练/推论工作负载上仍能提供较高的能耗效率与更短的训练时间,对商业化产品化节奏更为关键。
面对H20回流,中国本土厂商已加速推出多款AI加速器作为替代选项,代表性者包括华为的Ascend系列(近期有910C/910D等迭代)、寒武纪(Cambricon)、Biren、Moore Threads、恩朋(Enflame)等。华为透过Ascend与软体生态(CANN)积极抢占云端训练市场,且有将软体开源以对抗CUDA的策略;寒武纪则在多家网际与内容公司得到采购订单;Biren与Moore Threads等新创也获得资金与国内大客户的背书。尽管国产选项在近年性能与量产能力快速追进,但在软体生态成熟度、开发者习惯、以及某些高端制程产能(受限於外部供应链)上仍存在不足。
短期内,中国市场可能呈现「双轨并行」:对於追求开发速度、兼容既有生态与能接受较高成本的企业,仍会采购H20等合规版NVIDIA卡;同时,政府与大型云厂将持续加码采用与扶植国产晶片业者,以减少对外依赖并推动长期自主化。对NVIDIA而言,必须在价格与规格限制中找到平衡,并处理来自中国官方与民间媒体的疑虑;对中国业者,则需加速完善软体堆叠、提高制造稳定性与扩大量产以缩小采用门槛。
总结而言,H20回归中国既是技术需求驱动的市场选择,也是复杂地缘政治与商业谈判的产物。未来市场胜负将取决於「生态成熟度、供应稳定性与成本效益」三者谁能最先说服中国的AI经济体。