Microsoft正式发表第二代AI加速器Maia 200。这款采用台积电3奈米制程的晶片拥有超过1,400亿个电晶体,在FP4精度下可提供10+ peta FLOPS的运算能力。除了硬体规格亮眼,微软更与OpenAI共同开发的软体工具链。
 |
| /news/2026/01/27/1706240720S.jpg |
微软官方数据指出,其FP4性能是Amazon Trainium 3的三倍,并在FP8表现上优於Google TPU v7。对企业用户而言,Maia 200相比现有硬体能提供高达30%的每美元性能提升。目前该晶片已在爱荷华州数据中心上线,随後将扩展至亚利桑那州。
针对大规模语言模型(LLM)的数据吞吐需求,Maia 200优化了记忆体子系统。晶片配置216GB的HBM3e记忆体,传输频宽达7 TB/s,并搭载272MB的内建SRAM。这种强化内建记忆体的设计策略与Cerebras或Groq等一致,可极大化AI推理效率。
此外,微软推出的SDK包含了由OpenAI贡献代码的Triton开源编译器,并深度整合PyTorch与微软自有的NPL底层编程语言。这套工具链大幅降低开发者从CUDA平台迁移的门槛,让模型能更灵活地在不同硬体间运行。
在网路扩展性与部署效率方面,Maia 200具备每秒2.8 TB/s的双向频宽。透过自定义的Ethernet传输层,单一丛集可稳定扩展至6,144个加速器。微软更运用先进的Pre-silicon模拟技术,在晶片物理生产前即完成运算建模。这种协同开发模式让晶片抵达数据中心後,仅需数天便能开始运行AI模型,整体部署周期较传统程序缩短了超过一半的时间。
未来Maia 200将成为OpenAI最新GPT-5.2模型的核心引擎,并支援Microsoft 365 Copilot与超人工智慧研究。这款晶片的问世意味着微软启动自研晶片战略,有助於降低对外部供应商的依赖。微软也证实下一代晶片已在开发中,致力於在AI硬体领域达成长期的技术自给。