NVIDIA(辉达)今日宣布与微软展开多年的合作计画,共同打造全球最强大的人工智慧(AI)超级电脑之一,结合 Microsoft Azure 的先进超级运算基础设施,以及 NVIDIA 的 GPU、网路技术和完整的 AI 软体堆叠支援这台 AI 超级电脑,协助企业训练、部署和扩展 AI,其中包括最先进的大型模型。
|
NVIDIA 携手微软打造大规模云端人工智慧电脑 |
Azure 的云端 AI 超级电脑包括功能强大且具扩充性的 ND 系列及 NC 系列虚拟机器,这些虚拟机器经过最隹化调整,适用於执行 AI 分散式训练和推论作业。Azure 是第一个整合 NVIDIA 先进 AI 堆叠的公有云,在其平台上加入上万个 NVIDIA A100 和 H100 GPU、NVIDIA Quantum-2 400Gb/s InfiniBand 网路技术与 NVIDIA AI Enterprise 软体套件。
NVIDIA 将在本次的合作中运用 Azure 具扩充性的虚拟机器执行个体,推动研究并进一步加快推动生成式 AI(generative AI)的进展。生成式 AI 是迅速崛起的 AI 领域,其中像是 Megatron Turing NLG 530B 这样的基础模型,是无监督、自我学习演算法的基础,用於创造新的文字、程式码、数位影像、影片或音讯。
双方亦合作将微软的 DeepSpeed 深度学习最隹化软体调整到最隹状态。NVIDIA 专为 Azure 进行最隹化调整的全堆叠AI 工作流程和软体开发套件,将提供 Azure 的企业客户使用。
NVIDIA 企业运算部门??总裁 Manuvir Das 表示:「AI 技术的进步加上产业采用的脚步不断加快。基础模型的突破性发展促进研究潮、培育出更多新创公司,并开发出新的企业应用。我们与微软的合作将为研究人员及企业提供最先进的 AI 基础设施和软体,善加利用 AI 蕴含的颠覆性力量。」
微软云端运算与人工智慧事业群执行??总裁 Scott Guthrie 表示:「AI 将推动企业与工业运算的下一波自动化,让企业在因应动荡的经济局势时能事半功倍。微软携手 NVIDIA 将打造出世界上最具扩充性的超级电脑平台,将为使用 Microsoft Azure 平台的所有企业提供最先进的 AI 功能。」
Microsoft Azure 上针对 AI 进行最隹化调整的虚拟机器执行个体建构於 NVIDIA 最先进的资料中心 GPU,是第一个采用 NVIDIA Quantum-2 400Gb/s InfiniBand 网路技术的公有云执行个体。客户可以在单一丛集中部署数千个 GPU,训练最庞大的大型语言模型、大规模建立最复杂的推荐系统,以及大规模运用生成式 AI。
Azure 平台上的执行个体目前采用 NVIDIA Quantum 200Gb/s InfiniBand 网路技术和 NVIDIA A100 GPU,而这些执行个体日後将整合 NVIDIA Quantum-2 400Gb/s InfiniBand 网路技术及 NVIDIA H100 GPU。
这些针对 AI 进行最隹化调整的产品,搭配 Azure 先进的云端运算基础设施、网路和储存技术,将能为任何规模的 AI 训练和深度学习推论作业负载,视尖峰使用情况调整效能。此外,Azure 平台亦将支援众多 AI 应用程式和服务,包括微软的 DeepSpeed 及 NVIDIA AI Enterprise 软体套件。
微软的 DeepSpeed 将利用 NVIDIA H100 Transformer 引擎加快执行采用 Transformer 模型的速度,用於大型语言模型、生成式 AI 和电脑程式码编写等广泛应用。这项技术将 8 位元浮点精度功能用於 DeepSpeed,以大幅加快采用 Transformer 模型的 AI 运算速度,其传输量是 16 位元运算的两倍。
广受全球采用的 NVIDIA AI 平台软体 NVIDIA AI Enterprise,已在配备 NVIDIA A100 GPU 的 Microsoft Azure 执行个体上获得认证和支援。在日後推出的软体版本中亦将加入 NVIDIA H100 GPU 支援的 Azure 执行个体。
NVIDIA AI Enterprise 包含用於语音 AI 的 NVIDIA Riva 及 NVIDIA Morpheus 网路安全应用框架,能简化 AI 工作流程中,从资料处理、AI 模型训练、模拟及大规模部署等各个步骤。