暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Azure ND H100 v5 VM虚拟机预览发布,强大AI基础架构助力生成式AI

Azure云科技 2023-04-12
851

新近AI模型的计算规模与复杂性,正在成指数级增长。先进AI,离不开超级计算基础设施、服务与专业知识。在微软,我们将过去十年的超级计算经验和支持超大型AI训练工作负载的经验应用于搭建具备大规模化高性能的AI基础架构。微软 Azure 智能云,特别是以图形处理单元(GPU)加速的虚拟机(VM),为微软及其客户的生成式AI发展奠定了基础。






01

 Azure迄今更强大和高度

 可伸缩的AI虚拟机系列发布


微软现推出 ND H100 v5 VM,该虚拟机支持的按需配置可达8至上千个通过 Quantum-2 InfiniBand 网络互连的 NVIDIA H100 GPU,使得AI模型的性能明显提高。相较上一代 ND A100 v4 VM,本次推出的虚拟机包含以下创新技术:


8块 NVIDIA H100 Tensor Core GPU,通过下一代 NV Switch 和 NV Link 4.0 互连。

在无阻塞胖树网络中,每个 GPU 搭载400 Gb/s NVIDIA Quantum-2 CX7 InfiniBand 和每 VM 3.2Tb/s 的性能。

每个 VM 中的8块本地 GPUs 之间通过3.8Tb/s 对分割带宽的 NV Switch 和 NV Link 4.0互联。

第四代英特尔至强可扩展处理器。

PCIE 第5代主机到 GPU 互连,每个 GPU 带宽为64Gb/s。

16信道的4800 MHz DDR5 内存。








02

 云端交付百万兆次级

 AI 超级计算机


生成式 AI 应用程序正在迅速发展,几乎在每个行业中都有独特的价值显现。从使用新的 AI 驱动的 Microsoft Bing 和 Edge 重塑搜索功能,到 Microsoft Dynamics 365 中 AI 驱动的辅助服务,AI正迅速成为软件及其交互方式的普遍组成部分,而我们的 AI 基础设施将为生成式 AI 的应用铺平道路。


凭借微软向全球 Azure 客户提供多 ExaOP 超级计算机的经验,客户可以通过我们的基础架构来实现真正的超级计算机性能。对于微软、Inflection、NVIDIA 和 OpenAI 等致力于大规模部署的企业来说,这将能够支持下一代大规模 AI 模型的发展



我们对于对话式 AI 的关注促使我们开发和训练一些最复杂的大型语言模型。Azure 的 AI 基础结构为我们提供了必要的性能,以便大规模、可靠地、高效处理这些模型。我们对 Azure 的新 VM 及其将为我们的 AI 开发工作带来的性能提升感到非常兴奋。


—— Mustafa Suleyman

Inflection 首席执行官



大规模 AI 已内置于 Azure 的 DNA 中。我们对大型语言模型研究(如图灵)的初始投资,以及诸如在云中构建第一台 AI 超级计算机等里程碑,都为生成式 AI 的问世做好了充分准备。Azure 机器学习等 Azure 服务使客户能够访问我们的 AI 超级计算机,以进行模型训练。Azure OpenAI 服务使客户能够利用大规模生成式 AI 模型的强大功能。「规模」一直是 Azure 优化 AI 基础设施的目标之一。现在,我们正为各种规模的初创公司和企业带来无需大量物理硬件或软件投入的超级计算功能。


现在,ND H100 v5 预览发布,将成为 Azure 产品组合中的标准服务。




NVIDIA 和 Microsoft Azure 通过多代产品的合作,为世界各地的企业带来领先的 AI 创新。NDv5 H100 VMs 将赋能生成式 AI 应用程序和服务的新时代。


—— Ian Buck

NVIDIA 超大规模和高性能计算

副总裁




文章转载自Azure云科技,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论