暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

AI 智能时代的 Azure Maia:从芯片到软件再到系统

Azure云科技 2024-05-07
354


(本文翻译自微软全球官方博客)


随着 AI 智能技术为各领域带来加速变革,微软也在持续不断的构建和增强全球云计算基础架构,提供更高效、更快速、更高性能的计算和智能解决方案,以满足客户和开发人员的需求。国际版 Azure AI 基础设施涵盖来自业内领先者及微软自研的创新技术,其中包括去年11 月宣布的美国微软公司首个自研智能加速器 Azure Maia 100。本文我们将深入探讨 Azure Maia 100 的技术和研发历程。

所有发布内容均为微软全球研发成果,在各个国家或地区的可用性取决于当地情况。



#01

Azure Maia 100,扩大半导体创新的边界


Maia 100 专为运行基于云端人能工作负载构建,该芯片的设计借鉴了微软在运行复杂和大规模智能工作负载(如 Microsoft Copilot)方面的经验。Maia 100 是采用 TSMC 先进封装技术在 5 纳米节点上制造的最大处理器之一。 

通过与 Azure 客户和半导体生态系统中的领导者(如代工厂和 EDA 合作伙伴)合作,我们将继续把客户实际业务中的工作负载需求应用到芯片设计中,优化从芯片到服务的整个堆栈,并为客户提供最佳技术,赋予他们更多创新能力。




#02

端到端系统优化,旨在实现可扩展性和可持续性 


在开发 Azure Maia AI 加速器系列的架构时,微软对端到端堆栈进行了重新设计,使我们的系统能够在更短的时间内更高效地处理前沿模型。智能工作负载对基础设施的要求与其他云计算工作负载有很大不同,它需要更高的功率、冷却和联网能力。Maia 100 的定制机架级配电和管理与 Azure 基础设施集成,实现了动态电源优化。Maia 100 服务器采用基于以太网的全定制网络协议设计,每个加速器的聚合带宽为 4.8 TB,可实现更好的扩展和端到端工作负载性能。

在开发 Maia 100 时,我们还建立了一个专用的 "助手",以匹配芯片的热特性,并为 Maia 100 加速器及其主机 CPU 增加了机架级闭环液体冷却系统,以实现更高的效率。这种架构使我们能够将 Maia 100 系统引入现有的数据中心基础设施,并在这些设施中加装更多服务器,同时不会扩大现有的占地面积。Maia 100  "助手"的制造和生产也符合我们的零废弃承诺。




#03

携手开源生态系统,从底层开始一同优化硬件和软件 


从一开始,透明度和协同发展就是我们设计理念的核心原则,这个原则也一直贯穿构建和开发的全过程。协作能够促进整个行业的迭代开发,在 Maia 100 平台上,我们培养了从算法数据类型到软件、再到硬件的开放社区思维。

为了让用户可以更容易的在 Azure 海外版 AI 基础架构上的开发智能模型,微软正在为 Maia 100 开发软件,使其能与流行开源框架(如 PyTorch 和 ONNX Runtime 等)集成。该软件栈提供了丰富而全面的库、编译器和工具,使数据科学家和开发人员能够在 Maia 100 上成功运行他们的模型。



为了优化工作负载性能,AI智能技术硬件通常需要开发针对特定芯片的定制内核。为了在 Azure 中实现智能加速器间的无缝互操作性,我们集成了 OpenAI 的 Triton。Triton 是一种开源编程语言,通过抽象底层硬件来简化内核编写。这将赋予开发人员完全的可移植性和灵活性,同时不会牺牲效率和针对特定智能工作负载的能力。



Maia 100 还首次实现了 Microscaling (MX) 数据格式,这是一种行业标准化数据格式,可加快模型训练和推理时间。微软与 AMD、ARM、英特尔、Meta、英伟达和高通公司合作,通过 Open Compute Project 社区发布了 v1.0 MX 规范,使整个智能生态系统都能从这些算法改进中受益。

Azure Maia 100 是一项独特的创新,它结合了最先进的芯片封装技术、超高带宽网络设计、现代化冷却和电源管理以及硬件与软件的算法协同设计。我们期待通过在全球数据中心引入更多芯片、系统和软件创新,继续推进实现AI智能技术的目标。




了解更多


了解更多关于国际版 Azure AI 基础架构的信息

🔗  https://azure.microsoft.com/zh-cn/solutions/high-performance-computing/ai-infrastructure/


了解更多关于国际版 Azure AI 的信息

🔗  https://azure.microsoft.com/zh-cn/solutions/ai/






文章转载自Azure云科技,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论