NVIDIA AI Foundations 和 DGX Cloud 在与 NVIDIA 网络连接的 OCI Supercluster 上运行。
OCI Supercluster ™ 的 规模超过了世界上最大的超级计算机,现在最多可以扩展到 4,096 个 Compute Bare Metal 实例和 32,768 个 GPU
德克萨斯州奥斯汀, 2023 年 3 月 21 日/美通社/ – 甲骨文扩大了与 NVIDIA 的合作,包括在新的Oracle 云基础设施 (OCI) Supercluster _™_上运行战略性 NVIDIA AI 应用程序。NVIDIA 已选择 OCI 作为第一家提供大规模人工智能超级计算服务 NVIDIA DGX Cloud™ 的超大规模云提供商。此外,NVIDIA 还在 OCI 上运行 NVIDIA AI Foundations,这是其新的生成式 AI 云服务,可通过 DGX Cloud 获得。
“OCI 是第一个为各行各业的数千名客户提供大规模 AI 超级计算机的平台。这是一项关键功能,因为越来越多的组织需要计算资源来满足其独特的 AI 用例。为了支持这一需求,我们继续扩展我们与 NVIDIA 的合作,” Oracle 云基础设施执行副总裁Clay Magouyrk说。
NVIDIA 企业计算副总裁 Manuvir Das 表示:“AI 驱动创新的无限机遇正在帮助几乎所有企业实现转型。NVIDIA 与 Oracle Cloud Infrastructure 的合作让每家企业都能获得 NVIDIA 加速计算平台非凡的超级计算性能。” .
OCI 的新超级集群
NVIDIA DGX Cloud和在其上运行的 NVIDIA AI Foundations 服务利用 OCI 独特的 Supercluster,该 Supercluster 已获得 NVIDIA 认证,以确保其符合 DGX Cloud 的高标准。
OCI 的 Supercluster 包括 OCI Compute Bare Metal,一个基于 NVIDIA 网络的超低延迟 RoCE 集群,以及一个 HPC 存储选择。它已由 NVIDIA 部署和验证,以支持数以千计的 OCI Compute Bare Metal 实例,这些实例可以高效地处理大规模并行应用程序。OCI Supercluster 网络现在最多可扩展到 4,096 个 OCI Compute Bare Metal 实例和 32,768 个 A100 GPU。带有NVIDIA H100 GPU 的OCI Compute Bare Metal 实例 现已限量供应。
此外,NVIDIA 还宣布 Oracle 正在将 NVIDIA BlueField-3 DPU 添加到其网络堆栈中。
用于构建自定义企业模型的生成式 AI 服务
NVIDIA AI Foundations 模型制作服务涵盖语言、图像、视频和 3D 以及生物学。企业可以使用 NVIDIA NeMo™ 语言服务和 NVIDIA Picasso 图像、视频和 3D 服务来构建专有的、特定领域的生成式 AI 应用程序,用于智能聊天和客户支持、专业内容创建、数字模拟等。对于生物 AI 模型训练和推理,NVIDIA BioNeMo™ 云服务提供了工具来快速定制和部署生成 AI 应用程序。
在 OCI 上,使用 NVIDIA AI Foundations 构建的自定义模型和 GPT-3 等模型系列受益于 OCI Supercluster,其中包括专门构建的 RDMA 网络,可提供接近线速的性能和微秒级延迟,并消除了依赖 RDMA 的工作负载的阻塞问题。
文章来源:https://www.prnewswire.com/news-releases/nvidia-chooses-oracle-cloud-infrastructure-for-ai-services-301777630.html




