暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Azure 中国区 HBv3 性能实测

Azure云科技 2023-08-04
573



高性能计算(HPC)被广泛应用于不同行业场景,例如芯片设计自动化(EDA)、制造业计算机辅助工程(CAE)、生命科学基因测序、分子动力学模拟、金融业保险精算等。


微软智能云 Azure 一直致力于为客户提供业界顶尖的高性能计算产品。现在,全新 Azure HBv3 高性能计算机型落地中国北三区。参数显示,HBv3 机型性能十分卓越。为了,本文将从以下四个方面进行实测:CPU 频率、存储性能、InfiniBand 性能和 NUMA 节点,力求客观准确地呈现实测结果。

HBv3 的官方性能描述和指标


最新 3.0MHz – 3.5MHz 高主频 AMD Milan-X CPU

✓ 120 物理 CPU 核

✓ 高达 1.5G L3 缓存

✓ 200Gpbs 的 InfiniBand 网络

✓ 两块 900G 的高速 NVMe 本地 SSD,单块提供 100K IOPS


性能指标

官方文档描述

CPU 频率 - 

并发 10 core 以下

3.5MHz

CPU 频率 - 

并发 10 core 以上

3.0MHz

超线程是否关闭

本地 SSD 读 IOPS

250, 000

本地 SSD 写 IOPS

190, 000

InfiniBand 

传输速度

192Gbps

NUMA 节点

支持4个 NUMA 节点



CPU 性能测试

满载 CPU 小于 10 Core 的情况


测试方式

用 sysbench 压测后通过 cpuinfo 观察负载 CPU 的运行频率


测试结果:性能达标

CPU 满载频率 3.45MHz,和官方标注的 3.5MHz 相差无几


测试步骤


跑满 1 个 CPU → CPU 核心频率在 3.45MHz


跑满 8 个 CPU → CPU 核心频率在 3.35 - 3.45MHz 之间



CPU 性能测试

满载 CPU 大于 10 Core 的情况


测试方式

用 sysbench 压测后通过 cpuinfo 观察负载 CPU 的运行频率


测试结果:完全达标

CPU 满载频率 3.09MHz,超过官方标注的 3.0MHz


测试步骤


跑满 60 个 CPU → CPU 核心频率稳定在 3.09MHz 左右


跑满 120 个 CPU → CPU 核心频率稳定在 3.09MHz 左右



本地 NVMe 磁盘读写


测试方式

通过 FIO 压测本地 NVMe 磁盘,16K 顺序读写


测试结果:性能达标


  • 官方文档中的标称值是将两块 NVMe 条带化以后的性能,可以近似认为是以下单块盘测试结果 * 2

  • 读 IOPS:126757*2 ≈ 250, 000,官方标称值 201, 000

  • 写 IOPS:96712*2 ≈ 190, 000,官方标称值 186, 000


测试步骤


  • FIO_Read:

    fio -name=mytest -filename=/mnt/nvme0n1/test1 -direct=1 -iodepth=20 -thread -rw=read -ioengine=libaio -bs=16k -size=5G -numjobs=10 -runtime=300 -group_reportin


    • FIO_Write:

      fio -name=mytest -filename=/mnt/nvme0n1/test1 -direct=1 -iodepth=20 -thread -rw=write -ioengine=libaio -bs=16k -size=5G -numjobs=10 -runtime=300 -group_reporting



      InfiniBand 带宽测试


      测试方式

      用 ib_read_bw 和 ib_write_bw 测试读写带宽


      测试结果:性能达标


      • 读操作带宽:188Gbps 接近官方标称值 192Gbps

      • 写操作带宽:188Gbps 接近官方标称值 192Gbps


      测试步骤


      Ib_read_bw

      读操作带宽:23554MB/s = 188Gbps


      Ib_write_bw

      写操作带宽:23547MB/s = 188Gbps



      NUMA 节点



      测试方式

      通过 LSCPU 查看 NUMA 节点分布,通过 NUMACTL 控制 Sysbench 运行


      测试结果:性能达标

      HBv3 原生支持 4 路 NUMA 节点


      测试步骤


      通过 NUMACTL 指令强制应用运行在指定的 NUMA Node



      测试结论

      Azure 中国区的新机型 HBv3 实测结果和官宣性能一样炸裂,无论从 CPU 频率,磁盘读写和 InfiniBand 带宽角度,都达到了业界领先水平。


      本文转载自|Azure上云直升机

      作者|童麒麟 

      微软中国客户成功事业部架构师总监

      童麒麟



      文章转载自Azure云科技,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

      评论