
高性能计算(HPC)被广泛应用于不同行业场景,例如芯片设计自动化(EDA)、制造业计算机辅助工程(CAE)、生命科学基因测序、分子动力学模拟、金融业保险精算等。
微软智能云 Azure 一直致力于为客户提供业界顶尖的高性能计算产品。现在,全新 Azure HBv3 高性能计算机型落地中国北三区。参数显示,HBv3 机型性能十分卓越。为了,本文将从以下四个方面进行实测:CPU 频率、存储性能、InfiniBand 性能和 NUMA 节点,力求客观准确地呈现实测结果。
性能指标 | 官方文档描述 |
CPU 频率 - 并发 10 core 以下 | 3.5MHz |
CPU 频率 - 并发 10 core 以上 | 3.0MHz |
超线程是否关闭 | 是 |
本地 SSD 读 IOPS | 250, 000 |
本地 SSD 写 IOPS | 190, 000 |
InfiniBand 传输速度 | 192Gbps |
NUMA 节点 | 支持4个 NUMA 节点 |
满载 CPU 小于 10 Core 的情况
测试方式
用 sysbench 压测后通过 cpuinfo 观察负载 CPU 的运行频率
测试结果:性能达标
CPU 满载频率 3.45MHz,和官方标注的 3.5MHz 相差无几
测试步骤
跑满 1 个 CPU → CPU 核心频率在 3.45MHz

跑满 8 个 CPU → CPU 核心频率在 3.35 - 3.45MHz 之间

满载 CPU 大于 10 Core 的情况
测试方式
用 sysbench 压测后通过 cpuinfo 观察负载 CPU 的运行频率
测试结果:完全达标
CPU 满载频率 3.09MHz,超过官方标注的 3.0MHz
测试步骤
跑满 60 个 CPU → CPU 核心频率稳定在 3.09MHz 左右

跑满 120 个 CPU → CPU 核心频率稳定在 3.09MHz 左右

测试方式
通过 FIO 压测本地 NVMe 磁盘,16K 顺序读写
测试结果:性能达标
官方文档中的标称值是将两块 NVMe 条带化以后的性能,可以近似认为是以下单块盘测试结果 * 2
读 IOPS:126757*2 ≈ 250, 000,官方标称值 201, 000
写 IOPS:96712*2 ≈ 190, 000,官方标称值 186, 000
测试步骤
FIO_Read:
fio -name=mytest -filename=/mnt/nvme0n1/test1 -direct=1 -iodepth=20 -thread -rw=read -ioengine=libaio -bs=16k -size=5G -numjobs=10 -runtime=300 -group_reportin

FIO_Write:
fio -name=mytest -filename=/mnt/nvme0n1/test1 -direct=1 -iodepth=20 -thread -rw=write -ioengine=libaio -bs=16k -size=5G -numjobs=10 -runtime=300 -group_reporting

测试方式
用 ib_read_bw 和 ib_write_bw 测试读写带宽
测试结果:性能达标
读操作带宽:188Gbps 接近官方标称值 192Gbps
写操作带宽:188Gbps 接近官方标称值 192Gbps
测试步骤
Ib_read_bw
读操作带宽:23554MB/s = 188Gbps

Ib_write_bw
写操作带宽:23547MB/s = 188Gbps


测试方式
通过 LSCPU 查看 NUMA 节点分布,通过 NUMACTL 控制 Sysbench 运行
测试结果:性能达标
HBv3 原生支持 4 路 NUMA 节点
测试步骤

通过 NUMACTL 指令强制应用运行在指定的 NUMA Node

本文转载自|Azure上云直升机
作者|童麒麟
微软中国客户成功事业部架构师总监
童麒麟







