我们经常被客户问到:“vSAN Express Storage Architecture(ESA)的性能如何,与现有存储阵列相比表现如何?”我们也同样希望能有一个标准答案。然而,由于数据中心环境中存在众多变量,因此最恰当的回答往往是:“要视具体情况而定。”
不过,这是一个非常值得探讨的重要问题。在本篇内容中,我们将基于某大型客户在评估 vSAN ESA 与某主流存储阵列性能时的实际测试结果,提供一个更为详细的解答。
当然,我们不打算让你久等。那么,vSAN ESA 与该客户所使用的顶级、容量等效的传统存储阵列相比表现如何呢?以下是关键亮点摘要。
在应用级测试中,vSAN ESA 实现了比传统存储阵列高 20% 的 IOPS 性能,同时保持亚毫秒级低延迟。
在合成 I/O 存储测试中,vSAN ESA 的 IOPS 性能提升高达 70%,并依然保持亚毫秒级延迟。
在硬件故障条件下,vSAN ESA 的延迟降低了 61%,展现出更强的故障恢复性能。
除了性能优势之外,该客户的内部评估还显示:在实现更高性能的同时,vSAN ESA 的总体成本比其现有存储阵列低了 31%!
是的,差距确实如此显著。接下来,我们将进一步解析测试结果,以帮助您更全面的理解这些数据背后的意义。
存储性能评估的复杂性与挑战
除了数据可用性之外,提供充足且一致的性能也是企业级存储解决方案的核心职责之一。然而,要以真实有效的方式衡量存储性能,以贴近实际工作负载,却并非易事。长期以来,存储行业在这一问题上也造成了一定的困扰——许多厂商往往通过夸张的“英雄数据”(即存储系统在理想条件下可达到的理论峰值性能)进行对比宣传。
合成 I/O 生成器在评估存储系统中确实有其应用场景,但它们的结果通常侧重于总 IOPS(每秒输入输出操作次数),并不能真实反映具体应用在不同系统上的实际性能表现。此外,部分合成工具还可能被有意配置以绕过系统已知瓶颈,从而得出过于乐观的测试结果。
在本次性能对比中,我们有意避免这些片面或失真的测试方式。幸运的是,某大型金融服务客户允许我们观摩其在评估 vSAN ESA 与现有顶级存储阵列的过程中所进行的测试。客户希望更清晰的了解两者之间的性能差异,而我们同样也希望从中获得真实、具代表性的洞察结果。
真实环境下的直接对比分析
参与测试的客户的大部分工作负载来自高交易量的数据库,主要运行于 SQL Server 平台。这类工作负载对低延迟和性能一致性有极高要求。因此,在评估 vSAN ESA 与主流高端存储阵列的过程中,他们特别希望测试结果能够真实反映实际生产环境中的需求。
他们关注的性能表现集中在以下三个关键场景:
高交易压力时段:如在市场剧烈波动期间,系统是否能支撑大规模交易操作;
常规交易时段:即正常市场交易过程中,系统在持续负载下的稳定性与响应能力;
故障场景下的性能:包括传统存储阵列控制器故障或 vSAN 主机故障等情形下的系统表现。
此外,他们还希望通过传统的合成 I/O生成工具对两个系统进行压力测试,以全面了解各自的极限性能。因此,测试分为两大类进行:
1. SQL 工作负载测试(模拟金融交易型 OLTP)
该测试模拟了50 台运行 SQL Server 的虚拟机所承载的 OLTP 数据库负载,使用的是一种类 TPC-E基准测试。该基准旨在衡量固定数量(50 台)虚拟机在模拟金融券商交易场景下的整体性能表现。这种类 TPC-E 测试不仅包含存储操作,还涉及大量复杂的非存储计算任务,因此整体性能主要受到虚拟机 CPU 和数量的限制。
由于其性能瓶颈更多受限于计算资源而非存储资源,可将其视为一种“计算受限测试”。在故障场景下的性能表现评估,也采用了该类测试方法。
2. 合成存储 I/O 性能测试(极限性能压测)
该测试代表一种更为常见的存储评估方式,目标是衡量整个存储系统在IOPS、吞吐量、平均延迟等维度的理论极限性能,属于典型的“存储受限测试”。测试中使用 FIO 工具作为合成 I/O 生成器,在两个存储系统上均一致应用。
在 vSAN 侧,使用了 HCI Bench 工具(其底层同样基于 FIO)自动部署合适数量的worker 虚拟机。测试采用 8KB 数据块,读写比例为 70/30,以贴近客户 SQL 业务虚拟机的实际 I/O 模式特征。
测试环境配置
为保持评估的一致性和代表性,测试使用了一个由 6 台主机组成的 vSAN ESA 集群。每台主机大致符合vSAN ESA All-Flash 6节点 ReadyNode的配置规格,包含:
56 个 CPU 核心
6 块 NVMe 存储设备
768 GB 内存
25GbE 网络接口
该环境运行 vSAN 8U3 版本,所有虚拟机均应用了容错等级为 FTT=2(RAID-6)的存储策略。
测试结果分析
接下来,我们将一同查看本次测试的关键结果,并深入解读这些数据所代表的意义。
SQL 工作负载测试结果
本项测试旨在评估在高交易量压力下,固定数量的业务应用在两种不同存储系统上的性能表现。由于此测试模拟的是金融类应用的 OLTP 交易处理,因此不同存储系统之间的性能差距通常小于只针对存储本身的合成 I/O 压力测试。
在本次测试中,使用类 TPC-E 基准模拟,在 50 台虚拟机上运行 OLTP 应用:
在 vSAN ESA 集群上,该工作负载产生了 150,000 IOPS,平均延迟为0.93 毫秒;
在对比存储阵列上,同样的工作负载产生了 125,000 IOPS,平均延迟为 0.8 毫秒。
对比存储阵列,使用 vSAN ESA 时应用程序的性能提高了 20%,而平均延迟几乎相同,由此可知,业务应用在 vSAN 上的运行效率更高。

图1:TPC-E 应用测试结果
应用在常规负载与故障场景下的表现
当 vSAN 集群上的应用模拟较为温和的交易速率(即客户日常运行的典型负载,约 35,000 IOPS)时,应用的平均延迟下降至 0.65 毫秒,表明在常态交易条件下,系统能提供更优的响应速度。
在故障场景下的性能对比也颇具参考价值。当 vSAN 集群发生单台主机故障时,应用延迟上升至 1.71 毫秒;而当传统存储阵列出现控制器故障时,延迟则高达 4.33 毫秒。这意味着在类似故障情况下,vSAN 提供的有效延迟比传统存储阵列低61%,展现出其更优的稳定性与故障恢复能力。
合成存储 I/O 压力测试结果
本项测试聚焦于存储系统的总体性能极限,通常也是不同架构间差异最显著的测试类型,因为它几乎完全绕开了应用层负载,专注于后端存储的能力。
测试采用 8KB 块大小、70/30 的读写比例:
在 6 节点 vSAN ESA 集群中,系统实现了858,000 IOPS,平均延迟为 0.95 毫秒;
而对比存储阵列仅实现 500,000 IOPS,延迟为 1.0 毫秒。
换句话说,在延迟水平相近的前提下,vSAN ESA 集群的整体 IOPS 提升高达 70%,显著优于传统阵列的存储处理能力。

图2:传统存储与 vSAN ESA 在合成存储 I/O 测试场景中的比较
对于那些对低延迟与性能一致性要求极高的关键业务负载而言,本次测试结果具有明确的指导意义。vSAN ESA 在 VCF 环境中能够提供优于主流存储阵列的性能表现,不仅使应用运行更为高效,同时也能够在存储故障场景下维持亚毫秒级延迟,从容应对挑战。
上述测试结果也印证了自 vSAN ESA 发布以来众多客户的反馈:vSAN 相较于他们原有的存储解决方案,在性能上具有明显优势。
超越性能本身,vSAN 带来的更多价值
测试结果已经充分说明,在与传统存储阵列的对比中,vSAN ESA 能够轻松实现更优的性能表现。但 vSAN 的优势远不止于 IOPS、吞吐量或延迟指标上的领先。
作为一款真正具备分布式架构的超融合存储解决方案,vSAN 拥有天然的横向扩展能力。无论是构建聚合式 vSAN HCI 集群,还是构建分离式vSAN 存储集群,每新增一台主机都将带来可线性扩展的存储容量、计算能力与网络带宽。
最重要的是,这种扩展能力是可预测且成比例增长的,极大的简化了企业在扩容过程中的技术与财务复杂性,避免了传统三层架构中模块化存储阵列在扩展方面所面临的种种挑战。

图3:通过 vSAN 实现容量与性能的线性扩展,同时具备更低的边际扩展成本
当然,成本问题也不容忽视。由于 VCF许可为每个 VCF 核心授权 1TiB 的 vSAN 容量,vSAN 的实际每 TB 成本比客户环境中的存储阵列低 31%,同时存储性能也大幅提升。
总结
vSAN 是一款高性能存储,可以为您的应用程序提供更高性能。它内置于虚拟机管理程序中,并且是 VCF 许可证的一部分,如此高性价比的存储方案,您还在等什么呢!




