一个优秀的 IT 基础架构,应能持续支持不断增长的工作负载,动态应对实时资源波动,并始终维持高性能运行。VMware Cloud Foundation(简称 VCF)通过大规模推行云操作模型,加速 IT 敏捷性、增强基础设施扩展性、提升安全性,同时有效降低总拥有成本(TCO)。
现代化基础架构不仅需要强大的计算、网络和存储能力,还必须具备完善的运维体系:涵盖完整生命周期管理、清晰成本可视性,以及对安全状态的全面洞察。
作为 VCF的关键组成部分,VCF Operations 帮助企业构建、运维并保护私有云基础设施,它通过部署和维护其集群级组件,提供跨工作负载和基础架构堆栈的统一可见性和增强性能,并帮助遵守法规和组织规范,从而有效构建、运营并保护私有云基础架构。其部分优势包括更快的价值实现时间、提高资源利用率、缩短问题解决时间、成本可预测性以及安全合规的环境。
在 VCF 9.0 版本中,VCF Operations 带来了以下新特性与增强能力:
构建 VCF Stack
Fleet 管理
智能运维
成本管理
安全增强
图:VCF 9.0 中的 VCF Operations 新功能一、 构建VCF架构
VMware Cloud Foundation 9.0重塑了用户构建私有云架构的方式。VCF Installer 工具可帮助用户快速部署可重复使用的 VCF 基础架构单元(如应用集群),从而高效扩展到整个业务集群,并提高运营效率和一致性。
图:VCF 部署选项
VCF 9.0 引入了“fleet”新概念,代表一个完整的 VCF 架构单元,包括:
VCF Operations
VCF Automation
vCenter
NSX Manager
vSphere Cluster
工作负载域(Workload Domain)
其他管理组件
一个 VCF 环境可包含多个实例,但每个部署中仅包含一个 VCF Operations 与一个 VCF Automation 实例。
图:VCF 安装程序
VCF 9.0 引入了一个新的安装向导,它以清晰直观的顺序引导用户完成构建过程,包括:
新建或扩展已有 VCF 架构
配置高可用性(HA)与资源规模
使用 JSON 文件保存部署规格,便于未来复用
部署前校验与确认
安装完成后,用户即可通过 VCF Operations 登录管理
二、 Fleet 管理
企业在私有云规模化过程中,需确保架构的一致性与规范性。VCF Operations 提供集成式 fleet 管理工具,从许可证、身份、证书、生命周期等多个维度保障架构的标准化与可扩展性:
1. 许可证管理(License Management)
VCF Operations 现已成为整个 VCF 栈的许可证管理器。用户通过一份统一的 license 文件进行授权(不再使用每组件独立的25位十六进制密钥)。license 支持按核心(core)、vSAN TiB 计量,同时可包含 AI Foundation with NVIDIA 等高级服务授权追踪。
2. 单点登录与集中身份管理(SSO & Identity)
VCF Operations 允许跨 VCF 和 vCenter 实例集群进行单点登录。VCF 9.0 简化并现代化了 SSO,提供了简化的身份源管理,从而降低了运营复杂性,并通过灵活的配置增强了用户控制。用户还可以通过 VCF Operations,将 SSO 客户端设置应用到各个组件。该系统支持多种身份解决方案,包括 Active Directory Federation Services、Azure AD、OKTA、Ping 和 Open Authorization 2.0。
3. 证书与密码管理(Certificate & Password)
VCF 9.0 在 VCF Operations 中引入了统一证书管理,在整个 VCF 环境中提供流畅的体验。此功能有助于平稳、不中断的证书更新、与多个证书颁发机构的自动续订以及导入外部签名证书的能力。因此,它解决了操作难题,增强了安全措施,并确保了更高的合规性。
图:证书警报选项卡
集中式仪表板通过集成和整合促进了简化密码管理。该系统提供了密码状态和管理功能的全面概述,包括更新、轮换和到期通知。
图:密码状态概览
4. 生命周期管理(Lifecycle)
VCF 9.0 通过在单个 VCF Operations UI 下统一 Day 2 任务来增强生命周期管理,从而方便版本控制和协调升级,同时还简化了流程以减少主机重新启动并支持跨多个集群的自动化升级。
图:VCF 生命周期管理概览
三、 智能运维
由于多种原因,监控您的环境中的操作可能具有挑战性,包括:在关联基础架构数据(诊断、日志、指标、流量)时缺乏一致性,警报疲劳,第三方和容器监控以及在环境中移动工作负载时缺乏灵活性。通过最新版本,VCF Operations 通过引入以前分散在不同产品中的各种功能来缓解这些挑战。
1. VCF 运行状况和诊断
A. 诊断发现提供了一个单一管理界面,通过扫描和评估可用签名并突出显示“活动发现”页面上的当前问题来关联整个基础架构的问题。
B. VCF Health 提供对 vCenter 实例整体状态的视图,并深入了解连接利用率、服务以及常见功能,例如:
虚拟机操作
vMotion
快照管理
vSAN 运行状况
图:活动诊断发现
2. 存储操作
了解存储使用情况至关重要,VCF Operations 在利用率趋势分析方面表现出色。通过最新版本,VCF Operations 为 VCF 中的所有存储相关内容提供了一个单一管理界面,包括清单、配置和性能。存储分布洞察揭示了存储在集群和工作负载中的分配方式。这种详细视图使您能够高效管理资源并解决问题,确保最佳性能和资源利用率。
图:存储操作概览
3. 网络操作
VCF Operations 现在提供集成网络操作,通过实时健康监控、流量分析和应用程序洞察提供完整的网络视图。它可以自动发现业务应用程序和应用程序层,以进行整理和开始监控。
图:网络操作概览
4. 集成日志
VCF Operations 集成了所有组件的日志分析,从而可以在单个控制台中更轻松地进行事件过滤、趋势可视化和更快的故障排除。基于日志的警报和仪表板允许管理员监控事件趋势,有助于快速检测异常和诊断问题。
Log Assist 使搜索和整合日志变得容易,从而有效地进行根本原因分析 (RCA) 并加快问题的定位与修复。通过最新版本,用户可以生成捆绑包并将其附加到支持请求中,以便与支持团队进行有效互动。
图:日志比较可视化
5. 使用云原生管理包构建器进行扩展
管理包构建器现已在 VCF Operations 中可用,此功能为 VCF 组件以及第三方设备提供仪表板、警报和指标,以实现全面的监控和管理。
6. Supervisor 集群和 VKS 监控
VCF Operations 现在原生支持监控 Supervisor 集群和 VMware Kubernetes 服务。使用 Telegraf 代理,清单和指标数据从 Supervisor 和 VKS 推送到 VCF Operations。有几个开箱即用的清单仪表板和用于 Supervisor 的不同性能 KPI 指标,例如 CPU、内存、磁盘、节点、pod 和容器级指标,以排除与 Supervisor 相关的性能问题
图:VCF Supervisor 仪表板
7. 工作负载迁移规划
VCF 中的迁移规划旨在通过结合 VCF Operations for Networks 和 VCF Operations HCX 的强大功能,提供端到端流程来规划、调度和大规模迁移工作负载。
在此版本中,引入了此功能的几个关键方面:
用户可以轻松高效地根据应用程序定义迁移范围并了解依赖关系,确保不会遗漏任何关键元素。应用程序和网络依赖关系的发现降低了迁移过程中出错的风险,从而提高了可靠性。
通过HCX,将整个迁移过程分解为更易于管理的步骤,使用户可以一次专注于更小、定义明确的资源组,并更好地规划和执行分阶段迁移,从而最大限度地降低风险和复杂性。
对内存、核心和存储使用情况的洞察有助于用户有效规划可能影响迁移的任何资源限制,从而在整个迁移过程中实现明智的决策和优化的资源分配。
随着迁移规划的发展,客户将体验到更顺畅、更高效的迁移,并清楚地了解资源需求和依赖关系,从而实现更精简、更明智的方法来将工作负载迁移到 VCF 以及在 VCF 环境内部和之间进行迁移。
四、 成本管理
VCF Operations 帮助您量化 VCF 投资的回报。它跟踪整个环境的总拥有成本,以及所提供的建议可能节省和已实现的节省,以帮助您随着时间的推移衡量成本效率和成本节约。
VCF Operations 中的成本管理使用户能够更精确地监控与基础架构相关的成本以及相关的服务或许可证费用。它还支持回溯 (showback) 和分摊 (chargeback) 功能,帮助应用团队掌握其所使用基础架构资源的成本结构并进行优化。
IT 管理员和提供商可以利用一系列功能,例如用于费用归属的成本驱动因素、用于费率卡定义的定价策略、用于根据实际使用情况分配成本的回溯,以及用于使用预定义定价模型向租户或应用程序团队计费的分摊。
a. 费率卡
为了准确向租户计费,提供商现在可以为其提供的服务和资源定义定价策略或费率卡。这些配置允许设置每单位消耗的基本费率,确保根据定义的承诺一致地计算成本。
费率卡可以在广泛的参数范围内进行自定义,包括计算(CPU 和内存)、存储、网络、客户操作系统、标签、一次性固定成本和费率调整因素。这种灵活的模型使提供商能够将定价与基础架构使用和业务模型保持一致。
通过支持最新 VCF 许可模型的费率卡,用户现在可以根据最新的许可指标(例如核心和存储容量)准确归属费用。
b. 分摊
提供商现在可以通过增强的分摊仪表板访问详细的定价和分摊洞察,这些仪表板从多个管理角度提供成本可见性:
概述: 提供分摊数据的高级摘要——包括跨组织、区域配额和运行中虚拟机的成本和价格。
组织: 显示每个组织及其相应区域配额的分摊明细。
项目: 提供 VCF Automation 中所有项目的成本和定价的全面视图,以及对相关命名空间和部署的额外洞察。
VCF Operations 现在支持服务提供商和企业应用程序团队的现代基础设施即服务 (IaaS) 分摊模型。通过此版本,分摊功能与由 VCF Automation 提供支持的最新部署方法保持一致,提供了更大的灵活性和集成度。
c. 成本分析
利用成本分析,组织可以深入了解其私有云支出,找出低效率之处,并做出明智决策以优化投资。用户现在可以在简化的界面中轻松执行指标比较(例如成本与价格),从而加速洞察和决策。这种简化的体验通过在几次点击内快速识别高成本区域和跨基础架构组件的优化机会,显著缩短了价值实现时间。
五、 安全增强
安全管理功能提供了对基础架构级别和用户级别安全的全面视图,从而从风险角度降低了企业的整体复杂性,从而保持了整体安全态势。
1. SecOps 仪表板
安全运营仪表板提供了用户身份验证、权限和基础架构安全的全面实时视图,帮助组织主动管理 VCF 部署中的安全。
它提供对基础架构安全的洞察,涵盖了主机加密、主机模式合规性、vSAN 集群加密、CVE 漏洞咨询、证书健康状况和虚拟机加密状态等关键领域。
图:SecOps 仪表板
2. 合规性报告
VCF Operations 提供警报、策略和报告,以根据定义的基准验证 VCF 资源,提供持续的合规性检查和警报,并维护基础架构的合规性态势,从而降低组织和业务风险。
定义的基准可以是一个或多个以下内容:
预定义的 VMware 基准,根据各种 VMware 定义的安全建议监控环境。
构建您自己的自定义基准策略,根据自定义定义的策略检查环境。
开箱即用的法规遵从性,具体包括:CIS 安全标准、DISA STIG、FISMA 安全标准、HIPAA、ISO 安全标准和 PCI DSS 安全标准。
组织可以根据选择的基准主动检测 VCF 中的合规性配置错误和合规性漂移,并利用 VCF 与 VMware 或第三方配置管理工具的集成功能来自动修复合规性配置错误。
在 VCF 9.0 中,新增了用于 CIS (vSphere 8.0)、NIST SP 800-171 和 NIST SP 800-53 R5 的合规包,并升级了 HIPAA、PCI DSS v4.0 和 ISO/IEC 27001:2022 的合规包。
我们可以看到 VCF Operations 如何帮助客户实现基础架构现代化。它提供了使 VCF 基础架构能够作为一个统一的自动化系统运行的功能,从而帮助客户实现其 IT 和业务目标。
这只是 VCF 9.0 中 VCF Operations 新功能的概述。请继续关注更多博客,我们将在其中深入探讨所有新增和增强功能。




