DevOps效能度量

Woody的专栏 2021-04-14

744

前言

之前做了几个公司的DevOps转型，发现不少公司都比较热衷于如何去度量DevOps效能。（一部分原因是领导们想要以此来考核KPI。）

度量的方式有很多种，这里我就基于这些年DevOps咨询的经验，总结了一些可度量的指标供大家参考。

大家可以根据不同的指标组合使用，并结合自己的团队的实际情况，量力而为。有些指标需要自己根据情况开发脚本来统计。

其实目前市面上的大部分DevOps工具或平台，都或多或少的有了各种数据报表，来帮助团队进行DevOps效能度量。

DevOps效能度量指标

效能等级

效能主要分为4个等级：

精英效能
高效能
中等效能
低效能

精英效能则是以谷歌、微软、亚马逊等公司的DevOps先驱团队为代表的团队水准。

高效能是目前大部分DevOps实践做得好的团队水准。

中等效能则代表了大部分正在DevOps探索路上的团队水准。

低效能则是大部分还没开始使用DevOps的团队水准。

度量指标

度量指标有两种：

结果指标
过程指标

过程指标远多于结果指标，过程指标是帮助我们改进敏捷开发过程的。结果指标多用于做总结汇报。

阶段分类

DevOps是一个非常长的价值流，那么在这个过程中，我们大致可以把它分为三个阶段来进行效能度量。

敏捷开发管理
持续交付
技术运维

第一个阶段主要对应了需求和管理部分。

第二个阶段主要针对整个研发过程。

第三个阶段主要针对上线后的运维部分。

所有的指标又可以分为交付效率和质量两类。

因此把所有指标汇总一下，就如下图一样。

DevOps效能度量指标详解

用户故事交付周期

用户故事从创建到上线所需要的时间。
计算方式：一个用户故事从创建到上线所需的时间。

用户故事吞吐量

一个迭代内能完成的用户故事总数。
计算方式：迭代内完成用户故事数。

用户故事完成率

一个迭代内，规划的用户故事数与完成的用户故事数的比率。
计算方式：实际完成用户故事数/规划用户故事数。

团队速率

一个团队每个迭代能完成故事点的数量。
计算方式：每个迭代完成故事点数。

故事点完成率

一个迭代内，规划的故事点数与完成的故事点数的比率。
计算方式：实际完成的故事点/规划的故事点。

需求停留时长

一个需求从创建到分析完成后，并进入开发所花的时间。
计算方式：需求挪动到“开发中”列的时间点 - 需求出现在“待处理”列的时间点。
备注：需求分析完成后在等待开发中也算等待成本。这里其实度量的就是Processing time。

研发停留时长

一个需求开发完成所需要的时间。
计算方式：需求挪动到“测试中”列的时间点 - 需求出现在“开发中”列的时间点。
备注：需求开发完成后在等待测试中也算等待成本。这里其实度量的就是Processing time。

测试停留时长

一个需求测试完成所需要的时间。
计算方式：需求挪动到“待上线”列的时间点 - 需求出现在“测试中”列的时间点。
备注：这里其实度量的就是Processing time。

部署频率

代码部署到服务器的频率，不论是测试环境还是生产环境。
计算方式：间隔多久部署一次

发布频率

代码发布到生产环境的频率。
计算方式：间隔多久发布一次。
备注：发布频率是小于部署频率的。

发布时长

一次发布上线的过程所需的时间。
计算方式：一次发布所需时间。

发布失败率

发布上线有可能失败，此指标用于统计失败率。
计算方式：发布失败次数/发布总次数

变更前置时间

从代码提交到代码正式运行在生产环境所需要的时间。
计算方式：代码上线时间 - 代码提交时间。

构建频率

构建发生的频率
计算方式：一个迭代内构建的次数

构建失败率

CI在构建的时候会因为各种原因失败
计算方式：迭代内构建失败次数/迭代内构建总次数

CI修复时长

CI红了之后需要花时间去修复，此指标统计修复CI所需的时间。
计算方式：CI重新变绿的时间 - CI变红的时间

代码坏味道数

很多代码扫描工具都能统计代码坏味道，比如Sonar。
计算方式：单次构建扫描的坏味道数，取多次的平均数。

代码重复率

重复代码在代码库中的占比。Sonar等工具能统计结果。
计算方式：重复代码数量 / 总代码数。

代码扫描bug数

Sonar等工具能扫描出代码中存在的bug数。
计算方式：迭代内代码扫描bug出现的次数。

代码扫描漏洞数

Sonar等工具能扫描出代码中存在的漏洞数。
计算方式：迭代内代码扫描漏洞出现的次数。

代码提交频率

统计每日代码提交的次数。
计算方式：每日代码commit或push次数。

代码合并次数

统计周期时间内代码合并的次数。
计算方式：迭代内代码merge request次数。

代码评审通过率

每次代码评审都有可能因为代码质量原因不通过。
计算方式：迭代内代码评审通过次数/迭代内代码评审总次数

自动化测试率

测试工作有多少是自动化完成的，而不依赖于人工测试。
计算方式：（自动执行测试用例数 - 人工执行测试用例数）/ 总测试用例数
备注：测试分为很多类型：单元测试、集成测试、验收测试、性能测试、安全测试等，可以分别度量。

自动化测试失败率

CI跑的测试是会因为各种原因失败的，这个指标用于统计失败的频率。
计算方式：CI测试失败次数/CI测试执行总次数

测试覆盖率

测试所覆盖的代码的比率
计算方式：大部分测试工具都能自动统计测试覆盖率，比如Jacoco

缺陷修复时长

一个缺陷修复所需的时间。
计算方式：一个缺陷修复所需的时间。

缺陷密度

统计一个迭代内缺陷出现的密度。
计算方式：迭代内缺陷个数/迭代内用户故事数

服务恢复时间

一次服务故障恢复所需的平均时间。
计算方式：服务恢复时间 - 服务故障发生时间

生产问题个数

统计周期时间内生产问题的个数，多次统计后以计算平均数。
计算方式：用户故事上线后2个迭代内生产问题的个数。

生产问题密度

统计周期时间内生产问题产生的密度。
计算方式：用户故事上线后2个迭代内发生的问题个数/2个迭代的用户故事数

每个指标对于具体的等级的数值请参考下表。

总结

DevOps是敏捷开发的一种演进，通过结合人、流程与工具，持续改进研发效能。

因此度量只是一种可视化手段，真正能提高效能的还是要从文化、组织、技术等方面去建设DevOps。不断消除浪费，提高生产效率。

对于此DevOps效能度量有任何疑问欢迎找我讨论。我也会在后续的咨询工作中不断去总结和改善这个效能度量指标。

数据库

文章转载自Woody的专栏，如果涉嫌侵权，请发送邮件至：contact@modb.pro进行举报，并提供相关证据，一经查实，墨天轮将立刻删除相关内容。