传统研发过程质量保障工作很大部分依赖于离线的流程规范与主观的质量评价,无法及时客观的反应过程质量的情况,从而对线上质量带来潜在的威胁。因此,我们准备建立研发过程质量风险控制体系,多角度评估过程质量数据,提示质量风险,推荐保障策略,避免线下风险转化为线上问题,故障率趋势逐步降低;同时提升研发质量意识,促进整体质量情况向好发展。
一. 背景问题
传统过程质量保障工作依赖于离线的流程规范与主观的质量评价,无法及时客观的反应过程质量的情况,从而对线上质量带来潜在的威胁。我们已经有一部分质量相关的数据产出,但是对研发过程&研发质量的影响很小,当前存在的几个问题:
| 问题 | 相关数据/事例 |
|---|---|
| 线上问题存在部分与风险意识流程规范等原因相关 | 21.9至今近一年有25%的线上问题与风险意识不足,流程规范问题原因相关 |
| 存在潜在过程质量问题未暴露 | 测试阶段因开发质量规范等问题导致的测试返工,人力投入增加等问题时常发生。原计划6.21完成测试的需求,6.22投入另外一个紧急项目,由于开发提测延期无法按期完成测试,被迫加班。 |
| 质量数据指标目前大部分使用场景存在滞后性,无法把控潜在风险问题 | 月报看提测准时率怎么下降了?是开发阶段插入了紧急需求?开发过程发现改动范围超过预期?有没有隐藏风险?但这个时候对应的需求已经发布上线了。 |
所以我们需要通过建立研发过程质量风险控制体系,多角度评估过程质量数据,提示质量风险,推荐保障策略,避免线下风险转化为线上问题,故障率趋势逐步降低;同时提升研发质量意识,促进整体质量情况向好发展,规范问题趋势逐步降低。
二. 整体思路方案
要想把握风险,首先要识别风险,基于质量度量,从需求项目出发,收集研发过程中各个环节研发质量和风险相关的数据,通过质量模型定义动态评估量化质量情况,识别研发过程中的风险,建立风险模型,通过策略中台为需求项目测试提供质量保障方案决策支持。

完善研发过程质量模型,多维度、多层次反馈研发过程中的质量数据
提供团队,个人,需求项目等各个维度过程质量数据图表供团队成员随时查看;月度/季度质量报告增加过程质量数据指标,为团队个人过程质量情况评估提供抓手;
因为我们前期已经有部分质量数据指标沉淀,所以这一阶段只是对已有的质量模型做优化,我们业务当前重点在交付质量的提升以保障线上业务的高可用和稳定性,优化重点在过程质量相关指标,增加部分核心过程指标,旨在提升交付质量(对应的结果指标)。
部分核心过程质量指标:

建立基础风险模型,对研发过程中的质量数据进行实时监控预警
支持风险策略规则配置,质量可视化增加风险数据图表,从开发阶段开始对数据实时监测,责任人报警提醒,并对风险预警数据进行统计分析,推进策略规则优化;
风险监控预警大概模型:

| 指标项 | 校验时间 | 校验方法 | 风险等级 | 结果 | 规则有效时间 | 作用域 |
|---|---|---|---|---|---|---|
| 提测通过率 | 实时 | <80% | 中 | 通知 | always | all |
| 阻塞型缺陷占比 | 实时 | >10% | 高 | 预警 | always | all |
| open缺陷数 | 预发阶段前2天 | >3 | 高 | 预警 | always | epay_20220822 |
| 提测延期时长 | 计划提测时间后 | >=2d | 高 | 预警 | 2022.8.1 ~ 2022.10.1 | OMWYZF163-XXXX |
| … |
基于研发过程数据动态变化,建立基础质量保障方案推荐策略
提测、准出环节提供风险评估报告(风险等级基础策略建议等),为测试方案提供决策&剪裁依据;
三. 实践进展
进展
当前整体方案已实现前面两个环节:
完成核心过程质量指标各维度配置展示,提供质量管理抓手;
过程质量大盘部分图例

完成项目质量大盘指标配置展示,为项目风险控制提供依据;
项目质量大盘部分图例

完成基础风险规则配置,提供质量实时监控预警能力;
风险预警示例

阶段性结果
线上故障分析结果:2022Q4线上故障的流程规范缺失&违反流程规范归因数量较2022Q3降低78%(Q3/Q4:9/2),同时,2022H2线上故障数量整体呈下降趋势

四. 后续规划
风险预警规则还有很大的优化空间,个性化监控规则支持&质量保障策略推荐实现;
全流程质量风险评估报告输出;
现在大部分风险数据集中在提测环节后,需求开发阶段未覆盖,需完善该阶段的质量风险采集预警;
-- End --
点击下方的公众号入口,关注「技术对话」微信公众号,可查看历史文章,投稿请在公众号后台回复:投稿




