
科技纵览︱IEEE SPECTRUM︱2021年3月︱5
NEWS
恢复网络的目的在于使网络有弹性
混沌工程很适合这种情况 作为
一种工程思维模式 它涉及在登月航
天科学发展期间出现的墨菲定律 如
果可能会出现问题 那么问题就一定
会出现
很难说是这些实践在疫情期间维
持着不堪重负的网络继续运行 其中
的变数非常多 不过 它对那些使用
混沌工程的技术人员是有帮助的 甚
至对于资产达 亿美元的新加
坡投资机构 星展银行这样一家
传统企业也是有帮助的 现场可靠
性工程师哈普利特
•
辛格
说 星展银行的网络弹性项
目已经进行了 年 早在 年项
目开始时 相关团队就在使用混沌工
具进行试验
混乱似乎是可传递的 琼斯的创
业公司 提出了一份她称之为 催
化事件 可被混沌工程模拟或发动
的事件 的策略视图 其中显示了组
织认为的运行情况与实际运行情况的
区别 是位于圣何塞的一家
有 年历史的公司 该公司提供的服
务产品是混沌工程工具 年
月 该公司发布了 年首份 混
沌工程状态 报告 在发布报告的博
文中 该公司市场营销副总裁艾琳
•
霍根 讲述了这些天
有 多人参加的混沌工程大会
她指出 到目前为止 仅 的
用户群就进行了近 万次混沌工程
系统攻击
冈萨雷斯说 亚马逊网络服务已
经进行混沌工程实践很久了 今年
随着网络化世界有望从前所未有的压
力测试中恢复过来 亚马逊网络服务
正在启动一项故障植入服务 云端客
户可用它进行自己的试验
谁知道未来的需求是什么样的
呢
作者
制造混乱 以下是网飞发明的“混沌工程”的
工作原理。
在线发表评论 :
spectrum.ieee.org/chaos-mar2021
网飞工程师用该公司的 来连接其连续交付系统 该系统与网飞
外部云服务提供商 相连 对于每条 指令 外部云服务提供商都会根据系统 控
制平面 中的压力点位置略微修改若干测试操作 订阅者通过服务的虚拟前门
选择视频观看 作为观看体验的一部分 系统会向订阅者提供少量的修改服务 在
网飞描述的一个示例中 系统故意修改测试用户的书签服务 如果用户在观看视频的
中途退出网飞 那么该服务可能就无法记录用户的停止点 然后 会指示实
时监控系统 观察测试用户的体验 以确保 的小错误能够得到补偿且不会
造成连锁故障或系统崩溃
来源 等 生产中的自动化混沌实验 第届软件工程国际大会会议记录
评论