工 沌 混 室 验 中国混沌工程调查报告 实 (2021 年) 程 混 工 沌 混沌工程实验室 室 2021 年 11 月 实 验 工 沌 混沌工程实验室 中国混沌工程调查报告 2021 版权声明 本报告版权归混沌工程实验室所有,受法律保护。如需转载、摘抄或通过其他方式使用本报告内容,须注明“来源:混沌工程 混 实验室”,违者必究。 室 验 实 程 工 沌 混 实 验 室 工 沌 混沌工程实验室 中国混沌工程调查报告 2021 前言 随着分布式架构的普及以及云计算技术的成熟,国内企业应用云原生化推进业务系统的迭代速度越来越快,后端系统架构 日趋复杂,服务间的依赖越来越多,调用的链路越来越长。宕机引发巨额损失、严重影响用户体验的新闻层出不穷,为了让云 基础设施更好地适应复杂多变的运行环境,持续提供超大规模、超高稳定性的运行效能,一种新的软件思潮——“混沌工程 混 学(Chaos Engineering)”应运而生。混沌工程提供了一种端到端的稳定性测试理念与工具框架,通过主动引入故障来充分 验证系统和应用的脆弱性,提前发现并解决问题,力求防患于未然,从而从根本上提高系统和应用的鲁棒性。 室 2020 年初,中国信通院开始组织专家进行混沌工程技术研究,提出应用混沌工程方法来验证企业软件系统的韧性架构。 2021 年 4 月 2 日,混沌工程项目研讨会议在京召开并发布《混沌工程平台能力要求》标准纲要,并在 2021 年 7 月于可信云 大会上牵头成立国内首个混沌工程实验室,旨在探索混沌工程在国内各领域典型应用场景中的实践落地,联动云计算上下游企 验 业来共同推进混沌工程概念快速普及。 为了了解我国混沌工程发展全貌,混沌工程实验室于 2021 年 9 月启动《中国混沌工程调查报告》问卷征集活动,此举有 助于更深入探索我国云上软件系统稳定性现状、混沌工程使用情况、行业采纳度、技术成熟度及未来发展趋势,以期推动混沌 实 工程在我国的概念普及,提升云上软件系统稳定性,促进软件质量发展。 本报告采用在线调查加线下访谈的方式,共回收有效问卷 1016 份、访谈企业 17 家。报告的第一部分介绍调查背景,第 二部分介绍我国混沌工程当前使用情况,第三部分是混沌工程致力于提高的系统稳定性现状,第四部分聚焦混沌工程的发展建 程 议。本报告以调查结果为基础,力争详实客观地反映混沌工程领域应用现状与痛点需求,为广大从业人员、专家学者和研究机 构提供真实可信的数据参考。 本次报告的问卷发放、数据采集及文稿审核工作得到混沌工程实验室所有成员单位(见文末附录)及 InfoQ、中国云原生 工 沌 社区等单位或组织的大力支持,在此谨表示最衷心的感谢!同时也对接受混沌工程调查访问的用户朋友表示最诚挚的谢意! 混 实 验 室 工 沌 混沌工程实验室 目录 中国混沌工程调查报告 2021 前言.................................................................................................................................................................................................................. 3 目录.................................................................................................................................................................................................................. 4 观点摘要.......................................................................................................................................................................................................... 5 混 一、调查背景.................................................................................................................................................................................................. 6 (一)调查方法及样本.......................................................................................................................................................................... 6 1、调查方法.................................................................................................................................................................................... 6 室 2、样本描述.................................................................................................................................................................................... 6 (二)报告术语界定.............................................................................................................................................................................. 8 二、混沌工程应用现状.................................................................................................................................................................................. 9 三、软件系统稳定性现状............................................................................................................................................................................ 16 四、发展建议................................................................................................................................................................................................ 22 验 编后语............................................................................................................................................................................................................ 23 附录................................................................................................................................................................................................................ 24 实 程 工 沌 混 实 验 室 工 沌 混沌工程实验室 中国混沌工程调查报告 2021 观点摘要  国内软件系统稳定性有较大可提升空间。调查数据显示,近 20%的受访用户所负责的产品可用性低于 2 个 9 (意味着用户每个月要忍受超过 7.3 小时的服务故障),超过 4 成产品的可用性低于 3 个 9(意味着用户每个月要忍受超 混 过 44 分钟的服务故障)。故障发生之后的解决情况也差强人意:仅不到一半的故障平均发现时长(MTTD)小于 1 小时; 故障平均修复时长普遍超过 1 小时,超过 6 成故障修复时间(MTTR)高于 1 小时,甚至有约 20%的服务故障修复时间超 过 12 小时。日益复杂的 IT 系统与快速迭代的软件交付为系统稳定性的保障带来诸多挑战和不确定性,国内软件系统稳定 室 性仍有较大提升空间。  验 混沌工程是提升产品可用性的有效手段,是建立稳定性优先战略的技术核心。调查数据显示,随 着混沌工程使用频率提升,低可用性(可用性低于 99%)的产品占比急剧萎缩,高可用性(可用性高于 99.99%)的产品 占比迅速增长。混沌工程通过在生产环境中执行探索性测试以发现系统中的隐藏问题,在软件系统稳定性维护上展现出巨 实 大价值。其中,提升服务可用性及降低故障修复时间是两大主要收益。65%的受访者认为采用混沌工程提升了服务可用性, 49.85%的受访者认为混沌工程帮助降低了 MTTR(数据详见图

pdf文档 信通院 中国混沌工程调查报告-2021年

文档预览
中文文档 25 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
信通院 中国混沌工程调查报告-2021年 第 1 页 信通院 中国混沌工程调查报告-2021年 第 2 页 信通院 中国混沌工程调查报告-2021年 第 3 页
下载文档到电脑,方便使用
本文档由 路人甲 于 2022-05-11 13:04:50上传分享
加微信群 有优惠
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。