封面
版权信息
内容简介
前言
第1章 关于SRE
1.1 为什么会引入SRE
1.2 DevOps和SRE对比
1.3 选择SRE
1.4 SRE的未来
第2章 SRE在组织内部的定位
2.1 如何介入组织
2.2 SRE工作着力点
2.3 如何衡量工作
2.4 贡献价值
第3章 监控建设
3.1 什么是好的监控服务
3.2 监控系统的设计逻辑分析
3.3 典型监控应用场景
3.4 报警治理
3.5 容器监控
3.6 监控智能化
第4章 变更管理
4.1 变更管理机制
4.2 变更控制
4.3 稳定性和迭代速度的权衡
4.4 变更风险控制
4.5 总结
第5章 异常响应
- APP免费
5.1 异常的定义
- APP免费
5.2 事故/事件定义
- APP免费
5.3 异常响应流程
- APP免费
5.4 如何处理值班过程中的异常响应
- APP免费
5.5 应急沟通机制
- APP免费
5.6 关于线上问题的ROC
- APP免费
第6章 服务稳定性治理
- APP免费
6.1 SLI/SLO/SLA的制定和落地
- APP免费
6.2 故障预防
- APP免费
6.3 抑制不可控因素
- APP免费
6.4 故障演练
- APP免费
6.5 故障自愈
- APP免费
6.6 业务MTTR
- APP免费
6.7 灾备建设
- APP免费
6.8 总结
- APP免费
第7章 事故复盘
- APP免费
7.1 关于事故复盘
- APP免费
7.2 如何提升事故复盘质量
- APP免费
7.3 事故分析的逻辑和原则
- APP免费
7.4 事故责任的划分逻辑
- APP免费
7.5 事后跟进
- APP免费
7.6 基于事故/事件的学习
- APP免费
第8章 容量管理
- APP免费
8.1 容量管理的目标
- APP免费
8.2 容量管理的方法和策略
- APP免费
8.3 容量分析系统建设
- APP免费
8.4 容量优化方式
- APP免费
8.5 容量预案
- APP免费
8.6 总结
- APP免费
第9章 用户体验
- APP免费
9.1 外部用户体验和内部用户体验
- APP免费
9.2 影响用户体验的要素
- APP免费
9.3 外部用户体验的改进策略
- APP免费
9.4 内部用户体验的改进策略
- APP免费
第10章 重要业务活动保障
- APP免费
10.1 重要业务活动的资源准备
- APP免费
10.2 参与运营活动评估
- APP免费
10.3 重要业务活动稳定性预案
- APP免费
10.4 重要业务活动准备阶段的工作重点
- APP免费
10.5 重要业务活动的变更执行要求
- APP免费
10.6 重要业务活动的运维人力
- APP免费
10.7 重要业务活动的收尾
- APP免费
第11章 运维操作基础
- APP免费
11.1 网络基础
- APP免费
11.2 4/7层协议
- APP免费
11.3 内核参数调优
- APP免费
11.4 常见命令行
- APP免费
11.5 配置管理工具
- APP免费
11.6 基础设施即代码
- APP免费
11.7 关于运维操作的未来
- APP免费
第12章 基础组件运维
- APP免费
12.1 负载均衡中间件
- APP免费
12.2 消息队列中间件
- APP免费
12.3 缓存中间件
- APP免费
12.4 数据库
- APP免费
12.5 组件运维
- APP免费
第13章 云计算和容器
- APP免费
13.1 云计算基础
- APP免费
13.2 虚拟化
- APP免费
13.3 容器
- APP免费
13.4 云存储
- APP免费
13.5 云网络
- APP免费
13.6 混合云
- APP免费
13.7 云原生
更新时间:2021-10-15 18:24:56