【第一章】概念
- 定义和要素
- 开发和运维的分工
【第二章】监控
- 监控的对象和数据来源
- 如何采集监控数据
- 监控数据的显示和告警机制
【第三章】容灾
- 故障来源和分类
- 机器硬件故障、网络故障、机房故障处理机制
【第四章】控制
- 介绍控制的定义和作用
- 控制的分类和实施
通过本课程学习,学员将了解如何搭建一套监控体系,当线上出现故障时,如何进行容灾以及如何在不影响线上运行的同时实施旁路控制。