第5章 异常响应

说到线上异常,很多人会想到线上各种监控指标报警的场景。尤其是收到线上核心组件的异常报警后,整个人马上就会肾上腺素飙升,甚至开始出现呼吸急促的状态。发生异常往往意味着线上出现了问题,虽然所有人都不希望发生异常,但在实际工作中线上异常的出现是无法避免的。只要线上业务还在运行,肯定就会有问题被触发,不是变更导致的,就是服务器老化等被动因素导致的。对运维团队来说所有的异常必须被响应处理。在不同的公司,不同的部门异常响应可能有不一样的点,本章将结合作者之前的经历探讨异常响应相关的问题。