[转]系统化全方位监控告警总结
Q1花了较大的篇幅,系统化讲述了监控与告警体系的建立,本文稍作总结。如果恰巧你正在搭建自动化监控与告警平台,或许,细读这一系列文章就够了。
- 什么是集群信息管理
- 使用配置文件进行集群信息管理
- 使用服务进行集群信息管理
- 使用配置中心进行集群信息管理
- 使用配置文件进行员工信息管理
- 使用服务进行员工信息管理
- 常见分级告警策略:告警收敛,分时告警,逐层上报,黑白跳动
三《多维度立体化监控》
- 什么是多维度立体化监控
- 立体化监控有哪些维度
- 操作系统+进程+端口
- http状态码
- 服务存活性
- 接口处理时间
- http接口
- log监控
- 用户视角
- 如何快速实施“1.操作系统+进程+端口”的监控
- 如何快速实施“2.http状态码”的监控
- 如何快速实施“3.服务存活性”的监控
- 如何快速实施“4.接口处理时间”的监控
- 常见http监控玩法
- 常见http监控的弊端
- 通用可扩展http监控平台架构
- 简版http监控框架架构
- 100行伪代码搞定http监控
- 什么是日志监控
- 日志分级,错误日志监控,正常日志监控
- 日志与目录规范
- 集中式日志监控及实现方案
- 分散式日志监控及实现方案
- 90行伪代码搞定log监控
- 什么是用户视角的监控
- 机房布点法
- 端上报法
- 第三方监控法
希望这六篇文章,对大家建立体系化的监控告警平台能有所帮助,告别背锅的时光。
调研一,下列场景大家是否经常遇到:
- 用户和老板总是比研发先发现线上问题
- 总是需要凌晨起床处理线上问题
- 短信一响就异常紧张
调研二,下列技术体系大家是否已经具备:
- 集群信息管理
- 员工信息管理
- 分级告警策略
- 多维度立体化监控
- 操作系统+进程+端口
- http状态码
- 服务存活性
- 接口处理时间
- http接口
- log监控
- 用户视角
[resource]系统化全方位监控告警总结