[汇总]监控系统经验
系统监控
- USE 法(Utilization Saturation and Errors):USE 法把系统资源的性能指标,简化成了三个类别,即使用率、饱和度以及错误数。
- 性能指标: CPU, Memory, IO, Network, Connection
- 监控系统: 数据采集模块,数据存储模块,数据查询和处理模块,告警模块,可视化展示模块
应用监控
- 应用监控指标
- 全链路监控
- 日志监控
目标4个9的可用性?试试用 Prometheus 和 Grafana记录服务可用时间