1 min read177 words

基础监控指标体系

监控的目的不是“图表好看”，而是提前发现你快出事了。

最小指标集

graph TD A[CPU] --> E[机器健康] B[内存] --> E C[磁盘] --> E D[网络] --> E F[HTTP 5xx] --> G[应用健康]

echo "cpu load: $(uptime)"
echo "disk:"
df -h
echo "memory:"
free -m

下一节：告警设计与故障发现——监控之后，要解决“什么时候打扰人”。