【分享】常用的服务器监控方式(适合小站长/运维新手)
本帖最后由 傲来云 于 2025-4-22 14:48 编辑现在的服务器动不动挂掉、跑满、出错,要是没监控,基本就是“客户告诉你问题”。所以还是得提前搞点监控,哪怕是简单的。我平时用的是这一套,分享下:
✅ 系统资源监控(CPU、内存、磁盘、网络)
[*]装个 Netdata 就够用了,部署简单、界面漂亮:bash <(curl -Ss https://raw.githubusercontent.com/netdata/netdata/master/packaging/installer/kickstart.sh)或者用 wget:wget -O - https://raw.githubusercontent.com/netdata/netdata/master/packaging/installer/kickstart.sh | bash
[*]日常看个磁盘情况:df -h
[*]内存情况:free -m
✅ 服务是否存活监控
[*]建议给服务配个 systemd 自动重启:Restart=always
RestartSec=3
[*]或者用 monit 监控进程,挂了自动拉起来。
✅ 网站/接口可用性监控
[*]轻量级自建推荐 Uptime Kuma(支持微信、钉钉、Telegram 通知)
[*]curl 手动监控也行:curl -m 5 -s -o /dev/null -w "%{http_code}" https://你的域名
✅ 日志监控
[*]错误日志建议定期查查,比如:tail -n 100 /var/log/nginx/error.log | grep -i error
[*]不建议直接删日志,推荐:echo "" > logfile.log
# 或
: > logfile.log
这样不影响服务占用文件句柄。
✅ 报警方式我现在是配了 Telegram 和 Bark 推送,配合 Uptime Kuma 使用。
有用点个赞,欢迎补充和分享你们的监控方案 👇
页:
[1]