【分享】常用的服务器监控方式（适合小站长/运维新手）

傲来云 发表于 2025-4-22 14:18:45

本帖最后由傲来云于 2025-4-22 14:48 编辑

现在的服务器动不动挂掉、跑满、出错，要是没监控，基本就是“客户告诉你问题”。所以还是得提前搞点监控，哪怕是简单的。我平时用的是这一套，分享下：
✅ 系统资源监控（CPU、内存、磁盘、网络）
[*]装个 Netdata 就够用了，部署简单、界面漂亮：bash <(curl -Ss https://raw.githubusercontent.com/netdata/netdata/master/packaging/installer/kickstart.sh)或者用 wget：wget -O - https://raw.githubusercontent.com/netdata/netdata/master/packaging/installer/kickstart.sh | bash

[*]日常看个磁盘情况：df -h

[*]内存情况：free -m

✅ 服务是否存活监控
[*]建议给服务配个 systemd 自动重启：Restart=always
RestartSec=3

[*]或者用 monit 监控进程，挂了自动拉起来。
✅ 网站/接口可用性监控
[*]轻量级自建推荐 Uptime Kuma（支持微信、钉钉、Telegram 通知）
[*]curl 手动监控也行：curl -m 5 -s -o /dev/null -w "%{http_code}" https://你的域名
✅ 日志监控
[*]错误日志建议定期查查，比如：tail -n 100 /var/log/nginx/error.log | grep -i error

[*]不建议直接删日志，推荐：echo "" > logfile.log
# 或
: > logfile.log
这样不影响服务占用文件句柄。
✅ 报警方式我现在是配了 Telegram 和 Bark 推送，配合 Uptime Kuma 使用。
有用点个赞，欢迎补充和分享你们的监控方案 👇

页: [1]

随客社区's Archiver

【分享】常用的服务器监控方式（适合小站长/运维新手）