这里或许是互联网从业者的最后一片净土,随客社区期待您的加入!
您需要 登录 才可以下载或查看,没有账号?立即注册
×
本帖最后由 傲来云 于 2025-4-22 14:48 编辑
现在的服务器动不动挂掉、跑满、出错,要是没监控,基本就是“客户告诉你问题”。所以还是得提前搞点监控,哪怕是简单的。 我平时用的是这一套,分享下:
✅ 系统资源监控(CPU、内存、磁盘、网络) - bash <(curl -Ss https://raw.githubusercontent.com/netdata/netdata/master/packaging/installer/kickstart.sh)
复制代码 或者用 wget:- wget -O - https://raw.githubusercontent.com/netdata/netdata/master/packaging/installer/kickstart.sh | bash
复制代码
✅ 服务是否存活监控 建议给服务配个 systemd 自动重启: - Restart=always
- RestartSec=3
复制代码
✅ 网站/接口可用性监控 ✅ 日志监控 错误日志建议定期查查,比如: - tail -n 100 /var/log/nginx/error.log | grep -i error
复制代码
不建议直接删日志,推荐: - echo "" > logfile.log
- # 或
- : > logfile.log
复制代码
这样不影响服务占用文件句柄。
✅ 报警方式 我现在是配了 Telegram 和 Bark 推送,配合 Uptime Kuma 使用。
有用点个赞,欢迎补充和分享你们的监控方案 👇
|