参考答案1
服务器健康:比如CPU有没有飙到100%、内存还剩多少、硬盘是不是快满了,就像随时检查电脑的‘体温’和‘体力’。
网络设备状态:看路由器、交换机有没有宕机,网卡流量是不是堵了,好比监控公司网络的‘心跳’。
应用服务:比如网站(Nginx/Apache)能不能打开、数据库(MySQL)查询速度慢不慢,类似盯着‘门面’和‘仓库’正不正常。
日志报警:自动抓错误日志,比如服务器报错、黑客攻击痕迹,相当于雇了个‘保安’天天翻监控录像。
业务功能:比如用户下单页面能不能用、支付接口响应时间多长,直接关系到用户能不能顺利花钱。
自动告警:一出问题,立马发微信、邮件通知我们,半夜也能爬起来修,防止小事变大事。”