一次抓狂的服务器崩溃经历,某VPS服务器,突然有客户反映vps上不去,ssh链接服务器,上不去!问题不小,IPMI链接上一看,大量的 backlog limit exceeded 错误,如下:
audit:backlog limit exceeded
audit:audit_backlog=321 > audit_backlog_limit=320
参数关闭几个占用cpu资源过多的vps,xm shutdown vmxxx & 失败,然后就什么命令都无法执行了。
等待几个小时没有恢复,检查VPS备份有最新的,只好重启服务器,几分钟后,貌似一切正常。
然后修改audit参数,如下:
[root@ www.ctohome.com]# auditctl -b 8192
AUDIT_STATUS: enabled=1 flag=1 pid=6118 rate_limit=0 backlog_limit=8192 lost=0 backlog=1
再继续查找什么原因导致的,
1. 貌似有人尝试破解我们的smtp帐号
Dec 15 03:24:46 saslauthd[5892]: do_auth : auth failure: [[email protected]] [service=smtp] [realm=cto.com] [mech=pam] [reason=PAM auth error
]
Dec 15 03:25:15 saslauthd[5890]: do_auth : auth failure: [[email protected]] [service=smtp] [realm=cto.com] [mech=pam] [reason=PAM auth error
]
Dec 15 03:25:45 saslauthd[5889]: do_auth : auth failure: [[email protected]] [service=smtp] [realm=cto.com] [mech=pam] [reason=PAM auth error
]
2. dmesg |grep -i error
i8042: probe of i8042 failed with error -5
再继续查找