eggjs出现worker cpu100%
想问下如果eggjs中有个worker的cpu偶发飙到100%,cluster中是否有机制kill到这个worker再启一个(当然至于为何100%的具体问题会去查)
4 回复
自己试下不就知道了。
master 有守护的,kill 掉会自动重启。
但这是逃避问题,接入 AliNode 监控就好了。
@atian25 已经试过了,没有重启worker。。问题也查到了已经,只是以后想让线上稳定点而已。。。
线上稳定,主要在于监控,这个是 AliNode 的职责范围。
至于发现 CPU 100% 自动重启 Worker 这种。。。如果你们的业务不 care 的话,可以自己做。反正就是想办法找到那个 PID,发一个 kill 而已。
@atian25 多谢大神回复,还想问下这件事情放哪里做比较好,agent里定时检测,还是写schedule呢,还是说直接脱离egg,在linux里写相关监控比较好?