websocket压测时自动断开的问题
使用的ws模块,从本地笔记本到server建立了10000个ws连接,直连的node,server是用cluster创建的,24个逻辑cpu的虚拟机,上面还布有redis集群。 然后单开了一个连接每秒向server发送一条消息,server和redis之间会sub/pub,然后server会给所有ws连接send这个消息。 现在遇到的问题是:send消息时一开始是正常的,但过不了多久就不停有ws连接断开(但不会全部断开),没有监听到任何错误信息,只知道client端close事件的code是1006;有时会断开到剩余5000多个ws就稳定了,有时会断开到剩余2000多 出问题时查看过server的状态,cpu消耗很小,idle都在80%以上,内存也剩余几十G,网卡流量也只有20多M/s,但有时load average会很高,到了10几甚至20多(但并不是每次都这样)
请教下这个问题有没有答案或者该如何定位。