什么是Comet
Comet, 据IBM这篇文章介绍,是基于HTTP长连接的“服务器推”技术. 和AJAX类似, 这是一种改善WEB用户体验的通讯技术. 其实早在CGI盛行的时代, 有种叫做"Server-Push"的技术, 和Comet本质是一回事, 都是基于长连接来实现. Server-Push更具体, 强调使用multipart/x-mixed-replace的Conent-Type技巧, 使得服务器能替换浏览器的内容. Comet包含面更广泛, 只要是有长连接和HTTP chunked的实现, 都算作其中. 这篇文章详细介绍了Comet的各种形态,值得一读.
Comet虽然能让浏览器达到及时的响应, 但是由于基于长连接实现, 服务器成本很高. 最近这种技术之所以火起来, 主要还是牛人们探索到了各种降低服务器成本的方法. 这个叫amix的家伙对此有较多的研究.
什么是NodeJs
nodejs号称Evented I/O for V8 JavaScript, 是基于V8的一款神器, 让我们可以使用javascript轻松进行服务器端编程.
最简单的Comet原型
我用一下午的时间, 使用nodejs搞了一个简单的不能再简单的Comet原型. 在这个demo里面, 我假定使用iframe实现Comet, 但是忽略了iframe的父窗口和客户端js库, 只考虑服务器如何将HTTP chunked push到客户端.
我定义了一种Comet资源: http://{host}/{pathname}?[{query_string}] . 其中{pathname}直接当作客户端id来使用(在程序里面它被叫做resid). {query_string}用来做消息内容. 这样, 原型就简化成了两种操作:
- HTTP GET : http://{host}/{pathname} 用来模拟iframe长连接, 不断接收到新数据.
- HTTP PUT : http://{host}/{pathname}?{query_string} 用来模拟业务操作, 直接将{query_string}当作数据投递到上面的长连接里面.
具体实现
好, 主角登场, 用nodejs实现最简单的Comet:
global.messages = {
//’resid’:[]
};
var char500 = (function(){ var i=0; var arr = []; for(i=0; i<500; i++) { arr.push( ' ' ); } return arr.join(‘’); })();
var http_method_funs = {
'GET’: function(resid, data, request, response) {
if(global.messages[resid] == undefined) {
global.messages[resid] = [];
}
response.writeHead(200, {’content-type’: 'text/plain’});
var interval = setInterval(myoutput, 500 );
response.connection.on('end’, function(){
console.log(“GET\t” + resid + “\tclosed”);
clearInterval(interval);
});
myoutput();
function myoutput(){
var msgs = global.messages[resid];
if(msgs.length){
var str = msgs.join(“\n\n\n”) + "\n\n\n";
str = (str.length < 500 ) ? ( str + char500 ) : str; //for MTU
response.write(str);
global.messages[resid] = [];
}
}
},
'PUT’: function(resid, data , request, response) {
if(global.messages[resid] == undefined) {
global.messages[resid] = [];
}
global.messages[resid].push(data);
console.log(global.messages);
response.writeHead(200, {’content-type’: 'text/plain’});
response.end( ‘ok\n’);
},
};
//method function
require(‘http’).createServer(function (request, response) {
var urlinfo = require(‘url’).parse(request.url);
var resid = urlinfo[‘pathname’];
var data = (urlinfo[‘query’]) ? urlinfo[‘query’] : 0 ;
var method = request.method;
console.log(method + “\t” + resid );
if(typeof http_method_funs[method] == ‘function’) {
http_method_funs[method].call(null, resid, data, request, response);
}
else {
response.writeHead(400);
response.end(“unsupport method\n”);
}
}).listen(18124);
console.log(‘server running at http://127.0.0.1:18124/’);
测试方法
上面的代码保存到文件, 我们在第一个终端启动这个服务:
shell> node hello.js
我们在第二个终端模拟iframe的数据流. 输入命令, 观察收到的数据:
telnet 127.0.0.1 18124
GET /mymessages HTTP/1.1
HTTP/1.1 200 OK
content-type: text/plain
Connection: keep-alive
Transfer-Encoding: chunked
我们在第三个终端输入curl -X PUT命令, 模拟发送两条消息:
shell> curl -X PUT “http://127.0.0.1:18124/mymessages?a=1&b=2&c=3”
ok
shell> curl -X PUT “http://127.0.0.1:18124/mymessages?a=4&b=5&c=6”
ok
观察第二个终端, 会发现已经收到两条HTTP chunked. (为了避免测试数据小于MTU, 我实际上多输出了一些空格,但这里省去了.)
202
a=1&b=2&c=3
202
a=4&b=5&c=6
总结
在这个原型中, 我省掉了Comet iframe方案内无关紧要的东西, 只用HTTP PUT/GET来演示一个最简单的原型. 用NodeJs轻松搭建了它.
可以看到, 用javascript event的风格写服务器, 简直是明白如话, 散文那样自然.
我用global.messages对象来存储消息, key是resid(上面说的客户端id), value是个array, 里面存储客户端收到的messages.
我为GET/PUT两种操作分别实现了两个函数.
PUT函数, 收到请求就将query_string当作message存到对应resid的array中, 然后断开HTTP连接.
GET函数, 收到请求就启动一个定时器, 轮询global.messages里面自己的消息队列(array). 如果遇到数据则在HTTP response输出http chunked. HTTP连接不主动关闭, 但如果被异常关闭则清除定时器对象.
就这么一个简单功能, 如果用C和select来开发, 那么一个全局的客户端句柄队列是免不了要实现的, 当io事件到来时, 如何恢复之前中断的上下文,进行正确的io操作, 也是一件头疼的事情.
而我们看这个实现里面的myoutput定时器函数. 由于局部变量resid,response在函数的定义时环境内, 所以函数被执行时, 很自然就使用这些上下文信息. 相比来说, C的实现里面专门为此设计一个客户端句柄队列就太突兀了.
javascript通过函数式和闭包, 轻而易举的完成了一个非阻塞服务器. 如果说libevent是通过库来实现了事件的封装, 那么nodejs所宣称的"Evented I/O for V8 JavaScript", 则是借语言本身的优雅特性获得自然的收获.
----我是分割线----
大家好, 今天我刚参加了NodeParty, 有幸认识了许多大侠, 收获良多(不幸的是迟到了).
早就听说过nodejs, 但这次是第一次拿它做个原型, 分享给大家, 期待共同进步.
我的blog: http://www.dulao5.com/ , gmail 和 twitter id: dulao5 .
5 回复