https 远程获取内容的 编码问题
var https = require(‘https’); var punycode = require(‘punycode’) https.get({ host: 'sp0.baidu.com’, path: ‘/8aQDcjqpAAV3otqbppnN2DJv/api.php?query=202.194.101.150&co=&resource_id=6006’ }, function(res) { res.on('data’, function(d) { d.toString('utf8’,0,d.length) });
}).on('error’, function(e) { console.error(e.toString()); });
网页的 代码返回的 是个 gbk的编码 , res.on 返回的 是个 buffer 还不知道 是个上面 编码 ,utf8 转出来 中文乱码 ,求如何 解决,还是 必须 用 其他的 爬虫 模块
7 回复
@magicdawn 用 superagentparse…
- superagentparse 可以获取 buffer
- superagentparse 用的是 superagent 原生的 parse 方法。。。