最近用node在做爬虫开发,遇到的网站一堆table嵌套,还是深层的,没有id没有class,真不知道怎么做数据分析,请有经验的人指点下,而且抓来 的数据中文部分变成了★ 请之类的,也不知道怎么转回中文,求指点啊
1 回复
没有 id 没有 class 说明这个网站的 css 也是用数组索引在定位啊。。就从了它吧。 cheerio 解析之后,用 [0] [1] 去取出来。 中文的问题,难道源站不是 utf-8?用 iconv-lite https://github.com/ashtuchkin/iconv-lite 转码。