爬虫如何加载执行js文件
刚学nodejs,跟着站长的教程写了两个爬虫 现在我想爬一个网站,但是用superagent和cheerio只爬到了网站的html和写在里面的script,而有些数据是要执行引用的script文件的,如果想要连同引用的script文件一起加载请问有可能吗? jsdom有可能实现吗?我用了也无法加载引用的script文件 希望能帮忙看一下,谢谢
1 回复
需要结合一个执行js的引擎,比如 phantomjs 或者 nightmare