不是在XHR返回这些内容后,插入到html里边去
什么是:解析ajax网站 ?
ajax 返回的一般是JSON数据,已经是带结构的了。如果返回的是HTML,可以用 jsdom + jquery 进行页面搜寻。
现在遇到一个爬行问题,目标网站的 “ajax”是服务器端已经完成了的,他把我的目标内容写在script里面,通过模板语言,在页面尾部插入了一堆准备插入到html里的、带转义的字符串,然后加载自身封装的js方法把这些字符串插入到页面里边,导致无法正确根据html内容,来生成dom对象。
之前好像有讨论过。。。。用phantomjs。。。
楼主这个问题解决的怎么样了?
有解决方案么?能不能共享一下?
求共享