之前用python抓取过一些东西,处理的时候主要是靠模块。现在突然想到javascrip用来处理dom节点,网页中的元素。那么用nodejs来抓取有效的网页信息会不会很有效呢?
13 回复
@HelloWhat 我知道nodejs的用处不在这里,你说的前半句话是我想的,我是这么想的,js本来就处理html dom。而现在抓取数据各种语言都可以,问题在于处理html页面比较麻烦。所以才有这样的想法,用nodejs实现一个类似的库也可以吧。
之前用python抓取过一些东西,处理的时候主要是靠模块。现在突然想到javascrip用来处理dom节点,网页中的元素。那么用nodejs来抓取有效的网页信息会不会很有效呢?
@HelloWhat 我知道nodejs的用处不在这里,你说的前半句话是我想的,我是这么想的,js本来就处理html dom。而现在抓取数据各种语言都可以,问题在于处理html页面比较麻烦。所以才有这样的想法,用nodejs实现一个类似的库也可以吧。