nodejs网络爬虫开发 资源介绍
现在是大数据的时代,网络上现成的数据都在那里,就看你怎么样来利用,网络爬虫,最适合来抓取我们需要的数据。
那用nodejs来完成整个爬虫我们需要哪些模块和技术呢?
1.request模块:request是一个用来简化HTTP请求操作的模块,其功能强大而且使用方法简单
2.cheerio模块:实现了jQuery Core中浏览器无关的DOM操作API,一般通过cheerio.load方法来加载我们通过http请求到的网页内容,然后进行DOM操作,抓取我们需要的数据。
资源目录:
第一节 课程介绍 第二节 爬虫基础 第三章 爬虫实战 第四节 课程总结 课程资料