第四周:网络爬虫之框架 第一讲:Scrapy爬虫框架 1.安装 执行pip install scrapy命令。 安装后小测:执行scrapy -h 2.Scrapy爬虫框架结构 爬虫框架是实现爬虫功能的一个软件结构和功能组件集合。爬虫框架是一个半成品,能够帮助用户实现专业网络爬虫。 Scrapy爬虫包括5+2个结构,如图1所示。 图1 它包括三条主要的数据流路径如图中的箭头所示: (1)从SPIDERS发送REQUESTS到ENGINE模块,然后到SCHEDULER,SCHEDULER负责对请求进行调…