01
—
基于Spider的全站数据爬取
-就是将网站中某板块下的全部页码数据进行爬取。-需求:爬取校花网中照片的名称-实现方式:-将所有页面的url添加到start_urls列表中(不推荐)-自行手动进行请求发送(推荐)手动请求发送:yieldscrapy.Request(url,callback):callback专门用于数据解析在xiaohua.py文件中进行编写:第一页:importscrapyclassXiaohuaSpider(scrapy.Spider):name=xiaohua#allowed_domains=[