f2xc

11年前发布

基于Scrapy的Pixiv热榜爬虫：pixiv_crawl

基于Scrapy 的 PIXIV爬虫，功能简单（简陋），实现了简单的页面信息抽取，JSON API信息抽取，IMAGE存储等功能。基于Scrapy的配置文件进行灵活配置（包含某些福利选项），并通过Cookie Middleware实现模拟登录等功能。

用户配置信息：

IMAGES_STORE 配置图片存储的地址
PIXIV_USER_NAME 配置你的PIXIV用户名
PIXIV_USER_PASS 配置你的PIXIV密码
START_DATE 抓取的时间
SELECT_MODE_IDX 热榜模式选择

项目主页：http://www.open-open.com/lib/view/home/1443670623283

本文由用户 f2xc 自行上传分享，仅供网友学习交流。所有权归原作者，若您的权利被侵害，请联系管理员。

转载本站原创文章，请注明出处，并保留原始链接、图片水印。

本站是一个以用户分享为主的开源技术平台，欢迎各类分享！

本文地址：https://www.open-open.com/lib/view/open1443670623283.html

jopen 网络爬虫