Skip to content

lth3726381/Qimai

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 

Repository files navigation

七麦APP数据爬虫

项目说明

  • 该项目使用 scrapy 框架编写
  • 七麦数据接口使用js参数加密( analysis ), 破解 js 在 settings.py中
  • 考虑到数据量的问题, 使用代理池加 cookies 池一起采集, 请修改 counter_qimai.py 中的代理池和 cookie 池地址
  • 基于 RedisSpider 实现分布式爬虫, 方便任务队列管理和去重, 请修改 counter_qimai.py 中的 redis 数据库地址
  • 实现为 item 字段设置默认值、item 字段清洗、item 错误检查等管道
  • 数据存入 MongoDB 数据库, 请修改 settings.py 中的 MongoDB 数据库地址

运行

终端运行: scrapy crawl counter_qimai

公告

该项目仅供学习参考, 请勿用作非法用途! 如若涉及侵权, 请联系[email protected]/[email protected], 收到必删除!

About

七麦APP数据爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%