[toc]
- 这是一个兴趣使然的小项目,可以说想学爬虫的初衷就是因为知乎一直给我送僵尸粉,我非常好奇我究竟有多少僵尸粉,多少真粉丝。于是开始学习爬虫,完成了这个爬去知乎用户粉丝信息的项目。😁
- 总是听闻知乎反爬很厉害,但是当了解了web的一些基本知识之后,还是可以通过一些方法爬取信息的,在这个项目中我会将我用的办法进行说明。🎃
- 本项目将指定用户粉丝的详细信息爬取并存入数据库,同时也统计出有多少僵尸粉(僵尸粉的标准是我自己定的),多少真粉。由于项目目的很明确,所以扩展性并不好,对能够很好地实现对知乎粉丝信息的爬取且直观得到僵尸粉数量。📊
- 项目代码说明请看代码解释
- 推荐将"http请求与数据库写入多线程"文件夹下所有.py文件复制并放在同一个有python环境的文件夹下面。
- 配置自己的数据库,要求请看数据库表格介绍。按该md文件中提示创建表格。
- 进行项目配置,完成Config.py的配置。具体配置方案/方法请看 配置说明。
- 运行参数的获取,也就是main.py中main函数的参数,获取方式请看 配置说明中关于运行参数的说明。
- 然后你就可以愉快地运行啦 🉑
- 汇总信息展示:
没有打码的就是我本人~
- 用户粉丝详细信息展示:
本人早期粉丝的质量还是很高的,没有僵尸粉!
- 如果觉得有用有意思的话给我一个star吧,请随意fork。
- 欢迎讨论与指正 微信Y154578009 /QQ154578009
- 本项目不涉及对数据的其它使用,仅仅出于个人兴趣与好奇。

