Skip to content

🕷知乎用户的粉丝信息爬取项目。爬取用户所有粉丝的详细信息,并统计假粉数量。

Notifications You must be signed in to change notification settings

ustcyyw/zhihu_follower

Repository files navigation

zhihu_follower

[toc]

项目简介

  • 这是一个兴趣使然的小项目,可以说想学爬虫的初衷就是因为知乎一直给我送僵尸粉,我非常好奇我究竟有多少僵尸粉,多少真粉丝。于是开始学习爬虫,完成了这个爬去知乎用户粉丝信息的项目。😁
  • 总是听闻知乎反爬很厉害,但是当了解了web的一些基本知识之后,还是可以通过一些方法爬取信息的,在这个项目中我会将我用的办法进行说明。🎃
  • 本项目将指定用户粉丝的详细信息爬取并存入数据库,同时也统计出有多少僵尸粉(僵尸粉的标准是我自己定的),多少真粉。由于项目目的很明确,所以扩展性并不好,对能够很好地实现对知乎粉丝信息的爬取且直观得到僵尸粉数量。📊
  • 项目代码说明请看代码解释

使用说明

  1. 推荐将"http请求与数据库写入多线程"文件夹下所有.py文件复制并放在同一个有python环境的文件夹下面。
  2. 配置自己的数据库,要求请看数据库表格介绍。按该md文件中提示创建表格。
  3. 进行项目配置,完成Config.py的配置。具体配置方案/方法请看 配置说明
  4. 运行参数的获取,也就是main.py中main函数的参数,获取方式请看 配置说明中关于运行参数的说明。
  5. 然后你就可以愉快地运行啦 🉑

结果展示

  • 汇总信息展示:

汇总信息展示.png

没有打码的就是我本人~

  • 用户粉丝详细信息展示:

用户粉丝详细信息展示.png

本人早期粉丝的质量还是很高的,没有僵尸粉!

其它

  • 如果觉得有用有意思的话给我一个star吧,请随意fork。
  • 欢迎讨论与指正 微信Y154578009 /QQ154578009
  • 本项目不涉及对数据的其它使用,仅仅出于个人兴趣与好奇。

About

🕷知乎用户的粉丝信息爬取项目。爬取用户所有粉丝的详细信息,并统计假粉数量。

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages