Skip to content

☣新型冠状病毒的疫情信息项目:包括数据爬取(python),数据库存储(python + mysql),(web后端见另外一个库wuhan_plague_web)

Notifications You must be signed in to change notification settings

ustcyyw/wuhan_plague

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

31 Commits
 
 
 
 
 
 
 
 

Repository files navigation

wuhan_plague 项目

[toc]

项目简介

完整项目包括数据的爬取,数据的存储,及数据的读取。

数据爬取及存储使用python进行编写,在本仓库各个版本文件下的get_info_by_spider_python文件夹中。

DBMS使用mysql,表格结果及部分数据在本仓库各个版本文件下的SQL_mysql文件夹中。

web后端使用java编写,提供几个查看数据的非常方便的接口,放在另外一个仓库 wuhan_plague_web 中。

项目目的

  • 作为这个事情的亲历者,希望记录一些东西,或许之后会有用处
  • 用于疫情结束之后分析原因,提供用于可视化的详细数据
  • 在家宅着不能出门做一点东西

更改日志

  • 2020-7-29 更改Plague_info.py。修改原因:数据来源网站变更,原来的解析方式有问题。
  • 2020年2月13日11:27:33 更改Plague_info.py第27~28行。修改原因:数据来源网站细微变更,原正则表达式匹配失败。
  • 2020年2月17日17:17:19 项目添加世界各国信息爬取功能,将原版本部分修改后放入文件version1.1
  • 2020年2月19日22:58:33 新版本上传完成,放入文件version2.0
  • 2020年3月15日19:02:50 更改版本2.0中 Plague_info.py第49~50行。修改原因:数据来源网站细微变更,原信息的tag发生错误导致异常。现版本1.0已经没有更新使用了。
  • 2020年3月16日17:15:39 更改版本2.0中 Plague_info.py第49~50行。修改原因:数据来源网站细微变更,原信息的tag发生错误导致异常。
  • 2020年3月17日00:48:30 更改版本2.0中 Plague_info.py增加58~59行。修改原因:数据来源网站细微变更,在世界各个信息中加入了中国,导致数据与之前设定的,世界信息中排除中国不符合。所以增加一个判断过滤世界信息中的中国。
  • 2020年3月19日16:12:55 更改版本2.0中数据库介绍的README.md,修改了之前的小错误。
  • 2020年3月24日20:14:12 更改版本2.0中 Plague_info.py第52行。修改原因:数据来源网站细微变更,原来的正则表达式失效,进行了更正。

其它

  • 武汉加油,中国加油!:heart: 世界也沦陷了,对我们友好的国家加油!对我们不好的国家比如丹麦,速度埋了。
  • 疫情结束之后,如果觉得有用有意思的话给我一个star吧,请随意fork。
  • 欢迎讨论 微信Y154578009 /QQ154578009

About

☣新型冠状病毒的疫情信息项目:包括数据爬取(python),数据库存储(python + mysql),(web后端见另外一个库wuhan_plague_web)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published