点击上方蓝色【数据攻略】关注+星标~
第一时间获取最新内容

重点分为以下两部分:
② 数据可视化
(内含实操代码,可根据具体所需个性化制定)
一、确认目标
二、数据结构清洗
三、代码复现
四、数据可视化
确认目标
本次的目标是爬取腾讯新闻板块的新冠疫情数据,主要是图中红色部门各省份的现有确诊、累计确诊数据结果:

数据结构清洗
数据链接:
https://view.inews.qq.com/g2/getOnsInfo?name=disease_h5&callback=&_=164246944661
下图是数据结果的截图展示:

方法②:python解析
【方法①——在线解析】
左边为原始文档,后边为解析后的json格式:

下面展示省份解析后的数据结构:

【方法②——python解析】
后面将详细讲解python解析的代码,先给大家展示解析后的结果:

个人推荐在线解析工具~
虽然解析内容一样
但是在线解析工具可以进行收缩,可视化更友好。
代码复现
有了新冠疫情数据后,
下面就进入解析json,提取指定数据的部分了。
先来展示下,获取的数据内容,总共有5个字段:
省份名称(province) 现有确诊(nowConfirm)
累计确诊(confirm)
死亡人数(dead)
治愈人数(heal)

下面是获取各省份数据的python脚本:

数据可视化
有了各省份的数据后,下面说一说:
如何将 累计确诊 和 现有确诊的省份数据,进行可视化:

以下,是利用热力图,进行可视化的结果:

依葫芦画瓢,下面给出累计确诊的绘图代码及结果


以上就是本篇关于demo新冠疫情数据爬虫、清洗、可视化的内容。
城市的数据大家可依照上面讲解的内容相应的解析。
如还是有疑问,也可以后台联系我~
如需代码,可后台 ”回复1,添加我“ 发你源码
Ps. 微信推文改了规则
看完记得设置为 “ 星标 ”
不然我会消失的

如若盼 追更 【日常学习】干货系列 


往期好文推荐 




