它只用10分钟就做出了疫情可视化

最近大家最关心的事情是什么?那肯定是疫情了,不能出门的感觉真的很难受有没有? 为什么会变成这个样子阿!不吃野味会死吗?(此处省略无数字....) 可是生活还是要继续,我们能做的就是不添乱,自我防护 …

标签:数据分析 数据可视化 趣分析 | 发布时间: 2020-07-09 20:35:06

最近大家最关心的事情是什么?那肯定是疫情了,不能出门的感觉真的很难受有没有?

为什么会变成这个样子阿!不吃野味会死吗?(此处省略无数字....)

可是生活还是要继续,我们能做的就是不添乱,自我防护。

为了让大家能更了解疫情,我在这里用数据可视化分析出了全国的疫情情况。

根据国家卫健委所公布的数据,我们可以看到重灾区依然是整个湖北省,浙江广东河南因为人流量较大的原因,也已经变成了重点区域。

它只用10分钟就做出了疫情可视化插图

 

一、数据哪里来?

网站的数据是定时更新的,可能上午看到的数据,下午就会更新,而且差异很大。而通过Excel进行数据汇总时,效率不高,很难做到完全同步。

它只用10分钟就做出了疫情可视化插图1

 

因此我在考虑,利用Python进行抓包,并封装成为.exe文件,点击就可以自动下载数据,并以csv格式,进行结构化的存储,方便大家的各种使用。

 

它只用10分钟就做出了疫情可视化插图2

 

这个工具每运行一次,就会从“腾讯新闻”疫情实时播报网站上,抓取并更新一次数据,并存储到你的电脑D盘(C盘往往需要更高权限读写)。

下载完成的csv文件格式如下:

 

它只用10分钟就做出了疫情可视化插图3

 

 

 

 

 

 

 

 

 

 

 

 

它只用10分钟就做出了疫情可视化插图4

 

其实,这个数据无论对企业、个人,还是对我们了解疫情变化发展趋势,都是非常实用。而且我看到网上有很多人,会从不同维度分析问题,作为基础数据也将很有帮助。

二、拿什么分析?

上面说了,拿Excel之类的工具进行数据分析最大的坏处就是数据不能同步,得需要手动录入,而且熟悉数据行业的人应该都知道,Excel遇到大数据就会卡死。

其实,分析工具更多的价值在于辅助分析过程中数据的处理,能够将结论以可视化的方式直观展,最终解决问题。如果在功能上能做到避免写公式写代码,易上手易用,那就更好了。

Python和Matplotlib都能进行可视化的分析,但是需要一定的代码基础,不会代码的人还是占了大多数。于是我想到了BI,即商业智能。

在这里,我用的是趣分析,一款人人可用的数据分析神器,具有丰富的可视化和前端分析操作,能可视化地进行数据切片和数据旋转等多维分析操作;同时内置ETL,实时数据分析,同时对大数据能够做到飞速处理,业务人员分析数据再也不用等IT!

趣分析做的数据可视化:

它只用10分钟就做出了疫情可视化插图5

 

它只用10分钟就做出了疫情可视化插图6

 

三、数据可视化

有了数据,又有了数据分析工具趣分析,接下来就是成果展示了,有了数据直接拖拽就可以生成可视化,10分钟即可搞定~

1、全国动态热力图

关于此次疫情的整体情况大家都应该很清楚了,这里就不放数据了,给大家放一个从开始到现在各地区的疫情变化地图吧,该图片来自于某微博网友~

 

它只用10分钟就做出了疫情可视化插图7

 

2、各城市感染气泡图

X轴为前后两天数据对比(两天时间各地区确诊增长速度),Y轴为100万人确诊率,气泡大小为当日确诊人数。

 

它只用10分钟就做出了疫情可视化插图8

 

一象限(右上角):百万人确诊比率和增长率都大于平均值,是比较严重的地区,如图上的重庆
二象限(左上角):百万人确诊率大于平均值,增长率小于平均值,说明相对其他省形式有缓解,如浙江
三象限(左下角):两个指标都低于平均值,属于相对其他地区算比较正常,如广西
四象限(右下):增速快,确诊率低于平均值,属于需要提高警惕注意的地区,如江西
它只用10分钟就做出了疫情可视化插图9

它只用10分钟就做出了疫情可视化插图10

它只用10分钟就做出了疫情可视化插图11

 

从气泡图中可以看出,浙江广东河南安徽这些省,已经变成了除湖北之外的第二重灾区,疫情已经到了刻不容缓的地步。

四、总结

疫情到现在也这么久了,中间也发生了很多让人惋惜和愤怒的事情,但是归根到底,绝大多数人的初衷就是结束这场没有硝烟的战争。

我们普通群众能做的就是安心在家,做好自身防护,相信国家能带领我们取得胜利,就像03年一样。

 

 



上一篇:
下一篇: