Python取数+BI可视化,我是这么分析并追踪这次疫情的

现在疫情很严重,在这种情况下,希望人人都能乖乖在家,出门戴口罩。从这次也可以看出来,数据可视化和大数据简直太重要了。

出于无聊,我特地给大家写了一份全国疫情数据可视化报告,并给大家详细解释这张图的做法。

Python取数+BI可视化,我是这么分析并追踪这次疫情的

数据采集:使用谷歌浏览器自带的开发者工具进行数据包抓取

采集过程:进入网页后,使用开发者工具进行数据包捕获

Python取数+BI可视化,我是这么分析并追踪这次疫情的

按钮为红色即说明进入捕获状态,接着我们刷新一下页面

Python取数+BI可视化,我是这么分析并追踪这次疫情的

可以发现里面有很多数据包,我们需要的数据是全国确诊人数、疑似病例、治愈人数等等数据,那么如何抓取我们需要的数据呢?
其实在开发者工具里有一个搜索按钮,如下图。

Python取数+BI可视化,我是这么分析并追踪这次疫情的

接着利用它来搜索我们需要的数据,比如全国确诊的数据:

Python取数+BI可视化,我是这么分析并追踪这次疫情的

接着我们看搜索结果的第一条的Response的内容,可以发现这是条json数据,确认后发现,这些数据这正是网页数据的来源。

Python取数+BI可视化,我是这么分析并追踪这次疫情的

至此,数据采集完毕,接下来就是利用python进行数据处理了。由于代码太多,有需要的看到文末私信我即可。

执行一遍代码后,打开刚刚生成的Excel表格。

Python取数+BI可视化,我是这么分析并追踪这次疫情的

数据分析好之后,我们就要开始对它进行可视化分析了。的确,Python和Matplotlib都能进行可视化的分析,但是需要一定的代码基础,不会代码的人还是占了大多数,那么这些人如果想要可视化分析怎么办呢?

就是利用可视化数据平台将收集到的Excel数据可视化处理。

这就是我今天要说到的BI工具FineBI了,这是一款企业级的大数据分析软件,性价比不但很高,而且个人版还免费~

  • 自动建模,建模简单,模型灵活性很强
  • 丰富的可视化和前端分析操作,能可视化地进行数据钻取,数据切片和数据旋转等多维分析操作
  • 内置ETL,实时数据分析,同时对大数据能够做到飞速处理

  • Python取数+BI可视化,我是这么分析并追踪这次疫情的

    一、下载并激活

    虽说这是一款企业级的数据分析软件,但是对于个人来说是永久免费的,我从帆软官网上免费下载并激活,登录之后,就可以打开到这个页面。


    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    B/S架构,在浏览器上就可以操作,各个模块都一目了然。

    二、数据准备

    1、数据连接

    点击创建数据连接,新建一个数据连接,输入自己的用户名和密码,点击测试连接,成功了就可进行下一步。


    Python取数+BI可视化,我是这么分析并追踪这次疫情的


    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    2、数据导入

    添加业务包,先将已经准备好的数据导入,可以是SQL,可以是Excel形式,也可以是数据库形式,我们这里添加的是Excel数据集。


    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    3、数据清洗

    一般的中大型公司都会有专门的IT人员对数据进行处理,将废数据扔掉,留下有用的数据,FineBI中带有的自助数据集就很好的解决了这个问题。

    什么叫自助数据集?就是你将未清洗的数据导入之后,我们可以将我们后面需要分析的数据一个个挑选出来,这一步其实就相当于ETL,只不过省去了写代码的烦恼。

    再来看看数据可视化的操作步骤吧。

    既然是全国疫情,而我们又抓取到了各个地区的数据,我们自然需要制作一个全国疫情的地图来实现数据的可视化的这样一个组件。将鼠标移至图示区域,可看到提示,这需要2个地理纬度。

    Python取数+BI可视化,我是这么分析并追踪这次疫情的


    疫情的显示应该是越细越好的,所以我们转换维度需要以城市为目标。于是我们将数据处理一下,

    Python取数+BI可视化,我是这么分析并追踪这次疫情的


    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    少部分地区没有匹配上,没关系,我们点击确定。

    可以发现列表中生成了2个维度,我们将其拖动至横纵轴。

    Python取数+BI可视化,我是这么分析并追踪这次疫情的


    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    可以发现图标类型中地图类型亮了

    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    选中它,变成了这样

    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    可以发现虽然有效果,但是颜色的深浅不明显,我们需要让颜色有一个参考的数据,这里以确诊人数为例,将其拖动至图示位置

    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    然后点击下面的红色区域:

    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    改变渐变方案,这里选一个效果明显的即可

    Python取数+BI可视化,我是这么分析并追踪这次疫情的


    至此地图组件建立工作大部分完成

    Python取数+BI可视化,我是这么分析并追踪这次疫情的


    但从图中可以获取的信息显然还不足,它只显示了城市还有确诊人数,并没有显示治愈还有死亡人数,这里需要:
    分别单击这三个元素 然后将其拖至提示:

    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    至此,地图组件实现可视化数据完成!

    若要更新数据,只需要执行一遍Python代码后,将重新生成的data.xlsx文件在FineBI中如图:

    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    重新上传一遍后,出现

    Python取数+BI可视化,我是这么分析并追踪这次疫情的

    然后点击右上角的确定即可,最后的成图就是这样:


    Python取数+BI可视化,我是这么分析并追踪这次疫情的


    总结

    我不知道这是天灾还是人祸,现在说什么都晚了,只希望今早结束这一切。

    关注我,并转发该文章,私信回复“疫情”,即可获得python代码和BI工具!


    分享到:


    相關文章: