文末有....
好久不喝星巴克了,今天天气好,所以也就馋了,下楼买了一杯:
![干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王](http://p2.ttnews.xyz/loading.gif)
我喝咖啡的第一反应就是星巴克,而不是瑞幸,尽管瑞幸很便宜,很会砸钱,但是我的心智还是选择星巴克。很多人疑惑其咖啡之王的地位,今天我就给大家分析一下吧。
我回到办公室,想看看星巴克在中国到底有多少家门店,于是python爬取数据和可视化分析就派上用场了。
主要是想分析4个点:
![干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王](http://p2.ttnews.xyz/loading.gif)
话不多说,直接上部分代码:
<code>temp = data.groupby('Countries and Regions')['Brand'].count().reset_index()
temp.columns = ['国家或地区','计数']
data_pair = [(row['国家或地区'], row['计数']) for _, row in temp.iterrows()]
top_country = sorted(data_pair, key=lambda x: x[1], reverse=True)[:10][::-1]
_map = (
Map(init_opts=opts.InitOpts(theme='dark'))
.add("门店",
data_pair,
"world", is_roam=False,
is_map_symbol_show=False)
.set_series_opts(label_opts=opts.LabelOpts(is_show=False))
.set_global_opts(
title_opts=opts.TitleOpts(title="星巴克门店在全球分布",
subtitle='数据截止日期:2020年2月'),
legend_opts=opts.LegendOpts(is_show=False),
visualmap_opts=opts.VisualMapOpts(is_show=False, max_=2000,
is_piecewise=False),
)
)
_map.render_notebook()/<code>
一共爬取了3W+的数据,这只是部分代码,完整代码见文末。
数据取好后,就要选择工具进行数据分析,一提到分析工具,很多人都会想到用Excel,我很多年前刚入行的时候,也是“Excel打遍天下”,但Excel数据清洗和计算效率低下,需要进行大量重复性、低附加值的人工操作,而且要做好看的图表得花很多时间研究功能,遇到大数据量就卡的不行。
同时,很多人喜欢用echarts图表接口或者是python的第三方库进行数据可视化,甚至是用matlab,基本上都需要用代码实现,在数据展示上十分繁琐,效率不高。
我想到了一种方法:BI分析。
那个被拜耳开除的拒绝隔离的跑步女,也是拜耳BI项目的leader,想想真丢人,BI圈子它是肯定混不下去了。
敏捷BI,随便拖拖拽拽就能生成可视化图表,原理也很简单,数据层由Python来进行抓取到网页数据,解析后储存到mysql数据库;BI负责最后应用层的数据处理、加工和可视化。
本次BI工具用的是FineBI,对于个人来说,它永久免费,在国内BI领域,是直接对标Tableau的存在,不仅仅是性价比高,还因为:
- 30多种数据源支持,你的数据库都能连上,口径不统一的数据也能联合分析
- 可以处理复杂式中报表,这是别的工具不具备的能力
- 可以自动建模,并且是利用自助数据集的方式,让用户能够在人性化的操作界面进行数据处理和ETL处理,比如数据过滤、数据整合等等,能够极大的降低用户的数据清洗与数据加工时间
- 可视化优秀,支持联动、下钻、跳转等OLAP分析操作功能,能够帮助业务人员进行有价值的可视化分析和dashboard设计
拖拖拽拽即可生成可视化
来看看FineBI做出的星巴克数据可视化吧。
1、全球门店分布
星巴克起源于美国,所以在美国的门店数量最多。
我们可以看见,门店主要还是集中在北美洲,亚洲,欧洲。
另外有意思的一点,整个澳大利亚只有20几家星巴克门店,难道是澳大利亚人不爱喝咖啡吗,其实正好相反,因为澳大利亚人太钟爱咖啡了,澳大利亚人对咖啡的讲究,就像中国人对茶的挑剔一样,对于星巴克这种过于商业化的连锁品牌有些难以生存。
2、拥有星巴克门店最多的城市
毫无疑问,如果国内星巴克最多的城市,那肯定是上海和北京。而且随着时间的增加,星巴克会像罗森、全家这种便利店一样,布满其大街小巷。
3、全国门店分布情况
和上面的类似,毫无意外的最红的三个区域——长三角,珠三角和北京,中部城市以成都为首。
我偷偷的告诉你top5:北上杭深广,这要放在10年前肯定没有杭州。但随着互联网的发展,基建速度和这个城市的数字化速度成正比,每座城市都有属于自己的IT企业。
4、门店所有权分布
这个得解释一下,星巴克的经营种类分4个:
其实分析这个,不是想让大家对星巴克增加了解,而是想教会大家在很短的时间内,可以自己上手,用BI工具做出一个数据可视化,Excel的数据透视表就别想了,可视化太丑,还要会VBA,性价比太低了。
最后来谈谈BI工具直接的区别吧。
FineBI毕竟是国产工具,基础的学习文档还是教学视频资料都很丰富,另外还有着非常活跃的帆软中文社区供所有用户进行学习交流。
企业级方面,主要涉及部署项目和技术服务方面。Tableau和powerbi这块是代理商在管,所以你懂得,和帆软本土服务(前方售前技术),后方技术支持,无法比。有一次请教一个使用问题,麻烦了人家技术支持半天,又是远程又是给文档的。
最后,工具好不好,自己尝试了就知道,大家不妨自己下载尝试!
关注我,并转发该文章,私信回复“星巴克”,即可获得FineBI个人永久免费版和python代码!
閱讀更多 IT技術管理那些事兒 的文章