干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王

文末有....

好久不喝星巴克了,今天天气好,所以也就馋了,下楼买了一杯:

干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王

我喝咖啡的第一反应就是星巴克,而不是瑞幸,尽管瑞幸很便宜,很会砸钱,但是我的心智还是选择星巴克。很多人疑惑其咖啡之王的地位,今天我就给大家分析一下吧。

我回到办公室,想看看星巴克在中国到底有多少家门店,于是python爬取数据和可视化分析就派上用场了。

主要是想分析4个点:

  • ☕️全球门店分布
  • 拥有星巴克门店最多的10个城市
  • 门店所有权占比
  • 中国地区门店分布热点图

  • 干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王

    话不多说,直接上部分代码:

    <code>temp = data.groupby('Countries and Regions')['Brand'].count().reset_index()
    temp.columns = ['国家或地区','计数']
    data_pair = [(row['国家或地区'], row['计数']) for _, row in temp.iterrows()]
    top_country = sorted(data_pair, key=lambda x: x[1], reverse=True)[:10][::-1]

    _map = (
    Map(init_opts=opts.InitOpts(theme='dark'))
    .add("门店",
    data_pair,
    "world", is_roam=False,
    is_map_symbol_show=False)
    .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
    .set_global_opts(
    title_opts=opts.TitleOpts(title="星巴克门店在全球分布",
    subtitle='数据截止日期:2020年2月'),
    legend_opts=opts.LegendOpts(is_show=False),
    visualmap_opts=opts.VisualMapOpts(is_show=False, max_=2000,
    is_piecewise=False),
    )
    )

    _map.render_notebook()/<code>

    一共爬取了3W+的数据,这只是部分代码,完整代码见文末。

    数据取好后,就要选择工具进行数据分析,一提到分析工具,很多人都会想到用Excel,我很多年前刚入行的时候,也是“Excel打遍天下”,但Excel数据清洗和计算效率低下,需要进行大量重复性、低附加值的人工操作,而且要做好看的图表得花很多时间研究功能,遇到大数据量就卡的不行。

    同时,很多人喜欢用echarts图表接口或者是python的第三方库进行数据可视化,甚至是用matlab,基本上都需要用代码实现,在数据展示上十分繁琐,效率不高。

    我想到了一种方法:BI分析

    那个被拜耳开除的拒绝隔离的跑步女,也是拜耳BI项目的leader,想想真丢人,BI圈子它是肯定混不下去了。

    敏捷BI,随便拖拖拽拽就能生成可视化图表,原理也很简单,数据层由Python来进行抓取到网页数据,解析后储存到mysql数据库;BI负责最后应用层的数据处理、加工和可视化。

    本次BI工具用的是FineBI,对于个人来说,它永久免费,在国内BI领域,是直接对标Tableau的存在,不仅仅是性价比高,还因为:

    • 30多种数据源支持,你的数据库都能连上,口径不统一的数据也能联合分析
    • 可以处理复杂式中报表,这是别的工具不具备的能力
    • 可以自动建模,并且是利用自助数据集的方式,让用户能够在人性化的操作界面进行数据处理和ETL处理,比如数据过滤、数据整合等等,能够极大的降低用户的数据清洗与数据加工时间
    • 可视化优秀,支持联动、下钻、跳转等OLAP分析操作功能,能够帮助业务人员进行有价值的可视化分析和dashboard设计
    干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王

    拖拖拽拽即可生成可视化


    干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王

    来看看FineBI做出的星巴克数据可视化吧。

    1、全球门店分布

    干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王

    星巴克起源于美国,所以在美国的门店数量最多。

    我们可以看见,门店主要还是集中在北美洲,亚洲,欧洲。

    另外有意思的一点,整个澳大利亚只有20几家星巴克门店,难道是澳大利亚人不爱喝咖啡吗,其实正好相反,因为澳大利亚人太钟爱咖啡了,澳大利亚人对咖啡的讲究,就像中国人对茶的挑剔一样,对于星巴克这种过于商业化的连锁品牌有些难以生存。

    2、拥有星巴克门店最多的城市

    干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王

    毫无疑问,如果国内星巴克最多的城市,那肯定是上海和北京。而且随着时间的增加,星巴克会像罗森、全家这种便利店一样,布满其大街小巷。

    3、全国门店分布情况

    干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王

    和上面的类似,毫无意外的最红的三个区域——长三角,珠三角和北京,中部城市以成都为首。

    我偷偷的告诉你top5:北上杭深广,这要放在10年前肯定没有杭州。但随着互联网的发展,基建速度和这个城市的数字化速度成正比,每座城市都有属于自己的IT企业。

    4、门店所有权分布

    这个得解释一下,星巴克的经营种类分4个:

  • Company Owned:公司独资直营,这也是星巴克门店最多的经营方式
  • Licensed: 许可经营
  • Joint Venture: 合资经营,比如:国内江浙沪地区的星巴克最早就是由星巴克与统一集团联手经营,后来星巴克已收回所有权
  • Franchise:授权经营,类似麦当劳的经营模式
  • 干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王

    其实分析这个,不是想让大家对星巴克增加了解,而是想教会大家在很短的时间内,可以自己上手,用BI工具做出一个数据可视化,Excel的数据透视表就别想了,可视化太丑,还要会VBA,性价比太低了。

    干掉星巴克!Python+BI可视化3W数据,告诉你谁才是咖啡之王

    最后来谈谈BI工具直接的区别吧。

    FineBI毕竟是国产工具,基础的学习文档还是教学视频资料都很丰富,另外还有着非常活跃的帆软中文社区供所有用户进行学习交流。

    企业级方面,主要涉及部署项目和技术服务方面。Tableau和powerbi这块是代理商在管,所以你懂得,和帆软本土服务(前方售前技术),后方技术支持,无法比。有一次请教一个使用问题,麻烦了人家技术支持半天,又是远程又是给文档的。

    最后,工具好不好,自己尝试了就知道,大家不妨自己下载尝试!

    关注我,并转发该文章,私信回复“星巴克”,即可获得FineBI个人永久免费版和python代码!


    分享到:


    相關文章: