大数据时代敏捷BI(商业智能)的理解与选择

这是一个几乎所有组织都在谈数据的时代。


大数据时代敏捷BI(商业智能)的理解与选择

虽然以大数据(Big Data)的定义(指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。)来看,并不是所有的企业或组织都拥有“大数据”,但无疑,数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产要素和资产。在这个变化越来越快的时代,组织是否已经具备处理和分析数据的能力,是每个组织成员都需要思考的问题。

肯锡列出了各个行业利用大数据价值的难易度以及发展潜力。《Big data: The next frontier for innovation, competition, and productivity》

数据无论大小,只要足够优质,其中便蕴含着各行各业挖掘更大商业价值和创新的可能。数据本身不产生价值,如何分析和利用数据,并对业务产生帮助才是关键,而能有效挖掘出这些可能和价值的答案,便蕴藏在商业智能(Business Intelligence,简称BI)之中。

BI是什么?

著名国际咨询分析公司Gartner,将BI定义为一个概括性术语(Umbrella Term),泛指业务分析中用到的工具、基础设施设备、程序与软件,通过获取和处理数据,进而分析数据,获取有价值的信息以改进并优化决策和绩效,指导各种商业行为。

BI的本质是技术和工具和商业逻辑的结合,通过处理原始数据,以商务逻辑分析数据,为商业运营提供基于历史、当下和未来的分析视角,形成对商业行为有价值的洞察(insight)。(与之对应,近年来国外很多名校的新兴专业学科BA(Business analytics),则是一门需要同时学习商科知识和计算机技术的学科。)


大数据时代敏捷BI(商业智能)的理解与选择


BI对商业决策的支持涵盖了从运营到战略的每个层面。基础运营决策包括产品定位或定价, 战略业务决策包括最广泛层面的优先事项,目标和方向。BI的有效性在于多数据源的充分整合。例如可口可乐等快消品公司会将公司财务、运营数据(内部数据)与波士顿等公司提供的市场数据(外部数据)结合分析,这种结合就可以更好地呈现公司的经营全貌。

从这个意义上来讲,基于单表或单一数据源的分析都不能称作真正的BI。更常见的情形是组织内没有BI产品线,仅靠手工操作汇总数据源,复制粘贴到一个Excel表中再进行分析,虽然满足了多来源,但汇总和分析过程缺乏自动化,效率和准确度水分很大,也不是真正的BI。

BI的目标与部署中的常见问题

数据研究专家Kernochan在他为期两年的组织BI流程研究中,提出了以下模型及对应的BI特征目标:

  • 数据输入 - 准确性
  • 数据整合 - 一致性
  • 数据聚合 - 范围明确
  • 信息定位 - 匹配度
  • 信息传递 - 及时性
  • 信息分析 - 可分析性

这不仅可以作为BI部署的目标,也可以用于检验以上目标的达成,反推企业的数据治理是否足够规范。

同时,Kernochan的研究也总结了当前BI部署流程中的常见问题:

  • 20%的数据有错误(准确性)
  • 50%的数据不一致(一致性)
  • 通常需要7天才能将数据提供给最终用户(及时性)
  • 无法对70%的公司数据(范围)进行跨数据库查询
  • 65%的时间,高管没有收到他们需要的数据(合适)
  • 60%的时间,用户无法立即对他们收到的数据进行在线分析(可分析性)
  • Web上出现的75%的新关键信息源不会在一年内传递给用户(敏捷性)

产生以上问题的最大原因,在于业务用户通常不了解数据准备的复杂性和错误所涉及的风险,且缺乏统一部门强有力的数据治理(Data Governance),进而使得数据的质量变得不可控。数据基层一旦出现问题,高级的分析和敏捷性需求也无从说起。

什么是敏捷BI?

在很长一段时间里,Excel和其他电子表格都是各类组织处理分析数据的主要工具,拥有数量最大的用户群(中国90%以上的组织数据仍很大程度依赖于Excel)。虽然电子表格有很多优势,但把它当做BI工具使用,在以下场景会严重受限:

  1. 需要对包含多个工作表或数据库的混合数据源开展分析时
  2. 多人同时对一张电子表格进行维护和协作时
  3. 数据量达到上限或包含非结构化数据让可视化变得困难
  4. 使用复杂的公式降低了查询性能时
  5. 需要交互式分析和数据探索时
  6. 需要定时刷新时

传统BI已经在很大程度上解除了上述限制,但在国内政企组织内的普及度仍然十分有限。随着组织数据量的增大和外界环境的不断变化,组织对于数据的管控和分析有了更高的要求,希望能够摆脱过去较高的技术门槛,较长的部署时间,缓慢的数据整理和分析速度,力求“又快又好”。在这样的背景下,“敏捷BI”应运而生。

敏捷BI的出现,是以一系列自助式数据分析软件的出现为标志的(所以敏捷BI也被称之为自助式BI)。随着Power BI,Qlik Sence,Tableau,帆软等国内外软件的不断迭代更新,数据分析的主角不再仅指具备IT技术背景的研发人员和数据科学家,每一个没有技术基础的业务人员也可以更高效便捷的方式获取、整理和分析数据。

敏捷一词(Agile)源于17位轻量级方法学家在2001年2月提出的敏捷宣言(Agile Manifesto)。Agile的提出,一开始就是带着IT项目开发基因的,而在“敏捷BI”这一概念里,主要取的是“快捷高效,简单明晰”的意思。

结合到数据应用场景,我们可以先从Excel的Vlookup函数出发,看看何为“敏捷”?相信这是很多报表从业人员,接触的第一个稍显复杂(相比于sum、count等函数)但又觉得爱不释手的函数,在日常的工作中使用频率极高。很多人也是通过它,第一次明白了电子表格的强大威力。

为什么用它来解释“敏捷”?因为在电子表格时代,它可以帮助使用者快速高效地进行表格信息的交付、部署、变更、查询。它的交付结果可靠,运算性能稳定;部署方便:内置四个系数均具备明确含义和标准用法;且四个系数均可灵活修改,变更方便;在数据质量可靠的情况下,可以查询表格内(间)几乎所有的信息。在电子表格这个领域,Vlookup无疑可以称得上是“敏捷”的函数之一。

大数据时代敏捷BI(商业智能)的理解与选择

类似的教程图相信大家并不陌生


同样的道理,在敏捷BI时代,这样的特征仍不过时:能快速高效地帮助使用者进行数据的结果交付、技术部署、需求变更、精准查询,这便是敏捷BI。

敏捷BI厂商竞争格局


大数据时代敏捷BI(商业智能)的理解与选择

Gartner2018年BI厂商魔力象限


大数据时代敏捷BI(商业智能)的理解与选择

Gartner2019年BI厂商魔力象限

Gartner的魔力象限图报告是技术厂商测评的年度权威文件,结合历年的象限图我们往往可以观察一个细分技术行业的趋势,是企业和个人对各类技术工具选型的必读文件

其横轴指标:

前瞻性(Completeness of Vision):包括厂商或供应商提供的产品底层技术基础的能力、市场领导能力、创新能力和外部投资等等。

其纵轴指标:执行能力(Ability to Execute):包括产品的使用难度、市场服务的完善程度和技术支持能力、管理团队的经验和能力等。

根据以上两大指标,其划分出四大象限:

  • Niche Players 利基者、投机者
  • Challengers 挑战者
  • Visionaries 有远见者、愿景者
  • Leader 领导者

关注的重点无疑只需放在Leader象限和趋势上逼近leader象限的厂商,其他的厂商都只是市场和技术的追随者。

就BI领域而言,从2016年传统BI厂商集体退出Leader(领导者)象限后,这四年一直都是PowerBI、Tableau和Qlik的天下。2019年凭借高性能的语音识别BI异军突起的ThoughtSpot是一家由印度人创办的美国独角兽,但是其目前的业务范围主要分布在美国、东南亚及欧洲市场,对于中国市场的兴趣不大,产品没有汉化且几乎没有国内的市场运营活动。

Qlik的产品实力不俗,但在中国的市场表现乏善可陈,本人了解有限,暂且不表。

PowerBI和Tableau这两款BI产品是近年国内表现极佳的两款国际产品,PowerBI虽然晚于Tableau起步,但是凭借其微软出品的背景、个人免费战略还有捆绑Azure云服务的企业免费销售策略,在市场占有角度来说,在国内市场表现得很不错,就我了解的一些500强外企而言,有相当比例的企业甚至开始出现将Tableau报表置换为PowerBI的情况。

但单从我使用的体验来说,Tableau的可视化分析体验是远远胜于PowerBI的,图形美观,细节出众,整体来说使用起来十分流畅,逻辑清晰,且真正实现“托拉拽”级别的分析易用性。如果只是轻量化部署,Tableau的体验可以说是首推。虽然近年来PowerBI也在逐步改善,但是其跳转界面众多和区分前后台的产品设计逻辑,我认为从“基因”上就不如前两者那种“所有操作可以在同一个界面流畅完成”的体验。Tableau和Qlik使得数据更具触感,在操作过程中就能更有效地启发分析理念,而PowerBI则更像一个报表开发工具。

只是从企业级用户来说,特别是大型企业需求,考虑到数据量和近年来的云服务升级,PowerBI从性能和整体的适配性角度来说还是具备优势的。另外从“

成本”的角度来说,PowerBI的免费推广策略对于预算有限的企业来说,也具备十足的吸引力。

对于敏捷BI的常见误区

每个概念的兴起必然带来多种的解读,同时也产生有不少误解,敏捷BI亦不例外。对于它的常见误区,有如下四点。

1.敏捷BI是一种能力,而不单指工具。

BI作为一个有着计算机基因的概念,在宣传的时候自然没人会爱看那些枯燥的代码,酷炫简单的效果往往更受青睐,这使得人们在理解BI时,很自然地就联想起各种形式多样色彩丰富的动态图表。但其实,图表只是BI的前端展示界面,是部署BI这项技术性极强且极具体系工作的冰山一角;敏捷BI软件也不仅是一个高级的图表制作工具,它也兼备着获取和清洗数据等高级功能。

当前主流的敏捷BI报表软件,宣称“敏捷”的最大优势,是其内置的各类图表、灵活高效的函数、简单便捷的元素拖拽方式。区别于传统BI开发偏代码的环境,敏捷BI的前端报表开发,已经变得极具可视化,其使用的难度和逻辑与Excel相仿,哪怕对于没有技术基础的业务人员,也不影响其使用或做简单的修改和开发。从某种意义上,各类敏捷BI工具是对Excel等传统表格工具和代码环境优势的中和,而这个粘合剂,就是可视化交互元素,在保留后台代码搭建环境的基础上,敏捷BI工具将很多繁琐操作进行整合形成新的功能,使得数据在软件内的交互感有了质的提升。这些功能都极大地拓展了BI的易用性、处理速度和探索深度。


大数据时代敏捷BI(商业智能)的理解与选择

一个典型的BI体系部署流程(技术维度)

近年来各大BI厂商都在强调“增强分析”的发展趋势,以软件已经在支持python和R的功能打包,并引入机器学习概念和更强大的交互功能(语音识别等),增强分析使得人人都有可能成为“数据科学专家”,极大地提高工作效率,其智能化的步伐将随着技术和产品的进步越来越快。未来BI的趋势之一,便是工具和语言的融合。

但这方面无需过分迷信,仍然存在较大的故事水分,人工智能的很多应该场景仍然和炼金术无异。

在这样的发展背景下,敏捷BI,其实指的是贯穿在数据分析平台构建和运行过程中的快速实现能力。


大数据时代敏捷BI(商业智能)的理解与选择

BI部署的冰山效应


2.敏捷BI并不是电子表格和传统BI的替代品

虽然电子表格和敏捷BI工具都使用表格,但它们实际上是在不同的场合中发挥不同的作用。 电子表格首先是一种存储和显示计算的方法。BI表格中的数据使用各种算法进行压缩,不像Excel那样直接使用行和列的编号来定位。虽然电子表格可以创建复杂的数学公式,比如Excel的分析工具库,但它们的核心是数学公式而不是模型。

敏捷BI不会使传统的数据库管理或数据科学家失效。 这些由专业人士提供的复杂洞察,对大多数组织仍然具有很高的价值。而很多敏捷BI在数据治理方面也一直处于劣势,Tableau在2018年初推出的prep产品就是在弥补这一劣势,但推广和技术评价并不出众,很多功能仍是其本身可视化的拓展以及对传统ETL工具的逻辑借鉴。

敏捷BI虽然功能强大,看起来在很多场景下可以代替电子表格,却也很难真正取而代之,电子表格软件仍有其强大的生命力,并不过时。小规模数据的分析处理,Excel仍是十分轻便高效的。此外,价格、安装成本、易用度及培训门槛都是需要考虑的因素。

就好像XMind Pro和XMind:ZEN。Pro 的定位无疑是一款全栈思维导图软件,其完美地符合所有思维导图用户的大部分需求,而ZEN则舍弃掉了一部分专业性功能,主打简约美观、轻量化后的性能、100%兼容移动端。可以说,ZEN便是一款敏捷型思维导图工具。这是为了迎合更多用户需求做出的两条产品线,而诸多的敏捷型BI工具区别于传统BI、电子表格的思路也与此类似。


大数据时代敏捷BI(商业智能)的理解与选择

mind:zen和xmind 8 pro的对比

敏捷BI、传统BI、电子表格三者并不是简单的对立关系或是高级与低级的区别。组织需要思考的,是多元选择下的组合应用,扬长避短,而不是理解为做简单的取和舍或是迭代升级。

3.敏捷bi工具无法直接告诉决策者答案

在这个“颜值至上”的年代,BI软件的界面也做得越发具有设计感,无论是色彩还是UI的质感,都给人一种“高大上”的感觉。仿佛只要看到了变化的数字和仪表盘,就已经获得了海量的信息。但敏捷BI其实是很难直接给出答案的,而是促进决策者通过合理的信息展现形式,进行更为系统深入的思考。而且敏捷BI在深入数学建模方面,为了兼顾性能,在功能上无法做到像R或Python语言那样具备高灵活度。如果要深入地做数据分析,不能完全依赖敏捷BI工具的分析功能。

BI的定位应该始终是一个优质信息的整合处理和参考工具,在短期内无法取代人类的思考。统计图表虽然强大,但它也是现代社会里最会说谎的事物之一,很多信息仍需要甄别和深入的思考。当我们看到各种结果呈现时,还是得多问几个为什么。

大数据时代敏捷BI(商业智能)的理解与选择

美国统计专家达莱尔·哈夫写就的传世之作,至今读来仍给人以深刻警醒


4.敏捷BI的部署需要强有力的项目管理和数据治理

正如之前提到的,敏捷二字带有鲜明的IT开发项目色彩。其部署往往以一个项目为单位开展,需要在短期内投入企业较多资源。当前敏捷BI部署的主流方向是采取外包的形式,专业性强的数据服务公司往往能更契合业务型公司的需求,项目周期和成本的可控,也为甲方公司能节约更多资源。但这绝不意味着,敏捷BI部署就是请技术人员将功能需求实现这么简单,它需要业务与技术、甲方与乙方的多重协调。这常常为需求方所忽略,进而产生较大的隐性沟通成本。

当前的敏捷BI更多强调的是在前端体验上的“自主敏捷”和“流畅敏捷”,其实都严重依赖事先的数据准备工作,一旦分析需求超出事先的准备,都很难再敏捷起来了。而数据准备一般都比较复杂,经常要做脱敏处理或多表关联,只能由技术人员来完成,是最费时费力的环节。

同时,数据质量的高低是决定BI部署成功与否的基础所在,数据清洗在数据分析过程中仍然会占据大比例的资源。这是每个企业都无法回避的现实,数据分析中经常听到的那句“Garbage in,garbage out”,在敏捷BI的部署中,依然适用。相比于关注一些在当前还虚无缥缈的“增强分析”,数据治理反而是当前企业最需关注的。

值得注意的是,而当前的很多敏捷BI在数据准备和综合化的数据治理方面,特别是企业级大数据领域,相较于传统BI厂商(IBM、Oracal、SAP)并不占优,例如Tableau直到2018年初才正式推出其主打数据整理功能的工具Tableau prep,Power BI也在很大程度上依赖于脱胎于Excel的数据整理功能,而这种数据整理功能也侧重于“数据清洗”,远远达不到数据治理的要求。在这一点上,国内近年来兴起的“数据中台”概念,也是在寻求综合化数据治理的一种思路。

综上,可以想见,任何一家企业或组织想要实现BI敏捷性的成功,至少需要三点

1、自身强有力的数据管理意识和规范

2、技术团队(内部/外包)强有力的数据技术支持

3、高效敏捷的新型BI工具(技术与业务人员间的桥梁)

在敏捷BI工具极大地降低了数据分析门槛和资源消耗的今天,不管你是一个组织的普通业务或技术员工、咨询顾问、专家还是的中高层领导。如果你的团队拥有合适的工具和一个管理大量数据的简便方法,如果你能像数据专家一样,时刻保持对术语、专业技术和解决方案的敏感度并与时俱进,这将为你和你所在的组织带来巨大的价值,这将让你所在的组织,真正地实现“数据驱动”。


分享到:


相關文章: