什么是基于搜索的分析?

现在是时候我们可以查询我们的数据了

什么是基于搜索的分析?

> Photo by Balázs Kétyi on Unsplash

什么是基于搜索的分析?

您可以将基于搜索的分析视为公司数据的搜索引擎。 基于搜索的分析功能可以询问"上一季度我们的净收入是多少"或"显示过去30天内按周排序下载了我们的应用程序的用户数量"之类的问题,并获取可行的数据和图表。

为什么需要基于搜索的分析?

在过去的十年中,商业智能工具使业务用户能够创建自己的仪表板和可视化文件。 这有助于高管和部门负责人做出以数据为依据的决策以支持公司目标的能力。 但是,利用这些仪表板和可视化功能的能力受到数据治理,数据孤岛和数据蔓延以及各个用户能力等问题的限制。

您可以将基于搜索的分析视为公司数据的搜索引擎

不仅如此,为了使用数据分析仪表板,必须首先创建仪表板。 必须引入数据,必须选择和应用可视化,并且必须以能够回答特定业务问题的方式来设计仪表板。 这个过程可能要花费数小时甚至数天。

另一方面,基于搜索的分析使业务用户可以用简单的英语提问,并立即获得可操作的数据和可视化结果。

什么是基于搜索的分析?

> Using search-based analytics to analyze COVID-19 data (video made by author using Knowi)

但是,构建有效的基于搜索的分析平台存在挑战。 例如,为了使其有效运行,基于搜索的分析平台需要理解诸如"比较","多少","平均"和"总计"之类的术语。 他们还需要了解特定于业务的术语,例如"增长","保留","流失"和"成本"。 至关重要的是,他们必须能够解释许多不同的日期或时间间隔表达方式,例如"从9月到12月","最后一个季度","按月显示"和"去年"。 这是通过自然语言处理完成的。

自然语言处理(NLP)

自然语言处理(NLP)最早出现于1950年代,但直到最近才达到该技术广泛适用的地步。 如您所料,使计算机能够理解人类语言是一个主要的障碍-只考虑英语的复杂性和细微差别。

NLP的工作是将人类语言问题转换为分析引擎可以理解的查询

在过去的十年中,情况发生了很大变化。 Google搜索,Wolfram Alpha,Amazon Alexa和Apple的Siri在使用NLP为人们提供真实服务方面都取得了长足的进步。

在基于搜索的分析中,这可能更加复杂。 有很多方法可以请求特定类型的数据或可视化。 NLP的工作是将人类语言问题转换为分析引擎可以理解的查询。

什么是基于搜索的分析?

> Using search-based analytics on IoT Geospatial data (video made by author using Knowi)


针对特定用例定制基于搜索的分析

除了将NLP应用于数据以创建基于搜索的分析所带来的一般挑战之外,还有用例特定的挑战。

如果调查100家公司如何使用商业智能工具,则可能会得到100个不同的答案。 这是因为所有行业都使用不同的数据。 即使是同一行业的单个公司,也可能会跟踪不同的指标和KPI(关键绩效指标)。 当包含在自然语言查询中时,许多行业还具有不同的术语和特定领域的知识,至少必须在粗略的水平上对此有所了解。

这就是为什么在这种情况下,提供商必须根据客户的特定用例定制基于搜索的分析部署的原因。 此过程通常涉及向NLP库中添加自定义术语和同义词,映射关系,调整变量名称以及自定义可视化选择逻辑。

示例:实际上这是什么样的?

想象一下一家冷藏卡车公司,该公司使用GPS和IoT(物联网)温度传感器将监视数据馈入其商业智能平台。 他们将想知道诸如卡车在哪里,行驶多快以及冷藏室内的温度等信息。

这意味着基于搜索的分析平台将需要理解以下问题:"向我展示亚利桑那州所有卡车的位置和温度"," 5号钻机的温度有多高"以及"是否有高于冻结的单位?"。 第一个查询可能是现成的,但是第二个和第三个示例可能需要一些自定义才能正确解释。

什么是基于搜索的分析?

> Using search-based analytics in Slack (video made by author using Knowi)

它真的像谷歌搜索一样容易吗?

简短的回答:不。 但是更好的答案可能是"还没有"。 如果您还记得Web Crawler,Alta Vista和Excite的时代,那么您就会知道,早期的搜索引擎并不能很好地使人们准确地找到他们想要的东西。

建立用于数据的搜索引擎是一个更加困难的挑战,尤其是因为(如上所述)各个公司之间的差异很大。

但是,仍然有希望。 如果针对特定业务或用例定制基于搜索的分析解决方案,则可以轻松获得类似于Google的性能和准确性。 它需要一些前期工作,但结果可能会改变游戏规则。

关于作者

肖恩·奈特(Sean Knight)是SAAS分析公司Growth Knowi的负责人。 他拥有物理学和数据科学学位,并曾在粒子加速器,研究用核反应堆NASA JPL工作,现在已进入初创世界。 他是一位数据极客,喜欢为Towards Data Science,The Startup和Hackernoon贡献力量。在Twitter和Linkedin上找到他。

(本文翻译自Sean Knight的文章《What is Search-Based Analytics?》,参考:
https://towardsdatascience.com/what-is-search-based-analytics-a1097704ba91)


分享到:


相關文章: