搭档Cloudera 数澜科技帮企业把数据用起来

在大数据的概念出现以前,数据在很多企业中只是沉睡的宝藏。在大数据出现后,一批“倒腾”数据的企业先火了起来,益处是让人们对数据的流动、价值有了全新的认知,遗憾的是企业内部沉睡的数据依旧没有苏醒过来。如果睡美人的通话故事真能变成现实,那么谁又是那个能够吻醒数据睡美人的王子呢?

做好数据应用基础设施供应商

成立于2016年6月、短短三年时间规模已经成长为“准独角兽企业”的数澜科技,一门心思想帮助企业率先将自有数据用起来。数澜科技COO武凯表示,企业只有先将自己的数据很好地用起来,然后才能实现企业之间数据的融通和互用。

数据架构是分层次的,最上面是数据的业务应用层,中间是数据的服务层,最下面则是数据的基础设施层。数澜科技与自己的最佳拍档Cloudera都专注于数据的基础设施层,共同帮助企业用户构建其数据资产和数据应用平台,数澜科技称之为数栖平台。就像APaaS是面向应用的平台,DPaaS是数栖产品最直观的定位理解,它是面向数据的平台。DPaaS高度概括了数澜科技最核心的定位,即成为值得信赖的数据应用基础设施供应商。

DPaaS提供了一套相对完备的将数据用起来的机制,包括数据安全、数据质量、数据规范,以及基本的数据应用模板和相关方法论,目标就是让数据的处理更快、更敏捷,可以快速被用起来。数澜科技DPaaS平台是建立在Cloudera CDH平台之上的,它需要Cloudera CDH这个优秀的大数据计算引擎。

数据资产从下到上依次是原始数据层、数据仓库层、数据资产层和数据应用层。这四个层次的管理运营需要一套可视化的管理工具。数澜科技的“数栖”就是在CDH之上、应用之下提供数据快速开发、标签搭建等数据运营管理服务的。数栖是一站式大数据应用平台,致力于为企业构建数据中台提供基础的平台能力支撑。平台提供从数据同步、数据开发、数据治理到数据服务的一站式大数据全链路解决方案,支持Cloudera、Hadoop、Spark、Flink、Presto等业界流行的大数据计算引擎,并可快速扩展。通过此平台可构建PB级别数据仓库及进行数据价值的深度挖掘,实现超大规模数据的资产化、管理和应用。数栖平台采用开箱即用的使用方式,让用户无需再关心底层集群的搭建和运维,从而极大地提高数据开发和应用的效率。

数澜科技的用户选择了Cloudera

在众多大数据计算引擎中,数澜科技为什么对Cloudera情有独钟?武凯解释说,其实并不是数澜科技选择了Cloudera,而是数澜科技的用户选择了Cloudera。现在数澜科技超过40%的客户都在同时使用Cloudera的产品。

最初,数澜科技并没有刻意寻找Cloudera合作,但是在与宁波银行、百果园等众多客户交流时发现,他们早就在使用Cloudera CDH。顺理成章,数澜科技与Cloudera走到了一起。当然,在数据资产化的各个层级,数澜科技都有类似Cloudera这样合作良好的伙伴,是业务上的天然关联促成了彼此的合作,也可以更好地打通数据价值链。

武凯用“良好的耦合”来形容数澜科技与Cloudera在产品端的合作。在数据底层将Cloudera CDH部署好,为数栖提供基本的计算和存储集群,数澜科技的一个执行代理的代理服务器安装到这个集群中,实现与数栖的通信,同时进行数据的汇聚、开发、管理和资产化的动作。数澜科技会通过提供一些端口和优化配置,实现数栖与Cloudera CDH更轻量化的联动。

数澜科技研发的数栖产品在过去3年中服务了近10%的世界500强中国上榜企业,但主要都是头部企业客户。为了让更多快速成长型企业也用上数栖,数澜科技从2019年6月22日正式发布云战略--推出“数栖云”产品,到现在,已经有4000多注册用户。其中很多用户采用的是混合云的部署模式。数栖云优先向用户推荐的就是Cloudera CDH,因为它的部署简单,应用规范,使用成本低,且效率高。武凯举例说,只要按照Cloudera CDH的标准规范,一步一步进行操作,很快就可以完成配置,节省80%以上的部署时间。

Cloudera与Hortonworks的合并,对Cloudera的用户来说也是一大利好。在数栖云的客户中,43%在使用Cloudera的产品,而这些客户中又有65%左右使用的是合并前的Cloudera CDH,其他的则使用了Hortonworks HDP。Cloudera与Hortonworks的整合让像数澜科技这样的合作伙伴感觉,商业合作和服务更有保证。

其实数澜科技与Cloudera能够走到一起,还有一个关键因素是,那就是双方都相信术业有专攻,在自己擅长的领域做到专业、精进。数澜科技做好数据应用基础设施,而Cloudera做好更底层的大数据计算引擎,两者的无缝联通就是合作最稳定的基础。

数据部门不是“取数机”

对企业来说,将数据从各个地方抽取出来并存放到一起,这件事并不难。但是现在摆在企业数据部门负责人面前的一道难题是,如何说服企业的老板认识到数据部门的价值。数据部门并不甘心仅仅作为业务部门的“取数机”。

数据中台的兴起让企业的数据部门(或是信息部门)看到了一个新的机会。数据对于企业业务的支撑不是像IT那样被动,而是可以走到更前端,也就是业务层面,从而真正发挥其价值。数据中台提供了一套系统的方法论,包括如何将业务数据化,既而将数据业务化。武凯认为,数据中台就是一套让数据用起来的机制,包括数据汇聚,数据汇聚之后如何变成数据资产,资产又如何赋能应用。举例来说,数澜科技最核心的标签体系的建立,就是数据资产化的重要环节。盘点业务系统的数据和应用场景,设计标签并建立质量规范和安全规范,以及建立组织结构的支撑,数澜科技拥有一整套解决方案。

武凯重申,数据中台是一种让数据持续用起来的机制,包括企业的战略定位、组织结构,最后才是一站式的工具,旨在解决数据治理、安全、标签体系、资产化等数据应用问题。数澜科技重点打造的数栖云是免费提供给快速成长型企业使用的,而大型集团企业可以使用融合了Cloudera CDH的私有化部署的数栖产品,以确保数据的安全性。

数据中台是企业内部的一套机制,因企业的不同会表现出千人千面。企业要根据实际需求设计自己的数据资产能力、标签等,这一整套体系可以构建在Cloudera CDH之上。

曾经有投资人这样问武凯:“数澜科技帮助企业建数据中台,又拥有数据基础设施,将来打算如何将数据变现?”武凯一口回绝了这个投资人:“客户的数据是客户的资产,也是其业务的生命线。我们只专注做好数据应用基础设施,从来没有数据变现的计划。这是我们赢得客户信赖的重要前提。”


分享到:


相關文章: