搭檔Cloudera 數瀾科技幫企業把數據用起來

在大數據的概念出現以前,數據在很多企業中只是沉睡的寶藏。在大數據出現後,一批“倒騰”數據的企業先火了起來,益處是讓人們對數據的流動、價值有了全新的認知,遺憾的是企業內部沉睡的數據依舊沒有甦醒過來。如果睡美人的通話故事真能變成現實,那麼誰又是那個能夠吻醒數據睡美人的王子呢?

做好數據應用基礎設施供應商

成立於2016年6月、短短三年時間規模已經成長為“準獨角獸企業”的數瀾科技,一門心思想幫助企業率先將自有數據用起來。數瀾科技COO武凱表示,企業只有先將自己的數據很好地用起來,然後才能實現企業之間數據的融通和互用。

數據架構是分層次的,最上面是數據的業務應用層,中間是數據的服務層,最下面則是數據的基礎設施層。數瀾科技與自己的最佳拍檔Cloudera都專注於數據的基礎設施層,共同幫助企業用戶構建其數據資產和數據應用平臺,數瀾科技稱之為數棲平臺。就像APaaS是面向應用的平臺,DPaaS是數棲產品最直觀的定位理解,它是面向數據的平臺。DPaaS高度概括了數瀾科技最核心的定位,即成為值得信賴的數據應用基礎設施供應商。

DPaaS提供了一套相對完備的將數據用起來的機制,包括數據安全、數據質量、數據規範,以及基本的數據應用模板和相關方法論,目標就是讓數據的處理更快、更敏捷,可以快速被用起來。數瀾科技DPaaS平臺是建立在Cloudera CDH平臺之上的,它需要Cloudera CDH這個優秀的大數據計算引擎。

數據資產從下到上依次是原始數據層、數據倉庫層、數據資產層和數據應用層。這四個層次的管理運營需要一套可視化的管理工具。數瀾科技的“數棲”就是在CDH之上、應用之下提供數據快速開發、標籤搭建等數據運營管理服務的。數棲是一站式大數據應用平臺,致力於為企業構建數據中臺提供基礎的平臺能力支撐。平臺提供從數據同步、數據開發、數據治理到數據服務的一站式大數據全鏈路解決方案,支持Cloudera、Hadoop、Spark、Flink、Presto等業界流行的大數據計算引擎,並可快速擴展。通過此平臺可構建PB級別數據倉庫及進行數據價值的深度挖掘,實現超大規模數據的資產化、管理和應用。數棲平臺採用開箱即用的使用方式,讓用戶無需再關心底層集群的搭建和運維,從而極大地提高數據開發和應用的效率。

數瀾科技的用戶選擇了Cloudera

在眾多大數據計算引擎中,數瀾科技為什麼對Cloudera情有獨鍾?武凱解釋說,其實並不是數瀾科技選擇了Cloudera,而是數瀾科技的用戶選擇了Cloudera。現在數瀾科技超過40%的客戶都在同時使用Cloudera的產品。

最初,數瀾科技並沒有刻意尋找Cloudera合作,但是在與寧波銀行、百果園等眾多客戶交流時發現,他們早就在使用Cloudera CDH。順理成章,數瀾科技與Cloudera走到了一起。當然,在數據資產化的各個層級,數瀾科技都有類似Cloudera這樣合作良好的夥伴,是業務上的天然關聯促成了彼此的合作,也可以更好地打通數據價值鏈。

武凱用“良好的耦合”來形容數瀾科技與Cloudera在產品端的合作。在數據底層將Cloudera CDH部署好,為數棲提供基本的計算和存儲集群,數瀾科技的一個執行代理的代理服務器安裝到這個集群中,實現與數棲的通信,同時進行數據的匯聚、開發、管理和資產化的動作。數瀾科技會通過提供一些端口和優化配置,實現數棲與Cloudera CDH更輕量化的聯動。

數瀾科技研發的數棲產品在過去3年中服務了近10%的世界500強中國上榜企業,但主要都是頭部企業客戶。為了讓更多快速成長型企業也用上數棲,數瀾科技從2019年6月22日正式發佈雲戰略--推出“數棲雲”產品,到現在,已經有4000多註冊用戶。其中很多用戶採用的是混合雲的部署模式。數棲雲優先向用戶推薦的就是Cloudera CDH,因為它的部署簡單,應用規範,使用成本低,且效率高。武凱舉例說,只要按照Cloudera CDH的標準規範,一步一步進行操作,很快就可以完成配置,節省80%以上的部署時間。

Cloudera與Hortonworks的合併,對Cloudera的用戶來說也是一大利好。在數棲雲的客戶中,43%在使用Cloudera的產品,而這些客戶中又有65%左右使用的是合併前的Cloudera CDH,其他的則使用了Hortonworks HDP。Cloudera與Hortonworks的整合讓像數瀾科技這樣的合作伙伴感覺,商業合作和服務更有保證。

其實數瀾科技與Cloudera能夠走到一起,還有一個關鍵因素是,那就是雙方都相信術業有專攻,在自己擅長的領域做到專業、精進。數瀾科技做好數據應用基礎設施,而Cloudera做好更底層的大數據計算引擎,兩者的無縫聯通就是合作最穩定的基礎。

數據部門不是“取數機”

對企業來說,將數據從各個地方抽取出來並存放到一起,這件事並不難。但是現在擺在企業數據部門負責人面前的一道難題是,如何說服企業的老闆認識到數據部門的價值。數據部門並不甘心僅僅作為業務部門的“取數機”。

數據中臺的興起讓企業的數據部門(或是信息部門)看到了一個新的機會。數據對於企業業務的支撐不是像IT那樣被動,而是可以走到更前端,也就是業務層面,從而真正發揮其價值。數據中臺提供了一套系統的方法論,包括如何將業務數據化,既而將數據業務化。武凱認為,數據中臺就是一套讓數據用起來的機制,包括數據匯聚,數據匯聚之後如何變成數據資產,資產又如何賦能應用。舉例來說,數瀾科技最核心的標籤體系的建立,就是數據資產化的重要環節。盤點業務系統的數據和應用場景,設計標籤並建立質量規範和安全規範,以及建立組織結構的支撐,數瀾科技擁有一整套解決方案。

武凱重申,數據中臺是一種讓數據持續用起來的機制,包括企業的戰略定位、組織結構,最後才是一站式的工具,旨在解決數據治理、安全、標籤體系、資產化等數據應用問題。數瀾科技重點打造的數棲雲是免費提供給快速成長型企業使用的,而大型集團企業可以使用融合了Cloudera CDH的私有化部署的數棲產品,以確保數據的安全性。

數據中臺是企業內部的一套機制,因企業的不同會表現出千人千面。企業要根據實際需求設計自己的數據資產能力、標籤等,這一整套體系可以構建在Cloudera CDH之上。

曾經有投資人這樣問武凱:“數瀾科技幫助企業建數據中臺,又擁有數據基礎設施,將來打算如何將數據變現?”武凱一口回絕了這個投資人:“客戶的數據是客戶的資產,也是其業務的生命線。我們只專注做好數據應用基礎設施,從來沒有數據變現的計劃。這是我們贏得客戶信賴的重要前提。”


分享到:


相關文章: