雲化、智能化、NoSQL:2020年數據庫市場三大看點

(文/鄒大斌)雖然中國周邊國家新冠疫情此起彼伏,暫時還難以消停,但目前我們國內的疫情已經基本控制,生產、生活正在慢慢回覆常態,因此是時候讓我們把關注的目光重新轉回到眼下的科技領域,回到我們所處的IT行業。

就數據庫市場而言,2019年可謂看點頗多,一大亮點就是新品頻出,不只是有華為這樣的大廠推出了自己的GaussDB數據庫,其他雲服務商和一些從事數據相關業務的廠商也紛紛推出了自己的數據庫產品,這是近些年來少有的一個現象。另一個值得關注的變化是,關係型數據庫壟斷的格局正在被打破,以MongoDB為代表的NoSQL迅速崛起。

數據庫市場經過40多年的演進,不少人認為其技術已經趨於成熟,市場趨於穩定。事實證明,技術從來不會停止創新的腳步,在雲、AI等技術的帶動下,數據庫市場依然充滿活力,值得期待。

雲化、智能化、NoSQL:2020年數據庫市場三大看點

雲化與分佈式:讓數據庫自由伸縮

2019年年中Gartner發佈的研究報告《The Future of the Database Management System (DBMS) Market Is Cloud》引發了業內的廣泛關注。Gartner在該報告中提出,數據庫的雲服務是大趨勢,將數據庫安裝在企業數據中心的服務器上已經或者很快將成為一種“過時”的方法。

數據庫的主戰場從傳統的本地市場轉到了雲是雲原生數據庫和服務崛起的必然結果。AWS的Aurora被認為是AWS歷史上增長速度最快的一款雲服務;POLARDB在阿里雲2018年4月才開始商用,但在Gartner公佈的2019年全球數據庫魔力象限評選中,阿里雲就成功進入“挑戰者”象限,連續兩年作為唯一中國企業入選。除了AWS、阿里雲,今天不少雲服務商都推出了自己的雲數據庫。

實際上,不只是傳統數據庫,作為NoSQL領頭羊MongoDB的雲服務版本Altas同樣受到市場歡迎,Altas已經成為MongoDB重要的收入來源,營收佔比超過40%。去年年底,阿里雲與MongoDB達成戰略合作,宣佈在阿里雲平臺上推出最新版MongoDB數據庫雲服務MongoDB 4.2。這肯定會進一步加速MongoDB未來在雲服務市場的拓展,尤其是中國市場。

阿里雲智能數據庫事業部負責人李飛飛曾明確表示,未來的數據庫一定是雲原生和分佈式。因為雲原生數據庫在成本、靈活度、安全、技術進化層面都優於傳統數據庫,“傳統數據庫會像馬車一樣被更為先進的汽車即雲原生數據庫淘汰。”他說。

新一代數據庫崛起的一個核心原因是大數據時代的來臨。今天我們正處於一個數據大爆炸的時代,要應對數據的爆炸性增長需要數據庫具有足夠的彈性,而在雲上資源天生池化,這就為滿足客戶業務變化的峰值、峰谷需求奠定了很好的基礎,再結合新一代數據庫的分佈式架構結合計算、存儲分離等一系列技術就可以很好地解決可擴展性問題。

以MongoDB為例,MongoDB的一大亮點是其存儲和訪問海量數據的能力,就是依賴其分佈式架構實現的,包括數據的分片、擴容/縮容時數據的自動均衡、分片信息的存取以及高可用,這些特性的集成使得MongoDB數據庫能從容應對海量數據的存儲和訪問需求。類似的,阿里雲的POLARDB也是通過分佈式共享存儲架構、採用計算與存儲分離技術大大提升了數據庫的存儲容量。

實際上,當雲時代誕生的新一代數據庫把分佈式技術、雲的靈活擴展以及成本優勢淋漓盡致地充分展示出來,激發出來的強大的創新能力、豐富多樣的產品體系、經濟高效的部署方式和按需付費的支付模式,這些優勢讓傳統數據庫很難企及。根據IDC的研究,2021年會成為轉折一年,存儲在雲上的數據量將超過傳統數據中心,在這一變化之下雲數據庫的普及終將成為必然。

智能化:讓數據庫更聰明

數據庫運維是一件非常複雜的工作,尤其是涉及企業核心數據庫時,其中保存了企業重要的數據,對操作人員的要求非常高,因此數據庫管理員一直是市場緊缺人才。不過,得益於人工智能、機器學習等技術的進步,這種狀況有望慢慢得到緩解。

2017年甲骨文提出了“自治數據庫”這個概念,引發業界對人工智能在數據庫的應用前景的關注。2018年甲骨文的新一代數據庫ADW正式上市,我們看到,甲骨文的確朝著把數據庫管理員從繁重的數據庫優化、各種調優以及數據庫備份中解脫出來的方面上邁出了一大步,它讓管理員能騰出了更多時間去做一些高附加值的工作。根據甲骨文提供的資料,通過自動運行、自動完成打補丁、自動完成數據的備份、自動修復等,甲骨文自治數據庫能降低70%的運維工作量,將數據庫平均宕機時間減少到每月2.5分鐘。

實際上,隨著人工智能、機器學習技術的快速發展,利用它們來優化數據庫內核和以及數據庫運維、管控等一系列動作已經成為數據庫行業的共識。比如,數據庫管理員或者運維人員想優化應用軟件的負載,可能想知道需要建哪些索引;用戶體驗不佳想知道到底是哪個存儲過程受到了影響、如何優化,現在基本上是依賴工程師、DBA的經驗來解決,這些未來完全可以利用機器學習、人工智能方法進行智能化的優化。

值得一提的是,除了數據庫本身的智能化外,支持智能化應用方面也是數據庫的一個熱點。傳統數據倉庫產品通常只能處理結構化數據,而新一代的數據倉庫無不把支持多數據類型的處理作為基本指標,比如,通過標準的SQL語句同時處理結構化和非結構數據(文檔、圖片甚至視頻等)。另外,數據倉庫還在努力幫助業務人員找出系統與系統之間、數據與數據之間的關聯性。藉助數據庫倉庫的這一能力,業務部門即便不懂具體算法,也可以及時對相關數據做出調整。

為了支持AI應用,新一代數據庫基本都提供了數據湖產品或服務。比如,MongoDB的Atlas就集成的數據湖功能。其不需要定義模式,可以就地分析 JSON、BSON、CSV、TSV、Avro 和 Parquet 等格式;只要通過一個通用的用戶界面,就可以同時對數據湖和 Atlas 聯機事務處理集群進行操控,非常方便。

NoSQL崛起:為大數據而來

除了雲數據庫的崛起之外,這幾年數據庫市場另一個重大變化的是以NoSQL為代表的非關係型數據庫的異軍突起。

NoSQL誕生之前,數據庫市場基本是關係型數據庫(RDBMS)的天下,無論是理論知識還是數據庫產品乃至生態都已經非常成熟,而NoSQL走的是一條完全不同的技術路線。它與關係型數據庫以行和列構成的表來存儲數據不同,而NoSQL是以鍵、值對來存儲數據。

NoSQL的崛起有兩個最重要的原因,其一是大量非結構化數據的湧現,有數據顯示新增數據中超過80%是非結構化數據,這些數據用關係型數據庫來處理成本,高昂還不夠靈活,而NoSQL數據庫不僅數據存儲非常靈活,同時擴展靈活,從而受到市場熱捧。

在NoSQL市場MongoDB無疑是表現最為亮眼的一個。來自於DB-Engine的市場數據顯示,MongoDB已經持續多年與Oracle、MySQL、SQL Server、PostgreSQL一起位列全球五大最流行的數據庫,其影響力已經超過傳統數據庫DB2。

作為文檔型數據庫的代表,MongoDB採用的是BSON文件格式,MongoDB對數據結構沒有嚴格要求,可以根據需要靈活增減字段,簡單方便,而且MongoDB是原生的分佈式數據庫,天生地具有快速的水平擴展能力,非常適合海量數據的各種應用場景。MongoDB流行的另一個非常重要的原因在於其對程序員非常友好。相比於傳統數據庫需對複雜的表、庫進行操作以及多次存取數據,MongoDB開發人員不用去設計那些表、庫之間的各種複雜關係,只需一次存取,就可拿到想要的數據,程序員非常容易使用,開發效率非常高。

去年,MongoDB推出了最新版本——MongoDB 4.2,通過支持分佈式事務、自動重試和修改分片鍵等讓開發變得更快速、更輕鬆。同時,新的物化視圖、Kafka連接器和對Kubernetes的支持以及客戶端加密等,讓應用變得更健壯,使得MongoDB 4.2完成了一個里程碑式的升級。這些新特性再加上MongoDB與生俱來的雲原生的分佈式拓展能力無縫結合,使得MongoDB再次走到了NoSQL陣營的前列。

值得一提的是,除了NoSQL/NewSQL之外,近年來圖數據庫市場的成長也值得關注,來自Gartner研究報告顯示,2019年—2022年圖數據庫市場將會以每年100%的增長率增長,尤其是在風控、反洗錢、個性化推薦等領域,圖數據庫應用非常熱門。

綜上所述,經歷了多年平穩發展的數據庫市場正在迎來重大變化,這背後有技術本身的進步(比如AI),更有計算環境的變化(如雲計算的普及)。在這種市場中,誰能真正把握用戶需求,推出貼合用戶需求的產品和服務才能贏得更多的生存機會,我們也期待市場上能有更多更好的產品和服務!


分享到:


相關文章: