阿里雲入選Gartner數據庫魔力象限,這個中國唯一意味著什麼?

作者:耶魯大學計算機系博士 抹布

蓋特納(Gartner)是全球知名的頂級研究和諮詢公司,旗下發布的數據庫魔力象限(Magic Quadrant)報告被認為是對全球各大IT公司在數據庫領域一年一度的巡禮,備受市場關注。入選公司無論是Oracle、微軟這樣的老牌西方勁旅,或是Neo4j這樣的近十年曆史出頭的新秀,都對此十分重視,基本上第一時間針對蓋特納的評選結果發佈新聞稿。

作為被業界關注的榜單,其評選也十分嚴苛。這個榜單之所以被稱為魔力象限(Magic Quadrant),是因為它的結果會以經典的xy二維座標形式來展示。縱軸越高代表執行能力越強,橫軸越長代表越有戰略眼光。二者兼備的公司被稱為“領導者”(leader),戰略眼光稍顯欠缺但執行能力很強的則是“挑戰者”(Challenger),只有眼光而缺乏行動的公司是“遠見者”(Visionary,或“空想家”),二者皆不具備的公司則是無足輕重(Niche Player)。以構建前沿系統、囊括一眾全球頂級工程師的谷歌公司在2017年時也只能待在“遠見者”象限裡,執行力被微軟、Amazon AWS等老牌勁旅甩開很大差距。


阿里雲入選Gartner數據庫魔力象限,這個中國唯一意味著什麼?

圖注:蓋特納數據庫魔力象限2017年評選結果


阿里雲入選Gartner數據庫魔力象限,這個中國唯一意味著什麼?

圖注:蓋特納數據庫魔力象限2018年評選結果

到了2018年,一家來自中國的公司——阿里雲突然出現在蓋特納評選結果中,並且執行力與戰略眼光兩項都與IBM,Google等知名西方頂級公司差距很小。雖然這是阿里雲的首次上榜,但是阿里並沒有屈居右下角的“遠見者”象限太長時間。在2018-2019年度,根據蓋特納的數據,阿里雲數據庫的體量增長了驚人的116%,牢牢控制了中國第一、全球第三的位置,於是到了2019年的最新一期評選中,阿里進入了“挑戰者”象限,這也是目前為止唯一一家入選的中國公司。


阿里雲入選Gartner數據庫魔力象限,這個中國唯一意味著什麼?

走到這一步的阿里雲並不容易。在這個行業,一直有著所謂“IOE”三駕馬車的說法,即所謂IBM的服務器,Oracle的數據庫,EMC的存儲。十年前,阿里巴巴曾是Oracle在亞洲最大的客戶,但這些商業數據庫無法滿足阿里自身業務的需要,阿里被迫走上自主研發之路,2009年阿里率先喊出“去IOE”並寫入公司戰略。2013年,淘寶核心系統最後一臺Oracle數據庫下線,替換整體成功。

作為對比,直到2019年的今天,筆者還聽說有的銀行系統仍然綁死在IOE系統上,有的源代碼甚至都已經丟失,核心binary跑在機器上無人敢動,使得往後的每一代系統更新都會變成IOE公司囊中的訂單。

數據庫系統的研發很困難嗎?很遺憾,確實非常困難,超大規模的數據庫系統是計算機系統,乃至整個IT軟件領域最困難的挑戰之一,這也是為什麼Oracle在這麼多年後仍然可以躺在功勞簿上吃香喝辣的重要原因之一。

那它到底難在哪裡?

舉個例子,中國北方黑龍江省的用戶,中國西部青海省的用戶,由於地理距離,每一個網絡請求抵達中國東部沿海的阿里數據中心網絡會有著幾十到上百毫秒的延遲,這些延遲將不可避免地轉化為用戶可以感知到的各種卡頓,這些卡頓會發生在用戶嘗試放大商品圖片時、添加商品進入購物車時、嘗試結賬時等等,讓購物體驗變得像是在操作一臺上世紀80年代的古董電腦。另外從安全角度考慮,網絡連接所依賴的物理連線橫跨幅員遼闊的中國大陸,幾千公里的距離上,任何一點突發事故都會導致災難性後果。因此,超大規模的數據庫系統必須做到異地、多活,冗餘,將數據庫系統分佈在全國甚至全世界各個角落,並考慮緊急情況下的流量切換,各個點系統的互相救援,才能更好地服務用戶。

而這些還沒完。“異地多活”的架構也不可避免地帶來了數據同步的問題。每年雙十一,阿里和各第三方商家都會舉辦一些高價值商品進行零點零元購、一元購活動,全國甚至全世界無數用戶都在摩拳擦掌(筆者今年在美國東部某小鎮參加感恩節派對時,周圍的美國人、印度人、歐洲人竟也在興致勃勃地討論今年阿里雙十一對海外用戶的折扣力度!),而這種活動對任何超大規模數據庫系統都是極具挑戰性。因為在這種數據庫系統中,一些關鍵信息(例如當前可用庫存數目)需要進行冗餘、分佈式存儲,深圳用戶的搶購結果必須同步給哈爾濱的用戶可見,反之亦然,在什麼時候對數據加鎖保證互斥訪問,什麼時候廣播、多播、點播新數據,在儘可能保證功能正確的情況下最小化網絡和服務器的運轉壓力,這些都是很困難的問題。

而在今年雙11的交易中,阿里自研數據庫OceanBase和POLARDB每秒處理峰值都遠遠超越傳統Oracle數據庫。據悉,今年雙11期間OceanBase數據庫處理峰值達到6100萬次/秒,POLARDB數據庫處理峰值達到8700萬次/秒。 這種極限流量洪峰的實戰考驗是阿里雲數據庫系統得以得到國際認可的硬核所在。


分享到:


相關文章: