中國自研數據庫登頂全球第一!不服OceanBase跑分阿里雲邀你來戰


中國自研數據庫登頂全球第一!不服OceanBase跑分阿里雲邀你來戰

【新智元導讀】螞蟻金服自研數據庫登頂“數據庫領域世界盃”TPC-C排行榜,打破了Oracle維持九年的世界紀錄,卻被指責拿現在的數據跟Oracle九年前的數據比較是“勝之不武”。對此,阿里雲在新智元AI朋友圈 發起國內首個雲端數據庫測試平臺,邀請全球數據庫到雲上跑個分,不服來戰!

近日,螞蟻金服自研數據庫超越甲骨文(Oracle),又引發了行業熱議。

事情緣於10 月 2 日,國際事務處理性能委員會(TPC,Transaction Processing Performance Council)官網披露,在最新發布的 TPC-C 排行榜中,螞蟻金服自研數據庫 OceanBase 位列第一,打破了Oracle維持九年的世界紀錄。

中國自研數據庫登頂全球第一!不服OceanBase跑分阿里雲邀你來戰

TPC-C基準測試被譽為“數據庫領域世界盃”,OceanBase是首個登頂該榜單的中國數據庫產品。榜單被傳播後,有評論指出TPC-C測試結果有效期僅為3年,Oracle的分數於9年前測,如今早已失效。9年間軟硬件經過多次迭代,Oracle數據庫性能勢必提升數倍,螞蟻金服OceanBase如此比較“勝之不武”。

即便兩個評分有時間差距,不過正如團隊成員在知乎上回應,九年間也有參與跑分的數據庫廠商,但依然未有打破記錄者。因為“研製OLTP數據庫太難了”、“通過TPC-C的測試也很難”,螞蟻金服的這次登頂不可否認是一次很大的突破。

針鋒相對的觀點之間,也有不少“雨女無瓜”的留言飄過。比如:

“很正常啊,因為阿里的數據太海量了……也只有雙十一可以測試,這都很多年了。現在阿里自己出個更好的數據庫很正常。”

確實,跟Oracle決戰的OceanBase主要面向銀行,對互聯網公司來說是“殺雞焉用牛刀”的遙遠且昂貴。

OceanBase雖然是別人家的數據庫;但每家公司都有數據庫。在直播、帶貨大行其道的今天,哪家toC公司沒有個訂單系統、流量巔峰呢?怎麼也會對自家數據庫有點追求。

況且別忘了,OceanBase的底層,是半數創業公司都在用的阿里雲ECS。

不服OceanBase跑分?今天起可到阿里雲上一戰

螞蟻金服自研數據庫OceanBase登頂TPC-C榜單的消息振奮人心,同時引起國內技術圈的廣泛討論,第一個雲上跑出來的數據庫分數含金量如何?其他數據庫有沒有可能更強?

針對這些疑惑,10月24日,阿里雲以一種最為直接的方式作出回答:推出國內首個雲端數據庫測試平臺,直接在阿里雲上提供與OceanBase打榜時完全一致的雲資源環境,全球任意數據庫廠商均可申請報名,以雲端跑分這樣的硬核方式與其他數據庫一較高下。

中國自研數據庫登頂全球第一!不服OceanBase跑分阿里雲邀你來戰

https://pages.aliyun.com/aliyunpage/activity/tpc-c

阿里雲智能技術戰略總監陳緒在新智元AI朋友圈發起了這個擂臺賽:不服OceanBase跑分?今天起可到阿里雲上一戰。

包括陳緒在內,測試組織委員會委員已入駐新智元AI朋友圈,作為獨家合作平臺,跑分相關事項都可在這裡提問哦!

此前,OceanBase表示,登頂TPC-C的最大的優勢就在於採用阿里雲彈性計算資源,使得硬件成本只佔整體成本的18%左右。同時表示,雲端測試雖是業內首次,但得到了TPC-C技術委員會的官方認可。考慮到數據庫雲化的趨勢不可逆轉,這也意味著未來的數據庫測試必然基於雲端環境。

中國自研數據庫登頂全球第一!不服OceanBase跑分阿里雲邀你來戰

作為首個為OceanBase打榜TPC-C提供測試環境的雲服務商,阿里雲此次推出公開的測試平臺,一方面為大量的國產數據庫提供一個低門檻的測試環境。另一方面,也相當於搭建了一個公平透明的擂臺,向外界釋放信號:技術人廢話不多,直接跑分見實力。

阿里巴巴集團副總裁周靖人表示,此次數據庫測試只是嘗試的第一步,相信未來上雲跑分才是主流。

中國自研數據庫登頂全球第一!不服OceanBase跑分阿里雲邀你來戰

測試組織委員會委員包括:阿里巴巴集團副總裁周靖人、阿里雲彈性計算負責人蔣林泉、阿里雲智能技術戰略總監陳緒、新智元創始人兼CEO楊靜、中國電子技術標準化研究院軟件工程與評估中心主任周平

事實上,IT環境已今非昔比,數據庫廠商早已呼喚此類測試平臺。據瞭解,TPC-C是公認的老牌數據庫測試標準,但往往要自備硬件,這對於不少數據庫公司而言是不菲的成本。而云計算完全可以為數據庫測試提供更為靈活的彈性擴展支撐,同時雲上數據庫也逐漸成為最大的應用場景,這也是TPC-C官方接受這種全新測試方式的根本原因。

螞蟻金服研究員楊傳輝如此描述這一平臺,“任何一家公司只要在阿里雲上租用資源,用提供的工具跑測試,然後請審計人員來審計就可以了。關鍵只在於,你的產品夠不夠好。”

數據庫上雲已成大勢所趨。Gartner預測,2023年全球將有3/4的數據庫跑在雲上。隨著雲時代來臨,大量軟件和解決方案都在加速雲化,而數據庫是其中重要一環。

據悉,阿里雲還將為其他類型的測試提供開放平臺。

OceanBase優勢:硬件性價比高

軟件你買不起,“硬件”卻買得起。

OceanBase數據庫較於Oracle的優劣,研發團隊在公開採訪中也有分析。OceanBase最大優勢在於採用分佈式架構,特點恰恰是硬件成本低。

數據庫本身對硬件性能要求就很高,但OceanBase披露,硬件成本只佔整體成本的18%左右,只考慮硬件的性價比大幅優於集中式數據庫。

這跟傳統數據庫很不一樣。觀察榜單會發現,傳統Oracle和IBM的DB2等數據庫,都需要配備昂貴的專用硬件。這帶來了硬件成本的極大消耗。例如前最高記錄保持者Oracle在2010年的測試,使用了97臺COMSTAR專用的存儲設備,其中28臺用來存儲數據庫的重做日誌(Redo Log)。Oracle的定價策略也是軟硬一體,不打折的硬件價格基本等於三年打包折後價。

程序員都知道,Oracle等大型數據庫廠商的小型機不僅“貴得要死”,而且需要等“下單-生產-交付”的漫長流程,還要高薪聘請運維人員,出問題又得付錢請Oracle、IBM、EMC等的高價工程師過來修。想到這個工程師一天的價格可能頂過你兩週,心理想必也會不平衡。

這種價格和服務,看不起也滿足不了互聯網公司。畢竟業務規模和結構時刻在快速變化,很多APP也就紅兩天了……因此,大部分互聯網公司的數據庫都會選擇“租雲服務器+開源分佈式數據庫”的方式自建。

當年的支付寶也不例外,才有了“去IOE”(阿里巴巴首創的概念,去掉IBM的小型機、Oracle數據庫、EMC存儲設備,代之以自己在開源軟件基礎上開發系統)。因而誕生飛天操作系統,和此上的Oceanbase、POLARDB等自研數據庫。

OceanBase使用的同樣是阿里雲的ECS服務器,並且只使用ECS機器自帶的本地硬盤做數據存儲。這是非常通用的硬件條件。

雲化資源讓OceanBase不需要再關注最底層機房、機櫃、佈線這些細節。當然,它的登頂自然離不開阿里雲自身基礎設施的保障,阿里雲自建的獨立機房之間通過高帶寬低延時高效骨幹網絡相連接,即使跨城的機房間網絡傳輸丟包率也很低。同時,雲計算的彈性,讓分佈式數據庫的擴展能力得以充分展示。

ECS搭載阿里雲研發的新一代雲服務器操作系統Aliyun Linux 2,為ECS量身定製。它提供Linux社區的最新功能,也針對阿里雲基礎設施做了深度優化,提高雲上性能和體驗。Aliyun Linux 2 100% 開源,用戶可以自由下載查看、使用。

不過,傳統數據庫之所以有專門硬件,說明場景有特殊需求。一般來說,數據庫需要進行頻繁的讀寫操作,對底層服務器的內存、讀寫能力要求非常高。OceanBase也需要挑選最適合自身的機型。

OceanBase背後的雲服務器:ECS I2

那麼,在這款登頂榜首的數據庫產品背後,是哪款雲服務器在支撐?

據技術團隊透露,本次測試“OceanBase的數據庫服務器使用的是204+3臺型號是ecs.i2.16xlarge阿里雲ECS服務器,其中204臺作為datanode,還有3臺作為root node” 。測試採用的服務器與生產系統完全一樣。

中國自研數據庫登頂全球第一!不服OceanBase跑分阿里雲邀你來戰

隨著雲計算產業逐步成熟,阿里雲的雲服務器也已經針對不同垂直場景呈現深度定製化趨勢。查閱阿里雲官網,雲服務器在線主售實例規格數量超過300種,能覆蓋多種細分業務場景。

OceanBase選擇I2想必與其定位有關。根據官網,I2是一款針對數據庫類場景的存儲增強型雲服務器產品(屬於本地SSD型實例規格族),處理器與內存配比為1:8,採用單 GHz 計算力性價比最優的 Intel Xeon(Skylake) Platinum 8163 處理器,2.5GHz主頻。

同時,其在數據庫極為看重I/O上專門做了優化,配備了高性能(高IOPS、大吞吐、低訪問延遲)NVMe SSD本地盤,適用於OLTP關係型數據庫、NoSQL數據庫(如 Cassandra、MongoDB等)、數據倉庫等場景。

I2產品負責人告訴記者,這款雲服務器還採用了獨享計算架構,即該虛擬機與物理機的計算資源保持一一對應,一經分配,就不會跟其他虛擬機爭搶資源。這能保證上層數據庫性能的穩定。如果是入門級別的雲服務器,則可能會出現超賣,要是某個時刻大家都用得太狠,運行不免會變慢。

可以看出,I2適合一些時延敏感型和IO密集型業務,尤其是電商、互聯網金融、遊戲、直播等需要快速處理訂單和交易、讀寫頻繁的業務場景;在基礎設施越發堅實的今天,數據分析等場景也開始在線處理。

I2在TPC-C測試中的滿分表現

上述場景與本次TPC-C測試要求其實非常契合。根據公開資料,TPC-C測試是關於商品銷售的訂單創建和訂單支付等的基準測試標準,設計原則也儘可能模擬真實業務場景。

它考察的是數據庫在高併發壓力場景下的事務處理能力,最終的性能指標以tpmC和平均到每tpmC的系統成本作為衡量標準。tpmC(transaction per minute)即每分鐘系統處理TPC-C模型中的new order事務的數量。這些事務包括訂單創建、訂單支付、訂單查詢、訂單發貨以及庫存查詢五種。

I2在這次測試中表現如何?

OceanBase技術團隊透露,本次TPC-C測試用了迄今以來最嚴苛的流程來完成:首先使用了10分鐘進行預熱,然後在6088w tpmC穩態保持運行25分鐘並完成一個檢查點,再繼續跑了完整的8小時性能壓測採集階段。

這個過程中,I2服務器完美地完成了任務,展現了極致性能與穩定。

在企業級最高性能的NVMeSSD和阿里雲全鏈路的讀寫性能優化之下,I2提供超高存儲IO能力,實現超低的微秒(us)級別訪問時延,超高的百萬+級IOPS,超大的10+GBps級別吞吐能力,帶來數據庫更快的響應速度和處理能力;

I2基於獨享計算架構+本地存儲設計,I2也在這8小時中交出了性能最大波動不到0.5%,CPU、內存帶寬全滿的穩定性滿分答卷。

OceanBase團隊解釋,TPC-C測試很大的挑戰在於壓測性能曲線要求是絕對平滑,波動幅度不能超過2%。這對傳統數據庫都極難,因此最終結果也讓審計員異常興奮。

中國自研數據庫登頂全球第一!不服OceanBase跑分阿里雲邀你來戰

(8.5小時壓力下的tpmC值實時曲線)

額……性能是很服氣,可是聽起來肯定更貴吧?

對此,I2的產品負責人解釋,阿里雲ECS有多種不同的機型規格,使用哪種機型具體還要看具體業務類型。一般而言,通用型服務器其實能滿足50%-70%的需求,I2是針對性能要求較高的場景,有時客戶反而出於成本考慮希望購置這種機型。

企業需求是靈活多樣的:部分中大型公司對性能要求更高;有的公司只有很小部分業務有高性能需求。如果為了少部分業務購置更高性能通用服務器,反而還會浪費資源。可是如果對症下藥,比如針對數據庫場景重點增強IO,控制成本的同時提高了用戶體驗,反而讓成本收益架構更合理。

此外,在雲計算時代,雲服務器自帶極速交付、彈性付費等優點。面對爆發式流量增長、臨時性項目、嘗試新業務等場景,企業可以按需靈活租用服務器,隨時調整成本投入。


分享到:


相關文章: