「老中醫」楊繁,專治各種「疑難雜症」

12年騰訊工作經歷,成就了同事口中的"老中醫",專治各種數據庫領域"疑難雜症","望聞問切,藥到病除"。

不僅如此,他還是同事眼裡的"江湖百曉生",通曉各種前沿技術,堪稱數據庫領域"百科全書"。

他就是我們今天大咖訪談錄的主角

“老中醫”楊繁,專治各種“疑難雜症”

逗比的"老中醫"

楊繁:騰訊T4數據庫專家,2006年加入騰訊,從事搜索、文件存儲、大數據、雲計算等多方面的開發工作;2015年開始負責騰訊雲數據庫產品開發,今年是他在騰訊的第12個年頭。

目前,騰訊雲數據庫的性能指標已經超過100萬QPS,對內部承載了QQ、微信、QQ空間等重要產品線,對外則服務於眾多金融、政府機構,其中不乏類似微眾銀行、摩拜這樣的大型互聯網企業。

騰訊雲數據庫產品家族已覆蓋世界上主流的關係型、鍵值型、文檔型、搜索型、時序型、列式數據庫。加上新近推出的CTSDB、CynosDB和即將發佈的智能DBA,目前共有16個子產品和3款數據庫工具,提供全行業解決方案。

數據庫先行,一次"不可能完成的任務"

伴隨規模的擴大、業務的轉型,企業對雲服務的需求也在逐漸變化,更合適的雲服務,對企業的發展起到了重要的作用。在這過程中,不可避免的會發生雲計算的遷移。

"遷移必須數據庫先行,如果數據庫遷移不過來,企業的業務是無法正常運行的。"在專訪中,楊繁講述了曾經是互聯網史上數據庫最大數據量的遷移案例---某電商企業的騰訊雲數據庫遷移之旅,他表示:"在對方眼中,這個大遷移對當時的雲計算提供商來說:是一項不可能完成的任務。"

首先是該家企業數據庫DBA(數據庫管理員)人員非常有限,而與之對應的則是複雜的系統架構,龐大的數據量和高數據吞吐,楊繁介紹,2017年5月份,對方的數據量級已經達到四、五百TB。

對於這樣的遷移,首先擺在面前的問題是,在不影響業務的正常運營的同時,不僅僅要考慮如何遷移數據,並且還要保證滿足版本的發佈要求。遷移面臨的數據量巨大,時間短,任務多,網絡環境複雜等問題,所有這些要求綜合起來,對遷移的技術要求非常苛刻。

專訪中,楊繁描述這一段經歷"不可能完成的遷移"的經歷時表示:

"我們別無選擇,只能成功不能失敗。在遷移之初,我們首先派騰訊雲數據庫的產品架構師精英,從零開始瞭解客戶系統架構和運作模式,根據當前的業務情況,打造遷移模型,在正式遷移前不斷演練。當時我們吃住都在客戶的辦公室,我們的技術實力,服務態度和對方案精益求精的精神,得到用戶的認可"

"在經歷了無數次演練之後,我們通過演練數據,做出一份客戶高度認可的遷移方案。2017年5月份,遷移正式開始。遷移過程中,我們秉承"以用戶價值為依歸"的經營理念,所有的問題解決方案都是圍繞不影響客戶的業務和數據,不管是加班加點,還是協調各種網絡/雲主機的專家,歷時五個月的數據庫遷移,完全0故障0影響,我們較計劃提前一個月完成遷移。"

目前騰訊雲的支撐下,該電商企業的業務規模實現了跨越式的發展,其中,數據庫的遷移功不可沒。同時,騰訊雲數據庫在電商行業積累的經驗,也賦能到其他電商:唯品會,蘑菇街等。騰訊雲數據庫強大的技術實力,一流的產品功能性能,以及優質的服務,成為雲數據庫的標杆。

性能超主流水平3倍,好的產品自己會說話

據行業數據顯示,目前Top100的直播平臺中,已有超過80%的企業選擇騰訊雲。在遊戲直播盛行的時代,直播平臺看中的不僅僅是騰訊遊戲在國內的主導地位,更是騰訊雲背後的技術和性能支撐。

楊繁介紹了騰訊雲的一家典型用戶,2016年初,以視頻和遊戲研發為主的這家用戶,已經有了上雲的想法,並且已經有了目標。彼時,騰訊雲正好研發出了一款新的產品,結合了軟件和硬件的能力,性能指標方面超過友商以及國內主流水平的3倍。

當這家技術團隊負責人瞭解到這些時,決定選擇對騰訊雲的數據庫產品做一次性能測試。

"我們的DBA團隊和研發團隊一起對該用戶的具體業務以及每條SQL的優化進行了全面的跟蹤,從雲主機、網絡、雲數據庫所有產品都進行了優化。兩週時間,測試結果出來,我們的性能大幅超過了其它廠商,基於此,該用戶最終選擇了騰訊雲"。

優異的性能成為用戶選擇的關鍵因素,好的產品自己會說話。

欲速則不達,騰訊雲數據庫研發歷程揭秘

研發是數據庫產品的重要環節,研發過程也對產品的開發週期以及產品性能產生著重要的影響。

"

一個不那麼敏捷的方案、看似傳統的方式,可能對產品研發來說更效率更高、更靠譜。

楊繁透露,目前騰訊雲的自研數據庫從立項到現在,第一期已經基本結束,總共花了3個月的時間。

“老中醫”楊繁,專治各種“疑難雜症”

"老中醫"和他的團隊

從立項開始需要和多個部門協作,為保證團隊協作以及質量控制,我們整體團隊開發之前會把所有的方案全部對齊,討論到每個接口細節問題,定版之後形成文檔,然後交付到每個人,哪個模塊是誰負責的話,這個文檔就必須要寫到接口級,並且要寫到每個參數級別的細節,達到即使有改動,也可以回溯整個鏈條。"

在這種方案指導下,騰訊雲自研數據庫一期的代碼只用了一個月的時間就已完成,留下了近兩個月的時間可以用來調優和debug。而在這個過程中,沒有發生任何一起因為設計不當而導致的問題。

同時,憑藉這樣一個"傳統"的方案,騰訊雲數據庫產品的可靠性、穩定性已經做到業內頂級。

"可靠性方面,我們採用了數據副本的模式,假如一份數據出三份,即使丟了兩份,還有最後一份可用;在穩定性方面,採用了Raft協議保證一致性,並且會進行日誌備份模式,保證數據完全不可丟。

"老中醫"的稱呼

源自同事們的信任和對技術的敬畏

“老中醫”楊繁,專治各種“疑難雜症”

深沉的"老中醫"

談及"老中醫"這個稱號,楊繁表示:"老中醫其實寄託著同事們對我的信任。因為可能我自身工作年限比較久一些,之前在做互聯網業務開發的時候,和業務團隊去定位問題的過程中,幫助他們解決了不少的問題,所以慢慢地就形成了這種印象吧。"

楊繁在項目開發方面具有豐富的經驗積累以及廣泛涉獵。在工作之餘,他非常關注相關硬件領域的最新動向,喜歡鑽研軟硬兼容、提升產品能力的各種新技術。對於新人,他經常告誡他們,技術領域,至少要工作七、八年才能形成一定的業界感知度,這樣,接下來無論是做技術還是管理才會遊刃有餘,所以他不太建議技術新人僅僅工作三年左右就從事管理崗位。

"談及數據庫的發展趨勢,楊繁認為"國外的雲服務,在中國多少會有一些水土不服,我們需要做中國本土特色的雲產品,而中國的數據庫產品需要和其它雲產品聯動起來,只有這樣,用戶的可選擇性、可用性才會更好。"

結語:

目前,各大雲廠商在數據庫領域的投入越來越大,在銀行、保險等金融行業,以及政府部門都在提倡使用去IOE,其中一個最重要的就是雲數據庫。可以預見,未來雲數據庫,特別是開源關係型數據庫產品將更有市場空間,騰訊雲也將會進一步聯合生態內的合作伙伴,打造技術領先,更易用的數據庫產品,讓雲計算真正成為普惠科技,推動全行業的數字化轉型升級。


分享到:


相關文章: