為啥 TiFlash 又變快了？科技頭條網

2020-04-23 10:23:04 PingCAP

TiFlash 這個項目的核心思路與和 TiDB 一樣：持續聽取用戶反饋、持續改進、持續優化、高速迭代。最近幾周陸續有數十家用戶已經率先體驗了 TiFlash，測試的過程中很多同學注意到一個現象，

短短几周時間，每次 TiFlash 的版本更新都會帶來新的性能的改進，速度越來越快，也會問到 TiFlash 越來越快的原理，所以就有了這篇深度解析。

TiFlash 加速之謎

TiFlash 誠然本質是依靠列存加速，但它也藉助了 ClickHouse 計算層的優異實現，因此它也不僅僅是列存。TiFlash 與 TiKV 一樣，擁有協處理機制。簡單來說，協處理器就是替 TiDB 分擔計算的機制。下面我們看下這個例子：

<code>SELECT COUNT(*) FROM LINEORDER;/<code>

看這樣一個簡單的 count 計算的執行計劃，其中 operator info 欄目中 count(1) 的被標記為 cop[tiflash]，這表示 TiFlash 將會執行 Hash 聚合計算 count(1)，而實際需要返回給 TiDB 的數據，僅僅是聚合完之後的結果，在大多數場景下，返回的數據將會非常少。這種協處理器機制，將會由各個 TiFlash 按照 Region（數據分片）為單位分佈式執行。由於 TiFlash 配備了優異的計算模塊，因此這部分下推優化是 TiFlash 加速的關鍵因素之一。

這裡就有一個關鍵因素：並不是所有計算都可以完全下推到 TiFlash 進行加速。

哪些計算無法加速？

如果有函數在 TiFlash 沒有實現，那麼它將阻礙計算加速。

讓我們看下這樣一個查詢：

<code>SELECT COUNT(*) FROM LINEORDER WHERE DATE_FORMAT(LO_ORDERDATE, “%Y”) >= ‘1998’;/<code>

上面的執行計劃中，TiFlash 只承擔 TableFullScan 也就是掃表部分，而 count(1) 卻並沒有在 TiFlash 中執行。這是為何？其實原因也很簡單：因為暫時 date_format 函數在 TiFlash 中並沒有實現，因此從謂詞過濾以及所有之後的計算都將無法加速。這也許會帶來幾倍甚至十幾倍的速度差距。所以遇到這樣的情況該怎麼辦？你可以很簡單改寫為：

<code>SELECT COUNT(*) FROM LINEORDER WHERE LO_ORDERDATE >= ‘1998-01-01’;/<code>

改完這個查詢從將近 5 分鐘加速到 1.61 秒。

不過這並不是我們在這裡希望你默默忍受的。我們希望你告訴聯繫我們，告訴我們這裡下推不知道為什麼不工作了，我們會幫你分析，如果有缺漏的下推，我們會迅速補上。

Super Batch 優化

有用戶反映，當 Region 數量非常多的時候，TiFlash 的加速會放緩。這是由於當 Region 過多時，TiDB 會產生數量大量的 Region 讀取請求，而造成調度延遲放大。這個效果有些類似 Hadoop 上小文件過多而造成的性能影響。我們之前給出的建議是，打開 Region Merge，並在可能的情況下將 Region 大小調至 192M 而非默認的 96M。但就算這樣，仍然可能有超大表包含數千甚至上萬 Region 數讓性能下降。

對於這樣的問題，近期我們推出了 Super Batch 優化，當開啟優化時，TiDB 將會把所有需要發送到同一個 TiFlash 的請求合併，而 TiFlash 則會在內部自行進行 Raft 相關的讀取容錯。

通過這樣的方式，TiFlash 不再對 Region 大小敏感。如下是 ontime 數據集的測試對比。

如上測試結果可以看出，多數查詢有接近一倍的提速，而這只是在較小數據量下（10 億規模以內）的結果，如果數據量進一步增加，加速效果將更為顯著。

JOIN 加速

有一些測試的朋友告訴我們，他的分析計算是星型模型，有不少 JOIN，執行起來似乎沒有變多快。是的，以協處理器的模型，對 JOIN 類計算並不能很好加速，因為 JOIN 無法在這個框架下分擔計算，進而都必須由 TiDB Server 獨立承擔。由於 TiDB Server 計算單元目前並不是分佈式設計，因此只能由單機慢慢算了。

那是否這樣的場景就無法優化了呢？

只要有足夠多的的用戶呼聲，我們就會開動腦筋 :)

經過一番努力，現在 TiFlash 實現了針對星型模型 JOIN 的優化方案：類 Broadcast JOIN。

通過將小表 Build Hash 動作在 TiFlash 中實現，我們得以將整個 JOIN 操作下推並分佈式化，這個優化不止讓 JOIN 本身得以在 TiFlash 中分佈式計算，而且也讓後續操作例如聚合等，都可以完整下推到 TiFlash。

而這個優化的加速效果也相當明顯。我們針對標準的 Star Schema Benchmark 進行了測試，結果如下。

總共 13 條 SQL，大家可以在這裡找到。大部分查詢都有明顯加速，其中 6 個甚至有數量級（最多 44 倍）的加速。

相信在完整的 MPP 實現之前，這樣的設計也可以滿足很多用戶的需求。而有些場景用不上這個優化，比如大量的大表 JOIN，則可以直接用 TiSpark。

歡迎體驗

TiDB 4.0 可以使用全新的 TiUP 進行部署。大家可以使用兩條命令單機部署體驗或者參考官網文檔部署集群。

<code>curl --proto '=https' --tlsv1.2 -sSf https://tiup-mirrors.pingcap.com/install.sh | sh 
tiup playgroud/<code>

注：部分上述優化還未包含在 4.0 RC，請與我們聯繫參與體驗。另，TiFlash 部署暫時只支持 Linux 環境。

分享到:

閱讀更多 PingCAP 的文章

關鍵字: Hadoop 分佈式計算設計

為啥 TiFlash 又變快了？

TiFlash 加速之謎

哪些計算無法加速？

Super Batch 優化

JOIN 加速

更多溝通，更多加速

歡迎體驗

相關文章:

為啥 TiFlash 又變快了？

TiFlash 加速之謎

哪些計算無法加速？

Super Batch 優化

JOIN 加速

更多溝通，更多加速

歡迎體驗

相關文章:

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

為什麼馬鈴薯不宜過早過遲播種？

疫情愈發嚴重，原油為何反而大漲？

生菜球很好吃，怎麼種植才能高產呢？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？ ？

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

書友們展示一下自我感覺發揮較好的作品，一起學習？

王者榮耀的法師誰最好用？

分手後，你會攻擊你的前任嗎？

為什麼很多老師也考公務員或者事業編？老師有寒暑假，不香嗎？

《火影忍者》大蛇丸身為佐助的老師，為什麼會被佐助幹掉？

《火影忍者》：為什麼不穢土轉生“止水”，可以無限使用別天神？

佐助的輪迴眼和斑的輪迴眼有什麼不同嗎？

火影忍者中為什麼只有鳴人的影分身有自己的意識？

大家在欠大筆錢的時候都是怎麼賺錢還錢的啊？

如果幼兒園下個月開學，你們會不會，放不放心送孩子上幼兒園呢？

下半年上小學的孩子們，幼兒園開學你們還去不，為什麼？

幼兒園大班下學期請假兩個月可以嗎？會對孩子教育有影響嗎？

卡卡西的須佐能乎跟佐助、鼬、斑的對比，誰的更強？

現在大一，去年高考分數超一本線60分但報了一個很普通的雙非一本，現在真的很討厭那所大學，有必要復讀嗎

男人很難嗎？

人到中年時離婚，男、女誰更吃虧？

買房辦不下貸款找律師交了律師費，後來想退房律師還收費嗎？要注意什麼？

對於一個家庭來說，是男人不容易，還是女人不容易？

為什麼貌似那麼多大齡剩男不著急啊？一直等到啥時候啊？

逾期一天上徵信了，合法嗎？非惡意，第二天就還進去了？

孩子注意力不集中，家長忍不住發火怎麼辦？

孩子不願學習怎麼辦？

怎樣的一句話能讓女生瞬間失望？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？