分布式數據層中間件詳解：如何實現分庫分表+動態數據源+讀寫分離

2018-10-13 12:05:20 優知學院

分佈式數據層中間件：

1.簡介：

分佈式數據訪問層中間件，旨在為供一個通用數據訪問層服務，支持MySQL動態數據源、讀寫分離、分佈式唯一主鍵生成器、分庫分表、動態化配置等功能，並且支持從客戶端角度對數據源的各方面（比如連接池、SQL等）進行監控，後續考慮支持NoSQL、Cache等多種數據源。

2.功能特性

動態數據源
讀寫分離
分佈式唯一主鍵生成器
分庫分表
連接池及SQL監控
動態化配置

常見的數據層中間件：

1.TDDL

淘寶根據自己的業務特點開發了TDDL框架，主要解決了分庫分表對應用的透明化以及異構數據庫之間的數據複製，它是一個基於集中式配置的JDBC datasource實現。

特點

實現動態數據源、讀寫分離、分庫分表。

缺點

分庫分表功能還未開源，當前公佈文檔較少，並且需要依賴diamond（淘寶內部使用的一個管理持久配置的系統）

2.Atlas

Qihoo 360開發維護的一個基於MySQL協議的數據中間層項目。它實現了MySQL的客戶端與服務端協議，作為服務端與應用程序通信，同時作為客戶端與MySQL通信

特點：

實現讀寫分離、單庫分表

缺點：

不支持分庫分表

3.MTDDL（Meituan Distributed Data Layer）

美團點評分佈式數據訪問層中間件

特點

實現動態數據源、讀寫分離、分庫分表，與tddl類似。

下面我以MTDDL為例，也可以參考淘寶tddl，完整詳解分佈式數據層中間件的架構設計。

分佈式數據層中間件架構設計

下圖是一次完整的DAO層insert方法調用時序圖，簡單闡述了MTDDL的整個邏輯架構。

其中包含了：

1.分佈式唯一主鍵的獲取

2.動態數據源的路由

3.以及SQL埋點監控等過程：

分佈式數據層中間件：具體實現

1.動態數據源及讀寫分離

在Spring JDBC AbstractRoutingDataSource的基礎上擴展出MultipleDataSource動態數據源類，通過動態數據源註解及AOP實現。

2.動態數據源

MultipleDataSource動態數據源類，繼承於Spring JDBC AbstractRoutingDataSource抽象類，實現了determineCurrentLookupKey方法，通過setDataSourceKey方法來動態調整dataSourceKey，進而達到動態調整數據源的功能。其類圖如下：

3.動態數據源AOP

ShardMultipleDataSourceAspect動態數據源切面類，針對DAO方法進行功能增強，通過掃描DataSource動態數據源註解來獲取相應的dataSourceKey，從而指定具體的數據源。具體流程圖如下：

4.配置和使用方式舉例

/**
 * 參考配置
 */

 /** 數據源配置 */
 
  
 /** 寫數據源 */
 
 /** 讀數據源 */
 
 
  

/**
 * DAO使用動態數據源註解
 */
public interface WmProductSkuDao {
 /** 增刪改走寫數據源 */
 @DataSource("dbProductWrite")
 public void insert(WmProductSku sku);
 /** 查詢走讀數據源 */
 @DataSource("dbProductRead")
 public void getById(long sku_id);
}

5.分佈式唯一主鍵生成器

眾所周知，分庫分表首先要解決的就是分佈式唯一主鍵的問題，業界也有很多相關方案：

序號實現方案優點缺點UUID本地生成，不需要RPC，低延時；

擴展性好，基本沒有性能上限無法保證趨勢遞增；

UUID過長128位，不易存儲，往往用字符串表示2Snowflake或MongoDB ObjectId分佈式生成，無單點；

趨勢遞增，生成效率快沒有全局時鐘的情況下，只能保證趨勢遞增；

當通過NTP進行時鐘同步時可能會出現重複ID；

數據間隙較大3proxy服務+數據庫分段獲取ID分佈式生成，段用完後需要去DB獲取，同server有序可能產生數據空洞，即有些ID沒有分配就被跳過了，主要原因是在服務重啟的時候發生；

無法保證有序，需要未來解決，可能會通過其他接口方案實現

綜上，方案3的缺點可以通過一些手段避免，但其他方案的缺點不好處理，所以選擇第3種方案：分佈式ID生成系統Leaf。

6.分佈式ID生成系統Leaf

分佈式ID生成系統Leaf，其實是一種基於DB的Ticket服務，通過一張通用的Ticket表來實現分佈式ID的持久化，執行update更新語句來獲取一批Ticket，這些獲取到的Ticket會在內存中進行分配，分配完之後再從DB獲取下一批Ticket。

整體架構圖如下：

每個業務tag對應一條DB記錄，DB MaxID字段記錄當前該Tag已分配出去的最大ID值。

IDGenerator服務啟動之初向DB申請一個號段，傳入號段長度如 genStep = 10000，DB事務置 MaxID = MaxID + genStep，DB設置成功代表號段分配成功。每次IDGenerator號段分配都通過原子加的方式，待分配完畢後重新申請新號段。

7.唯一主鍵生成算法擴展

MTDDL不僅集成了Leaf算法，還支持唯一主鍵算法的擴展，通過新增唯一主鍵生成策略類實現IDGenStrategy接口即可。IDGenStrategy接口包含兩個方法：getIDGenType用來指定唯一主鍵生成策略，getId用來實現具體的唯一主鍵生成算法。其類圖如下：

8.分庫分表

在動態數據源AOP的基礎上擴展出分庫分表AOP，通過分庫分表ShardHandle類實現分庫分表數據源路由及分表計算。ShardHandle關聯了分庫分表上下文ShardContext類，而ShardContext封裝了所有的分庫分表算法。其類圖如下：

分庫分表流程圖如下：

9.分庫分表取模算法

分庫分表目前默認使用的是取模算法，分表算法為 (#shard_key % (group_shard_num * table_shard_num))，分庫算法為 (#shard_key % (group_shard_num * table_shard_num)) / table_shard_num，其中group_shard_num為分庫個數，table_shard_num為每個庫的分表個數。

例如把一張大表分成100張小表然後散到2個庫，則0-49落在第一個庫、50-99落在第二個庫。核心實現如下：

public class ModStrategyHandle implements ShardStrategy {
 @Override
 public String getShardType() {
 return "mod";
 }
 @Override
 public DataTableName handle(String tableName, String dataSourceKey, int tableShardNum, 
 int dbShardNum, Object shardValue) {
 /** 計算散到表的值 */
 long shard_value = Long.valueOf(shardValue.toString());
 long tablePosition = shard_value % tableShardNum;
 long dbPosition = tablePosition / (tableShardNum / dbShardNum);
 String finalTableName = new StringBuilder().append(tableName).append("_").append(tablePosition).toString();
 String finalDataSourceKey = new StringBuilder().append(dataSourceKey).append(dbPosition).toString();
 return new DataTableName(finalTableName, finalDataSourceKey);
 }
}

10.分庫分表算法擴展

MTDDL不僅支持分庫分表取模算法，還支持分庫分表算法的擴展，通過新增分庫分表策略類實現ShardStrategy接口即可。ShardStrategy接口包含兩個方法：getShardType用來指定分庫分表策略，handle用來實現具體的數據源及分表計算邏輯。其類圖如下：

11.全註解方式接入

為了儘可能地方便業務方接入，MTDDL採用全註解方式使用分庫分表功能，通過ShardInfo、ShardOn、IDGen三個註解實現。

ShardInfo註解用來指定具體的分庫分表配置：包括分表名前綴tableName、分表數量tableShardNum、分庫數量dbShardNum、分庫分表策略shardType、唯一鍵生成策略idGenType、唯一鍵業務方標識idGenKey；ShardOn註解用來指定分庫分表字段；IDGen註解用來指定唯一鍵字段。具體類圖如下：

12.配置和使用方式舉例

// 動態數據源
@DataSource("dbProductSku")
// tableName：分表名前綴，tableShardNum：分表數量，dbShardNum：分庫數量，shardType：分庫分表策略，idGenType：唯一鍵生成策略，idGenKey：唯一鍵業務方標識 

@ShardInfo(tableName="wm_food", tableShardNum=100, dbShardNum=1, shardType="mod", idGenType=IDGenType.LEAF, idGenKey=LeafKey.SKU) 
@Component
public interface WmProductSkuShardDao {
 // @ShardOn("wm_poi_id") 將該註解修飾的對象的wm_poi_id字段作為shardValue
 // @IDGen("id") 指定要設置唯一鍵的字段
 public void insert(@ShardOn("wm_poi_id") @IDGen("id") WmProductSku sku);
 // @ShardOn 將該註解修飾的參數作為shardValue
 public List getSkusByWmPoiId(@ShardOn long wm_poi_id);
}

連接池及SQL監控

DB連接池使用不合理容易引發很多問題，如連接池最大連接數設置過小導致線程獲取不到連接、獲取連接等待時間設置過大導致很多線程掛起、空閒連接回收器運行週期過長導致空閒連接回收不及時等等，如果缺乏有效準確的監控，會造成無法快速定位問題以及追溯歷史。

連接池監控

實現方案

結合Spring完美適配c3p0、dbcp1、dbcp2、mtthrift等多種方案，自動發現新加入到Spring容器中的數據源進行監控，通過美團點評統一監控組件JMonitor上報監控數據。整體架構圖如下：

連接數量監控

監控連接池active、idle、total連接數量，Counter格式：（連接池類型.數據源.active/idle/total_connection），效果圖如下：

獲取連接時間監控

監控獲取空閒連接時間，Counter格式：（ds.getConnection.數據源.time），效果圖如下：

更多架構師進階：資料獲取方式

關注+轉發後，私信關鍵詞【架構】即可獲取！

重要的事情說三遍，轉發、轉發、轉發後再發私信，才可以拿到哦！

分享到:

閱讀更多 優知學院 的文章

關鍵字: 數據源 SQL NoSQL

阿里P8透露：JVM+高併發多線程+算法+微服務+中間件+Spring面試題

【開源資訊】kisso 3.7.6 發佈，SSO 中間件

三月最新螞蟻團隊技術4面：線程池+索引+分佈式鎖+中間件+項目等

春招Java面試清單來了！Spring+JVM+微服務+算法+中間件+Redis等

解Bug之路-中間件"SQL重複執行"

koa原理淺析

01.07 Flink 實時計算—SQL 創建 Kafka 數據源

Flink 1.9—SQL 創建 Kafka 數據源

12.23 十年一線架構師帶你學架構：Netty+中間件+容器+虛擬機+併發編程

12.03 數據庫面試4連問：分庫分表，中間件，優缺點，如何拆分？

阿里最新MySQL面試題——MVCC+主從同步+分庫+擴容+全局ID......

java程序員京東T3崗面試回顧：多線程+數據庫+中間件+JVM+spring

數據庫之架構：主備+分庫？主從+讀寫分離？

基於 Cookie 的 SSO 中間件 kisso

02.26 最新BAT資深Java面經合集：CMS+紅黑樹+線程狀態+事務隔離+中間件

菜鳥網絡三面面經(java開發崗）:Spring boot+JVM+線程池+中間件

最新天貓面試題（含總結）：線程池+並發編程+分布式設計+中間件

百度高級java工程師面試實拍59題：高並發+中間件+分布式架構！

django-中間件

Django框架第十四講-管理靜態文件、中間件

03.18 spring-mybatis.xml配置

網際網路與大數據：淺談大數據與雲計算，大數據逐步「雲」化

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"