細說消息隊列及消息中間件

訂閱者 必須保持 持續的活動狀態

接收消息

在這種情況下,在訂閱者 未連接時,發佈的消息將在訂閱者 重新連接重新發布,如下圖所示:

細說消息隊列及消息中間件

特性:

  1. 每個消息可以有多個訂閱者;
  2. 客戶端只有訂閱後才能接收到消息;
  3. 持久訂閱和非持久訂閱。

注意:

  • 發佈者和訂閱者有時間依賴:接受者和發佈者只有建立訂閱關係才能收到消息;
  • 持久訂閱:訂閱關係建立後,消息就不會消失,不管訂閱者是否都在線;
  • 非持久訂閱:訂閱者為了接受消息,必須一直在線。 當只有一個訂閱者時約等於點對點模式

5. 消息隊列應用場景

當你需要使用 消息隊列 時,首先需要考慮它的必要性。可以使用消息隊列的場景有很多,最常用的幾種,是做

應用程序松耦合異步處理模式發佈與訂閱最終一致性錯峰流控日誌緩衝 等。反之,如果需要 強一致性,關注業務邏輯的處理結果,則使用 RPC 顯得更為合適。

5.1. 異步處理

非核心 流程 異步化,減少系統 響應時間,提高 吞吐量。例如:短信通知終端狀態推送、App 推送用戶註冊 等。

消息隊列 一般都內置了

高效的通信機制,因此也可以用於單純的消息通訊,比如實現 點對點消息隊列 或者 聊天室 等。

應用案例

網站用戶註冊,註冊成功後會過一會發送郵件確認或者短息。

細說消息隊列及消息中間件

5.2. 系統解耦

  • 系統之間不是 強耦合的消息接受者 可以隨意增加,而不需要修改 消息發送者的代碼消息發送者 的成功不依賴 消息接受者(比如:有些銀行接口不穩定,但調用方並不需要依賴這些接口)。
  • 不強依賴 於非本系統的核心流程,對於 非核心流程,可以放到消息隊列中讓 消息消費者 去按需消費,而 不影響核心主流程

5.3. 最終一致性

最終一致性 不是 消息隊列 的必備特性,但確實可以依靠

消息隊列 來做 最終一致性 的事情。

  • 先寫消息再操作,確保操作完成後再修改消息狀態。定時任務補償機制 實現消息 可靠發送接收、業務操作的可靠執行,要注意 消息重複冪等設計
  • 所有不保證 100% 不丟消息 的消息隊列,理論上無法實現 最終一致性

像 Kafka 一類的設計,在設計層面上就有 丟消息 的可能(比如 定時刷盤,如果掉電就會丟消息)。哪怕只丟千分之一的消息,業務也必須用其他的手段來保證結果正確。

5.4. 廣播

生產者/消費者 模式,只需要關心消息是否 送達隊列,至於誰希望訂閱和需要消費,是 下游 的事情,無疑極大地減少了開發和聯調的工作量。

細說消息隊列及消息中間件

5.5. 流量削峰和流控

上下游系統 處理能力存在差距的時候,利用 消息隊列 做一個通用的 “漏斗”,進行 限流控制。在下游有能力處理的時候,再進行分發。

舉個例子:用戶在支付系統成功結賬後,訂單系統會通過短信系統向用戶推送扣費通知。 短信系統 可能由於 短板效應,速度卡在 網關 上(每秒幾百次請求),跟 前端的併發量 不是一個數量級。 於是,就造成 支付系統短信系統 的處理能力出現差異化。

然而用戶晚上個半分鐘左右收到短信,一般是不會有太大問題的。如果沒有消息隊列,兩個系統之間通過 協商滑動窗口

等複雜的方案也不是說不能實現。但 系統複雜性 指數級增長,勢必在 上游 或者 下游存儲,並且要處理 定時擁塞 等一系列問題。而且每當有 處理能力有差距 的時候,都需要 單獨 開發一套邏輯來維護這套邏輯。

所以,利用中間系統轉儲兩個系統的通信內容,並在下游系統有能力處理這些消息的時候,再處理這些消息,是一套相對較通用的方式。

應用案例

  1. 把消息隊列當成可靠的 消息暫存地,進行一定程度的 消息堆積
  2. 定時進行消息投遞,比如模擬 用戶秒殺
    訪問,進行 系統性能壓測
細說消息隊列及消息中間件

5.6. 日誌處理

將消息隊列用在 日誌處理 中,比如 Kafka 的應用,解決 海量日誌 傳輸和緩衝的問題。

應用案例

把日誌進行集中收集,用於計算 PV、用戶行為分析 等等。

細說消息隊列及消息中間件

5.7. 消息通訊

消息隊列一般都內置了 高效的通信機制,因此也可以用於單純的 消息通訊,比如實現 點對點消息隊列 或者

聊天室 等。

6. 消息隊列的推拉模型

6.1. Push推消息模型

消息生產者 將消息發送給 消息隊列消息隊列 又將消息推給 消息消費者

6.2. Pull拉消息模型

消費者 請求 消息隊列 接受消息,消息生產者消息隊列 中拉該消息。

6.3. 兩種類型的區別

細說消息隊列及消息中間件

7. 消息隊列技術對比

本部分主要介紹四種常用的消息隊列(ActiveMQ / RabbitMQ / RocketMQ / Kafka)的主要特性、優點、缺點。

7.1. ActiveMQ

ActiveMQ 是由 Apache 出品,ActiveMQ 是一個完全支持JMS1.1 和 J2EE 1.4 規範的 JMS Provider 實現。它非常快速,支持 多種語言的客戶端協議,而且可以非常容易的嵌入到企業的應用環境中,並有許多高級功能。

細說消息隊列及消息中間件

(a) 主要特性

  1. 服從JMS規範:JMS 規範提供了良好的標準和保證,包括:同步異步 的消息分發,一次和僅一次的消息分發,消息接收訂閱 等等。遵從 JMS 規範的好處在於,不論使用什麼 JMS 實現提供者,這些基礎特性都是可用的;
  2. 連接靈活性:ActiveMQ 提供了廣泛的 連接協議,支持的協議有:HTTP/S,IP 多播,SSL,TCP,UDP 等等。對眾多協議的支持讓 ActiveMQ 擁有了很好的靈活性;
  3. 支持的協議種類多:OpenWire、STOMP、REST、XMPP、AMQP;
  4. 持久化插件和安全插件:ActiveMQ 提供了 多種持久化
    選擇。而且,ActiveMQ 的安全性也可以完全依據用戶需求進行 自定義鑑權授權
  5. 支持的客戶端語言種類多:除了 Java 之外,還有:C/C++,.NET,Perl,PHP,Python,Ruby;
  6. 代理集群:多個 ActiveMQ 代理 可以組成一個 集群 來提供服務;
  7. 異常簡單的管理:ActiveMQ 是以開發者思維被設計的。所以,它並不需要專門的管理員,因為它提供了簡單又使用的管理特性。有很多中方法可以 監控 ActiveMQ 不同層面的數據,包括使用在 JConsole 或者在 ActiveMQ 的 Web Console 中使用 JMX。通過處理 JMX 的告警消息,通過使用 命令行腳本,甚至可以通過監控各種類型的 日誌

(b) 部署環境

ActiveMQ 可以運行在 Java 語言所支持的平臺之上。使用 ActiveMQ 需要:

  • Java JDK
  • ActiveMQ 安裝包

(c) 優點

  1. 跨平臺 (JAVA 編寫與平臺無關,ActiveMQ 幾乎可以運行在任何的 JVM 上);
  2. 可以用 JDBC:可以將 數據持久化 到數據庫。雖然使用 JDBC 會降低 ActiveMQ 的性能,但是數據庫一直都是開發人員最熟悉的存儲介質;
  3. 支持 JMS 規範:支持 JMS 規範提供的 統一接口;
  4. 支持 自動重連錯誤重試機制
  5. 有安全機制:支持基於 shiro,jaas 等多種 安全配置機制,可以對 Queue/Topic 進行 認證和授權
  6. 監控完善:擁有完善的 監控,包括 Web Console,JMX,Shell 命令行,Jolokia 的 RESTful API;
  7. 界面友善:提供的 Web Console 可以滿足大部分情況,還有很多 第三方的組件 可以使用,比如 hawtio;

(d) 缺點

  1. 社區活躍度不及 RabbitMQ 高;
  2. 根據其他用戶反饋,會出莫名其妙的問題,會 丟失消息
  3. 目前重心放到 activemq 6.0 產品 Apollo,對 5.x 的維護較少;
  4. 不適合用於 上千個隊列 的應用場景;

7.2. RabbitMQ

RabbitMQ 於 2007 年發佈,是一個在 AMQP (高級消息隊列協議)基礎上完成的,可複用的企業消息系統,是當前最主流的消息中間件之一。

細說消息隊列及消息中間件

(a) 主要特性

  1. 可靠性:提供了多種技術可以讓你在 性能可靠性 之間進行 權衡。這些技術包括 持久性機制投遞確認
    發佈者證實高可用性機制
  2. 靈活的路由:消息在到達隊列前是通過 交換機 進行 路由 的。RabbitMQ 為典型的路由邏輯提供了 多種內置交換機 類型。如果你有更復雜的路由需求,可以將這些交換機組合起來使用,你甚至可以實現自己的交換機類型,並且當做 RabbitMQ 的 插件 來使用;
  3. 消息集群:在相同局域網中的多個 RabbitMQ 服務器可以 聚合 在一起,作為一個獨立的邏輯代理來使用;
  4. 隊列高可用:隊列可以在集群中的機器上 進行鏡像,以確保在硬件問題下還保證 消息安全
  5. 支持多種協議:支持 多種消息隊列協議
  6. 支持多種語言:用 Erlang 語言編寫,支持只要是你能想到的 所有編程語言
  7. 管理界面: RabbitMQ 有一個易用的 用戶界面,使得用戶可以 監控管理 消息 Broker 的許多方面;
  8. 跟蹤機制:如果 消息異常,RabbitMQ 提供消息跟蹤機制,使用者可以找出發生了什麼;
  9. 插件機制:提供了許多 插件,來從多方面進行擴展,也可以編寫自己的插件。

(b) 部署環境

RabbitMQ 可以運行在 Erlang 語言所支持的平臺之上,包括 Solaris,BSD,Linux,MacOSX,TRU64,Windows 等。使用 RabbitMQ 需要:

  • ErLang 語言包
  • RabbitMQ 安裝包

(c) 優點

  1. 由於 Erlang 語言的特性,消息隊列性能較好,支持 高併發
  2. 健壯、穩定、易用、跨平臺、支持 多種語言、文檔齊全;
  3. 有消息 確認機制持久化機制,可靠性高;
  4. 高度可定製的 路由
  5. 管理界面 較豐富,在互聯網公司也有較大規模的應用,社區活躍度高。

(d) 缺點

  1. 儘管結合 Erlang 語言本身的併發優勢,性能較好,但是不利於做 二次開發和維護
  2. 實現了 代理架構,意味著消息在發送到客戶端之前可以在 中央節點 上排隊。此特性使得 RabbitMQ 易於使用和部署,但是使得其 運行速度較慢,因為中央節點 增加了延遲消息封裝後 也比較大;
  3. 需要學習 比較複雜接口和協議,學習和維護成本較高。

7.3. RocketMQ

RocketMQ 出自 阿里 的開源產品,用 Java 語言實現,在設計時參考了 Kafka,並做出了自己的一些改進,

消息可靠性上 比 Kafka 更好。RocketMQ 在阿里內部被廣泛應用在 訂單交易充值流計算消息推送日誌流式處理,binglog 分發 等場景。

(a) 主要特性

細說消息隊列及消息中間件

  1. 基於 隊列模型:具有 高性能高可靠高實時分佈式 等特點;
  2. Producer、Consumer、隊列 都支持 分佈式
  3. Producer 向一些隊列輪流發送消息,隊列集合 稱為 Topic。Consumer 如果做 廣播消費,則一個 Consumer 實例消費這個 Topic 對應的 所有隊列;如果做 集群消費,則 多個 Consumer 實例 平均消費 這個 Topic 對應的隊列集合;
  4. 能夠保證 嚴格的消息順序
  5. 提供豐富的 消息拉取模式
  6. 高效的訂閱者 水平擴展能力;
  7. 實時消息訂閱機制
  8. 億級 消息堆積 能力;
  9. 較少的外部依賴。

(b) 部署環境

RocketMQ 可以運行在 Java 語言所支持的平臺之上。使用 RocketMQ 需要:

  • Java JDK
  • 安裝 git、Maven
  • RocketMQ 安裝包

(c) 優點

  1. 單機 支持 1 萬以上 持久化隊列
  2. RocketMQ 的所有消息都是 持久化的,先寫入系統 PAGECACHE,然後 刷盤,可以保證 內存磁盤 都有一份數據,而 訪問 時,直接 從內存讀取
  3. 模型簡單,接口易用(JMS 的接口很多場合並不太實用);
  4. 性能非常好,可以允許 大量堆積消息 在 Broker 中;
  5. 支持 多種消費模式,包括 集群消費廣播消費等;
  6. 各個環節 分佈式擴展設計,支持 主從
    高可用
  7. 開發度較活躍,版本更新很快。

(d) 缺點

  1. 支持的 客戶端語言 不多,目前是 Java 及 C++,其中 C++ 還不成熟;
  2. RocketMQ 社區關注度及成熟度也不及前兩者;
  3. 沒有 Web 管理界面,提供了一個 CLI (命令行界面) 管理工具帶來 查詢管理診斷各種問題
  4. 沒有在 MQ 核心裡實現 JMS 等接口;

7.4. Kafka

Apache Kafka 是一個 分佈式消息發佈訂閱 系統。它最初由 LinkedIn 公司基於獨特的設計實現為一個 分佈式的日誌提交系統 (a distributed commit log),之後成為 Apache 項目的一部分。Kafka 性能高效

可擴展良好 並且 可持久化。它的 分區特性可複製可容錯 都是其不錯的特性。

細說消息隊列及消息中間件

(a) 主要特性

  1. 快速持久化:可以在 O(1) 的系統開銷下進行 消息持久化
  2. 高吞吐:在一臺普通的服務器上既可以達到 10W/s 的 吞吐速率
  3. 完全的分佈式系統:Broker、Producer 和 Consumer 都原生自動支持 分佈式,自動實現 負載均衡
  4. 支持 同步異步 複製兩種 高可用機制
  5. 支持 數據批量發送拉取
  6. 零拷貝技術(zero-copy):減少 IO 操作步驟,提高 系統吞吐量
  7. 數據遷移擴容 對用戶透明;
  8. 無需停機 即可擴展機器;
  9. 其他特性:豐富的 消息拉取模型、高效 訂閱者水平擴展、實時的 消息訂閱、億級的 消息堆積能力、定期刪除機制;

(b) 部署環境

使用 Kafka 需要:

  • Java JDK
  • Kafka 安裝包

(c) 優點

  1. 客戶端語言豐富:支持 Java、.Net、PHP、Ruby、Python、Go 等多種語言;
  2. 高性能:單機寫入 TPS 約在 100 萬條/秒,消息大小 10 個字節;
  3. 提供 完全分佈式架構,並有 replica 機制,擁有較高的 可用性可靠性,理論上支持 消息無限堆積
  4. 支持批量操作;
  5. 消費者 採用 Pull 方式獲取消息。消息有序通過控制 能夠保證所有消息被消費且僅被消費 一次
  6. 有優秀的第三方 Kafka Web 管理界面 Kafka-Manager;
  7. 日誌領域 比較成熟,被多家公司和多個開源項目使用。

(d) 缺點

  1. Kafka 單機超過 64 個 隊列/分區 時,Load 時會發生明顯的飆高現象。隊列 越多,負載 越高,發送消息 響應時間變長
  2. 使用 短輪詢方式實時性 取決於 輪詢間隔時間
  3. 消費失敗 不支持重試
  4. 支持 消息順序,但是 一臺代理宕機 後,就會產生 消息亂序
  5. 社區更新較慢。

7.5. 幾種消息隊列對比

這裡列舉了上述四種消息隊列的差異對比:

細說消息隊列及消息中間件

Kafka 在於 分佈式架構,RabbitMQ 基於 AMQP 協議 來實現,RocketMQ 的思路來源於 Kafka,改成了 主從結構,在 事務性可靠性 方面做了優化。廣泛來說,電商金融

等對 事務一致性 要求很高的,可以考慮 RabbitMQ 和 RocketMQ,對 性能要求高 的可考慮 Kafka。

小結

本文介紹了消息隊列的特點,消息隊列的 傳遞服務模型,消息的 傳輸方式,消息的 推拉模式。然後介紹了 ActiveMQ,RabbitMQ,RocketMQ 和 Kafka 幾種常見的消息隊列,闡述了 各種消息隊列主要特點優缺點。通過本文,對於消息隊列及相關技術選型,相信你會有了更深入的理解和認識。更多細節和原理性的東西,還需在實踐中見真知!


分享到:


相關文章: