微服務架構複雜嗎？

2020-02-14 18:43:53 newer大俠

本文將介紹微服務架構和相關的組件，介紹他們是什麼以及為什麼要使用微服務架構和這些組件。本文側重於簡明地表達微服務架構的全局圖景，因此不會涉及具體如何使用組件等細節。

要理解微服務，首先要先理解不是微服務的那些。通常跟微服務相對的是單體應用，即將所有功能都打包成在一個獨立單元的應用程序。從單體應用到微服務並不是一蹴而就的，這是一個逐漸演變的過程。本文將以一個網上超市應用為例來說明這一過程。

一：最初的需求

當時互聯網還不發達，網上超市還是藍海。只要功能實現了就能隨便賺錢。所以他們的需求很簡單，只需要一個網站掛在公網，用戶能夠在這個網站上瀏覽商品、購買商品；另外還需一個管理後臺，可以管理商品、用戶、以及訂單數據。

我們整理一下功能清單：

§ 網站

§ 用戶註冊、登錄功能

§ 商品展示

§ 下單

§ 管理後臺

§ 用戶管理

§ 商品管理

§ 訂單管理

由於需求簡單，管理後臺出於安全考慮，不和網站做在一起，總體架構圖如下：

§ 開展促銷活動。比如元旦全場打折，春節買二送一，情人節狗糧優惠券等等。

§ 拓展渠道，新增移動端營銷。除了網站外，還需要開發移動端APP，微信小程序等。

§ 精準營銷。利用歷史數據對用戶進行分析，提供個性化服務。

§ ……

這些活動都需要程序開發的支持。

這一階段存在很多不合理的地方：

§ 網站和移動端應用有很多相同業務邏輯的重複代碼。

§ 數據有時候通過數據庫共享，有時候通過接口調用傳輸。接口調用關係雜亂。

§ 單個應用為了給其他應用提供接口，漸漸地越改越大，包含了很多本來就不屬於它的邏輯。應用邊界模糊，功能歸屬混亂。

§ 管理後臺在一開始的設計中保障級別較低。加入數據分析和促銷管理相關功能後出現性能瓶頸，影響了其他應用。

§ 數據庫表結構被多個應用依賴，無法重構和優化。

§ 所有應用都在一個數據庫上操作，數據庫出現性能瓶頸。特別是數據分析跑起來的時候，數據庫性能急劇下降。

§ 開發、測試、部署、維護愈發困難。即使只改動一個小功能，也需要整個應用一起發佈。有時候發佈會不小心帶上了一些未經測試的代碼，或者修改了一個功能後，另一個意想不到的地方出錯了。為了減輕發佈可能產生的問題的影響和線上業務停頓的影響，所有應用都要在凌晨三四點執行發佈。發佈後為了驗證應用正常運行，還得盯到第二天白天的用戶高峰期……

§ 團隊出現推諉扯皮現象。關於一些公用的功能應該建設在哪個應用上的問題常常要爭論很久，最後要麼乾脆各做各的，或者隨便放個地方但是都不維護。

儘管有著諸多問題，但也不能否認這一階段的成果：快速地根據業務變化建設了系統。不過緊迫且繁重的任務容易使人陷入局部、短淺的思維方式，從而做出妥協式的決策。在這種架構中，每個人都只關注在自己的一畝三分地，缺乏全局的、長遠的設計。長此以往，系統建設將會越來越困難，甚至陷入不斷推翻、重建的循環。

三：是時候做出改變了

要做改造，首先你需要有足夠的精力和資源。如果你的需求方（業務人員、項目經理、上司等）很強勢地一心追求需求進度，以致於你無法挪出額外的精力和資源的話，那麼你可能無法做任何事……

在編程的世界中，最重要的便是抽象能力。微服務改造的過程實際上也是個抽象的過程。

用戶服務

§ 商品服務

§ 促銷服務

§ 訂單服務

§ 數據分析服務

各個應用後臺只需從這些服務獲取所需的數據，從而刪去了大量冗餘的代碼，就剩個輕薄的控制層和前端。這一階段的架構如下：

這個階段只是將服務分開了，數據庫依然是共用的，所以一些煙囪式系統的缺點仍然存在：

1. 數據庫成為性能瓶頸，並且有單點故障的風險。

2. 數據管理趨向混亂。即使一開始有良好的模塊化設計，隨著時間推移，總會有一個服務直接從數據庫取另一個服務的數據的現象。

3. 數據庫表結構可能被多個服務依賴，牽一髮而動全身，很難調整。

如果一直保持共用數據庫的模式，則整個架構會越來越僵化，失去了微服務架構的意義。所有持久化層相互隔離，由各個服務自己負責。另外，為了提高系統的實時性，加入了消息隊列機制。架構如下：

完全拆分後各個服務可以採用異構的技術。比如數據分析服務可以使用數據倉庫作為持久化層，以便於高效地做一些統計計算；商品服務和促銷服務訪問頻率比較大，因此加入了緩存機制等。

還有一種抽象出公共邏輯的方法是把這些公共邏輯做成公共的框架庫。這種方法可以減少服務調用的性能損耗。但是這種方法的管理成本非常高昂，很難保證所有應用版本的一致性。

數據庫拆分也有一些問題和挑戰：比如說跨庫級聯的需求，通過服務查詢數據顆粒度的粗細問題等。但是這些問題可以通過合理的設計來解決。總體來說，數據庫拆分是一個利大於弊的。

微服務架構還有一個技術外的好處，它使整個系統的分工更加明確，責任更加清晰，每個人專心負責為其他人提供更好的服務。在單體應用的時代，公共的業務功能經常沒有明確的歸屬。最後要麼各做各的，每個人都重新實現了一遍；要麼是隨機一個人（一般是能力比較強或者比較熱心的人）做到他負責的應用裡面。在後者的情況下，這個人在負責自己應用之外，還要額外負責給別人提供這些公共的功能——而這個功能本來是無人負責的，僅僅因為他能力較強/比較熱心，就莫名地背鍋（這種情況還被美其名曰能者多勞）。結果最後大家都不願意提供公共的功能。長此以往，團隊裡的人漸漸變得各自為政，不再關心全局的架構設計。

從這個角度上看，使用微服務架構同時也需要組織結構做相應的調整。所以說做微服務改造需要管理者的支持。

四：沒有銀彈

§ 微服務架構整個應用分散成多個服務，定位故障點非常困難。

§ 穩定性下降。服務數量變多導致其中一個服務出現故障的概率增大，並且一個服務故障可能導致整個系統掛掉。事實上，在大訪問量的生產場景下，故障總是會出現的。

§ 服務數量非常多，部署、管理的工作量很大。

§ 開發方面：如何保證各個服務在持續開發的情況下仍然保持協同合作。

§ 測試方面：服務拆分後，幾乎所有功能都會涉及多個服務。原本單個程序的測試變為服務間調用的測試。測試變得更加複雜。

五：監控 - 發現故障的徵兆

在高併發分佈式的場景下，故障經常是突然間就雪崩式爆發。所以必須建立完善的監控體系，儘可能發現故障的徵兆。

微服務架構中組件繁多，各個組件所需要監控的指標不同。比如Redis緩存一般監控佔用內存值、網絡流量，數據庫監控連接數、磁盤空間，業務服務監控併發數、響應延遲、錯誤率等。因此如果做一個大而全的監控系統來監控各個組件是不大現實的，而且擴展性會很差。一般的做法是讓各個組件提供報告自己當前狀態的接口（metrics接口），這個接口輸出的數據格式應該是一致的。然後部署一個指標採集器組件，定時從這些接口獲取並保持組件狀態，同時提供查詢服務。最後還需要一個UI，從指標採集器查詢各項指標，繪製監控界面或者根據閾值發出告警。

大部分組件都不需要自己動手開發，網絡上有開源組件。

六：定位問題 - 鏈路跟蹤

在微服務架構下，一個用戶的請求往往涉及多個內部服務調用。為了方便定位問題，需要能夠記錄每個用戶請求時，微服務內部產生了多少服務調用，及其調用關係。這個叫做鏈路跟蹤。

我們用一個Istio文檔裡的鏈路跟蹤例子來看看效果：

圖片來自：https://istio.io/zh/docs/tasks/telemetry/distributed-tracing/zipkin/

從圖中可以看到，這是一個用戶訪問productpage頁面的請求。在請求過程中，productpage服務順序調用了details和reviews服務的接口。而reviews服務在響應過程中又調用了ratings的接口。整個鏈路跟蹤的記錄是一棵樹：
要實現鏈路跟蹤，每次服務調用會在HTTP的HEADERS中記錄至少記錄四項數據：

§ traceId：traceId標識一個用戶請求的調用鏈路。具有相同traceId的調用屬於同一條鏈路。

§ spanId：標識一次服務調用的ID，即鏈路跟蹤的節點ID。

§ parentId：父節點的spanId。

§ requestTime & responseTime：請求時間和響應時間。

另外，還需要調用日誌收集與存儲的組件，以及展示鏈路調用的UI組件。
以上只是一個極簡的說明，關於鏈路跟蹤的理論依據可詳見Google的Dapper。

瞭解了理論基礎後，小明選用了Dapper的一個開源實現Zipkin。然後手指一抖，寫了個HTTP請求的攔截器，在每次HTTP請求時生成這些數據注入到HEADERS，同時異步發送調用日誌到Zipkin的日誌收集器中。這裡額外提一下，HTTP請求的攔截器，可以在微服務的代碼中實現，也可以使用一個網絡代理組件來實現（不過這樣子每個微服務都需要加一層代理）。

鏈路跟蹤只能定位到哪個服務出現問題，不能提供具體的錯誤信息。查找具體的錯誤信息的能力則需要由日誌分析組件來提供。

七：分析問題 - 日誌分析

日誌分析組件應該在微服務興起之前就被廣泛使用了。即使單體應用架構，當訪問數變大、或服務器規模增多時，日誌文件的大小會膨脹到難以用文本編輯器進行訪問，更糟的是它們分散在多臺服務器上面。排查一個問題，需要登錄到各臺服務器去獲取日誌文件，一個一個地查找（而且打開、查找都很慢）想要的日誌信息。

因此，在應用規模變大時，我們需要一個日誌的“搜索引擎”。以便於能準確的找到想要的日誌。另外，數據源一側還需要收集日誌的組件和展示結果的UI組件：

ELK是Elasticsearch、Logstash和Kibana三個組件的縮寫。

§ Elasticsearch：搜索引擎，同時也是日誌的存儲。

§ Logstash：日誌採集器，它接收日誌輸入，對日誌進行一些預處理，然後輸出到Elasticsearch。

§ Kibana：UI組件，通過Elasticsearch的API查找數據並展示給用戶。

最後還有一個小問題是如何將日誌發送到Logstash。一種方案是在日誌輸出的時候直接調用Logstash接口將日誌發送過去。這樣一來又（咦，為啥要用“又”）要修改代碼……於是小明選用了另一種方案：日誌仍然輸出到文件，每個服務裡再部署個Agent掃描日誌文件然後輸出給Logstash。

八：網關 - 權限控制，服務治理

拆分成微服務後，出現大量的服務，大量的接口，使得整個調用關係亂糟糟的。經常在開發過程中，寫著寫著，忽然想不起某個數據應該調用哪個服務。或者寫歪了，調用了不該調用的服務，本來一個只讀的功能結果修改了數據……

為了應對這些情況，微服務的調用需要一個把關的東西，也就是網關。在調用者和被調用者中間加一層網關，每次調用時進行權限校驗。另外，網關也可以作為一個提供服務接口文檔的平臺。

使用網關有一個問題就是要決定在多大粒度上使用：最粗粒度的方案是整個微服務一個網關，微服務外部通過網關訪問微服務，微服務內部則直接調用；最細粒度則是所有調用，不管是微服務內部調用或者來自外部的調用，都必須通過網關。折中的方案是按照業務領域將微服務分成幾個區，區內直接調用，區間通過網關調用。

九：服務註冊與發現 - 動態擴容

前面的組件，都是旨在降低故障發生的可能性。然而故障總是會發生的，所以另一個需要研究的是如何降低故障產生的影響。

最粗暴的（也是最常用的）故障處理策略就是冗餘。一般來說，一個服務都會部署多個實例，這樣一來能夠分擔壓力提高性能，二來即使一個實例掛了其他實例還能響應。

冗餘的一個問題是使用幾個冗餘？這個問題在時間軸上並沒有一個切確的答案。根據服務功能、時間段的不同，需要不同數量的實例。比如在平日裡，可能4個實例已經夠用；而在促銷活動時，流量大增，可能需要40個實例。因此冗餘數量並不是一個固定的值，而是根據需要實時調整的。

一般來說新增實例的操作為：

1. 部署新實例

2. 將新實例註冊到負載均衡或DNS上

操作只有兩步，但如果註冊到負載均衡或DNS的操作為人工操作的話，那事情就不簡單了。想想新增40個實例後，要手工輸入40個IP的感覺……
解決這個問題的方案是服務自動註冊與發現。首先，需要部署一個服務發現服務，它提供所有已註冊服務的地址信息的服務。DNS也算是一種服務發現服務。然後各個應用服務在啟動時自動將自己註冊到服務發現服務上。並且應用服務啟動後會實時（定期）從服務發現服務同步各個應用服務的地址列表到本地。服務發現服務也會定期檢查應用服務的健康狀態，去掉不健康的實例地址。這樣新增實例時只需要部署新實例，實例下線時直接關停服務即可，服務發現會自動檢查服務實例的增減。

服務發現還會跟客戶端負載均衡配合使用。由於應用服務已經同步服務地址列表在本地了，所以訪問微服務時，可以自己決定負載策略。甚至可以在服務註冊時加入一些元數據（服務版本等信息），客戶端負載則根據這些元數據進行流量控制，實現A/B測試、藍綠髮布等功能。

服務發現有很多組件可以選擇，比如說ZooKeeper 、Eureka、Consul、etcd等。

微服務不是架構演變的終點。往細走還有Serverless、FaaS等方向。另一方面也有人在唱合久必分分久必合，重新發現單體架構……

分享到:

閱讀更多 newer大俠 的文章

關鍵字: 美好，一直在身邊市場營銷數據庫

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"