kubernetes 的Health Check策略詳解

2018-10-12 18:14:32 崔格拉斯

Health Check

健康檢查，直白點說就是防微杜漸，k8s是一個編排引擎我們通過k8s部署容器集群，如果說集群容器沒有健康檢查這個過程，我們無法預知我們生產環境會不會部署上錯誤的容器導致服務崩潰。好在k8s 幫我們考慮到了這個問題，健康檢查是k8s重要特性之一，默認有健康檢查，還可以主動設置一些健康檢查。

接下來我們一步步深入瞭解下k8s的健康檢查。

1. 默認的健康檢查

dockerfile製作鏡像的時候，我們CMD,ENTRYPOINT會指定運行命令，容器完成指令之後退出時返回碼非零，則判定發生故障，然後根據 restartPolicy 策略重啟容器。默認的重啟策略是Always 。

healthcheck.yml

apiVersion: v1
kind: Pod
metadata:
 labels:
 test: healthcheck
 name: healthcheck
spec:
 restartPolicy: OnFailure
 containers:
 - name: healthcheck
 image: busybox
 args:
 - /bin/sh
 - -c
 - sleep 10; exit 1

參數解析

restartPolicy: OnFailure 重啟的策略是失敗便重啟

args 是容器啟動後運行的命令

資源管理

創建資源

kubectl apply -f healthy.yml

查看pod狀態

kubectl get pod healthcheck

可以發現RESTARTS已經重啟多次。

優缺點

優點：可以通過restartPolicy 的策略，解決一下重啟就能解決的問題

缺點：必須等到進程退出後的返回值是非零才會觸發重啟策略，不能直接監測容器是否是健康

2. liveness 探測的健康檢查

liveness 的功能就是我們可以自己定義判斷容器健康的條件，然後去監測容器是否滿足健康條件，不健康執行重啟自愈。

liveness.yml

apiVersion: v1
kind: Pod
metadata:
 labels:
 test: liveness
 name: liveness
spec:
 restartPolicy: OnFailure
 containers:
 - name: liveness
 image: busybox
 args:
 - /bin/sh
 - -c
 - touch /tmp/healthy; sleep 30; rm -rf /tmp/healthy; sleep 600
 livenessProbe:
 exec: 

 command:
 - cat
 - /tmp/healthy
 initialDelaySeconds: 10
 periodSeconds: 5

參數解析

livenessProbe 定義判斷容器健康的條件

exec 交互輸入界面

command 命令行命令

initialDelaySeconds 設置容器啟動後多久執行liveness

periodSeconds 指定每隔多久執行一次liveness

如果三次liveness 探測都失敗了，容器就會重啟

資源管理

kubectl apply -f liveness.yml

kubectl get pod liveness

3. readiness 探測的健康檢查

判斷容器何時可以進入service 負載均衡池中，例如在滾動更新過程中，判斷更新的容器是否滿足條件能夠完成業務，不符合的暫停更新，保證有足夠多的業務容器能正常工作。

readiness.yml

apiVersion: v1
kind: Pod
metadata:
 labels:
 test: readiness
 name: readiness
spec:
 restartPolicy: OnFailure
 containers:
 - name: readiness
 image: busybox
 args:
 - /bin/sh
 - -c
 - touch /tmp/healthy; sleep 30; rm -rf /tmp/healthy; sleep 600
 readinessProbe:
 exec:
 command:
 - cat
 - /tmp/healthy
 initialDelaySeconds: 10
 periodSeconds: 5

readinessProbe 定義判斷容器健康的條件

這裡會經歷三個過程：

過程一：剛被創建時，pod不可用

過程二：15秒後第一次探測成功，pod設置可用

過程三：30秒後監測文件被刪除，連續三次的探測失敗之後，pod設置不可用

資源管理

kubectl apply -f readiness.yml

kubectl get pod readiness

4. Scale up中的運用Health Check

scaleupcheck.yml

apiVersion: apps/v1beta1
kind: Deployment 

metadata:
 name: web
spec:
 replicas: 3
 template:
 metadata:
 labels:
 run: web
 spec:
 containers:
 - name: web
 image: httpd
 ports:
 - containerPort: 80
 readinessProbe:
 httpGet:
 scheme: HTTP
 port: 80
 initialDelaySeconds: 10
 periodSeconds: 5
---
apiVersion: v1
kind: Service
metadata:
 name: web-svc
spec:
 selector:
 run: web
 ports:
 - protocol: TCP
 port: 8080
 targetPort: 80

參數說明

readinessProbe 定義判斷容器健康的條件

httpGet 一種探測方式，需要返回的代碼在200~400之間

scheme 指定協議，支持http和https

port 指定端口

path 指定路徑

由yml文件可知，我們設置pod容器端口80和服務端口8080綁定，實際監測的是容器的端口

資源管理

kubectl apply -f scaleupcheck.yml

kubectl get deployment

kubectl get pod web -o wide

kubectl get service

5. 滾動更新中運用Healthy Check

解決了副本正常運行需要準備時間，配置錯誤副本無法完成準備工作。

說白了就是更新的時候，默認的Healthy Check認為副本已經準備好了，逐步用新的副本替換舊的副本，直至完成所有的更新。配置錯誤的副本替換了舊副本這樣會導致生產環境中服務無法正常訪問。

rollingupdatecheckv1.yml

apiVersion: apps/v1beta1
kind: Deployment
metadata:
 name: app
spec:
 replicas: 10
 template:
 metadata:
 labels:
 run: app
 spec:
 containers:
 - name: app
 image: busybox
 args:
 - /bin/sh
 - -c
 - touch /tmp/healthy; sleep 3000
 readinessProbe:
 exec:
 command:
 - cat
 - /tmp/healthy
 initialDelaySeconds: 10
 periodSeconds: 5

rollingupdatecheckv2.yml

apiVersion: apps/v1beta1
kind: Deployment
metadata:
 name: app
spec:
 replicas: 10
 template:
 metadata:
 labels:
 run: app
 spec:
 containers:
 - name: app
 image: busybox
 args:
 - /bin/sh
 - -c
 - sleep 3000
 readinessProbe:
 exec:
 command:
 - cat
 - /tmp/healthy
 initialDelaySeconds: 10
 periodSeconds: 5

資源管理

kubectl apply -f rollingupdatecheckv1.yml --record

等待幾分鐘，待資源創建成功後，我們執行更新

kubectl apply -f rollingupdatecheckv2.yml --record

我們查看資源會發現

kubectl get deployment app

DESIRED 期望狀態是10個READY的副本

CURRENT 表示當前的副本總數是13

UP-TO-DATE 已完成的更新數是5個

AVAILABLE 表示當前處於READY狀態的副本數是8個

為什麼會這樣呢？13個副本是怎麼產生的？為什麼更新了5個副本，舊副本還要8個？

滾動更新時 maxSurge和 maxUnavailable 負責副本數替換

maxSurge

控制副本數的上限

roundUp向上取整

目標副本是10的話，默認情況下，maxSurge=roundUp(10+10*25%)=13

maxUnavailable

控制不可用副本數的上限

roundDown向下取整

目標副本是10的話，默認情況下，10 - roundDown(10*25)=8

所以滾動升級的過程是

過程一：創建三個新副本，副本總是達到13

過程二：銷燬兩個舊副本，可用的舊副本剩下8

過程三：創建兩個新副本，總副本數為13，舊副本為8，新副本為5

過程四： readiness 探測成功之後，繼續替換副本，失敗便停止

過程五：重複上述過程，直至所有舊副本被新副本替換

我們測試過程中，v2版本readiness是無法監測通過的，所有副本數保持13個，5個新副本，8個可以使用的舊副本。8箇舊副本將繼續提供服務，確保生產環境的穩定。

分享到:

閱讀更多 崔格拉斯 的文章

關鍵字: 副本過程技術

Kubernetes 調度和資源管理

如何輕鬆學習 Kubernetes？

kubernetes 基礎概念

《蹲坑學kubernetes》之九：部署Master節點

Kubernetes 網絡模型來龍去脈

Kubernetes 入門

c++中的double check

圖文詳解 Kubernetes

Kubernetes CRD

Check Point防火牆的提權漏洞

Kubernetes 集群安全機制詳解

前端好庫：自動幫你debug的測試庫 fast-check

Kubernetes 零宕機滾動更新

Kubernetes 存儲架構及插件使用

為什麼 Kubernetes 是微服務發展的必然產物？

12.24 Kubernetes 幾種存儲方式性能對比

揭開 Kubernetes 的神祕面紗

Kubernetes RBAC角色權限控制

11.24 Kubernetes 高可用多master集群搭建

Kubernetes 持久化安裝 Prometheus

Kubernetes kubectl 命令自動補全

Kubernetes 滾動更新及回滾

為什麼你不必害怕 Kubernetes

Kubernetes 包管理神器 helm

Kubernetes 佈署wekan

Kubernets PV PVC詳解

對 Kubernetes 應用進行自定義指標擴縮容

鵬哥的Kubernetes學習筆記：Kubernetes 基本感念

Oracle數據遷移--如何確認是否遷移成功？需要查詢這些內容

淺談 Kubernetes 在生產環境中架構

Kubernetes 是什麼？為什麼Kubernetes也稱為K8S？

Kubernetes 重要概念

Vue表單校驗插件Vuerify使用詳細教程及示例

Vuerify表單校驗插件使用詳細教程

Kubernetes 多集群管理平臺（Wayne）

Kubernetes 與容器技術學習方法

01.23 你（多半）不需要 Kubernetes

阿里P7也很無奈，Kubernetes+Docker系統的級聯停機故障教訓

何時該用無服務器，何時該用 Kubernetes？

Kubernetes-項目中pod調度使用法則

教程｜如何使用 Kubernetes 輕鬆部署深度學習模型

Kubernetes 集羣自動化部署腳本

kubernetes 從入門到棄坑-3

kubernetes 從入門到棄坑-2

kubernetes 從入門到棄坑-1

09.20 Kubernetes 下日誌採集、存儲與處理技術實踐

09.14 Kali安全-Unix/Linux提權漏洞快速檢測工具unix-privesc-check

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"

kubernetes 的Health Check策略詳解

Health Check

1. 默認的健康檢查

2. liveness 探測的健康檢查

3. readiness 探測的健康檢查

4. Scale up中的運用Health Check

5. 滾動更新中運用Healthy Check

相關文章:

Kubernetes 調度和資源管理

如何輕鬆學習 Kubernetes？

kubernetes 基礎概念

《蹲坑學kubernetes》之九：部署Master節點

Kubernetes 網絡模型來龍去脈

Kubernetes 入門

c++中的double check

圖文詳解 Kubernetes

Kubernetes CRD

Check Point防火牆的提權漏洞

Kubernetes 集群安全機制詳解

前端好庫：自動幫你debug的測試庫 fast-check

Kubernetes 零宕機滾動更新

Kubernetes 存儲架構及插件使用

為什麼 Kubernetes 是微服務發展的必然產物？

12.24 Kubernetes 幾種存儲方式性能對比

揭開 Kubernetes 的神祕面紗

Kubernetes RBAC角色權限控制

11.24 Kubernetes 高可用多master集群搭建

Kubernetes 持久化安裝 Prometheus

Kubernetes kubectl 命令自動補全

Kubernetes 滾動更新及回滾

為什麼你不必害怕 Kubernetes

Kubernetes 包管理神器 helm

Kubernetes 佈署wekan

Kubernets PV PVC詳解

對 Kubernetes 應用進行自定義指標擴縮容

鵬哥的Kubernetes學習筆記：Kubernetes 基本感念

Oracle數據遷移--如何確認是否遷移成功？需要查詢這些內容

淺談 Kubernetes 在生產環境中架構

Kubernetes 是什麼？為什麼Kubernetes也稱為K8S？

Kubernetes 重要概念

Vue表單校驗插件Vuerify使用詳細教程及示例

Vuerify表單校驗插件使用詳細教程

Kubernetes 多集群管理平臺（Wayne）

Kubernetes 與容器技術學習方法

01.23 你（多半）不需要 Kubernetes

阿里P7也很無奈，Kubernetes+Docker系統的級聯停機故障教訓

何時該用無服務器，何時該用 Kubernetes？

Kubernetes-項目中pod調度使用法則

教程｜如何使用 Kubernetes 輕鬆部署深度學習模型

Kubernetes 集羣自動化部署腳本

kubernetes 從入門到棄坑-3

kubernetes 從入門到棄坑-2

kubernetes 從入門到棄坑-1

09.20 Kubernetes 下日誌採集、存儲與處理技術實踐

09.14 Kali安全-Unix/Linux提權漏洞快速檢測工具unix-privesc-check

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪