利用 Tmux 和 kubectl 解決 Kubernetes 故障

利用 Tmux 和 kubectl 解決 Kubernetes 故障

一個使用 tmux 的 kubectl 插件可以使 Kubernetes 疑難問題變得更簡單。-- Abhishek Tamrakar(作者)


Kubernetes 是一個活躍的開源容器管理平臺,它提供了可擴展性、高可用性、健壯性和富有彈性的應用程序管理。它的眾多特性之一是支持通過其主要的二進制客戶端 kubectl 運行定製腳本或可執行程序,kubectl 很強大的,允許用戶在 Kubernetes 集群上用它直接做很多事情。

使用別名進行 Kubernetes 的故障排查

使用 Kubernetes 進行容器編排的人都知道由於設計上原因帶來了其功能的複雜性。舉例說,迫切需要以更快的速度並且幾乎不需要手動干預的方式來簡化 Kubernetes 中的故障排除(除過特殊情況)。

在故障排查功能方面,有很多場景需要考慮。在一種場景下,你知道你需要運行什麼,但是這個命令的語法(即使作為一個單獨的命令運行)過於複雜,或需要一、兩次交互才能起作用。

例如,如果你需要經常進入一個系統命名空間中運行的容器,你可能發現自己在重複地鍵入:

<code>kubectl --namespace=kube-system exec -i -t <your-pod-name>/<code>

為了簡化故障排查,你可以用這些指令的命令行別名。比如,你可以增加下面命令到你的隱藏配置文件(.bashrc 或 .zshrc):

<code>alias ksysex='kubectl --namespace=kube-system exec -i -t'/<code>

這是來自於 Kubernetes 常見別名 存儲庫的一個例子,它展示了一種簡化 kubectl 中的功能的方法。像這種場景下的簡單情形,使用別名很有用。

切換到 kubectl 插件

更復雜的故障排查場景是需要一個一個的執行很多命令,調查環境,最後得出結論。僅僅用別名方法是不能解決這種情況的;你需要知道你所部署的 Kubernetes 之間邏輯和相關性,你真正需要的是自動化,以在更短的時間內輸出你想要的。

考慮到你的集群有 10 ~ 20 或 50 ~ 100 個命名空間來提供不同的微服務。一般在進行故障排查時,什麼對你有幫助?

  • 你需要能夠快速分辨出拋出錯誤的是哪個 命名空間的哪個 Pod 的東西。
  • 你需要一些可監視一個命名空間的所有 Pod 日誌的東西。
  • 你可能也需要監視特定命名空間的出現錯誤的某個 Pod 的日誌。

涵蓋這些要點的解決方案對於定位生產環境的問題有很大的幫助,以及在開發和測試環節中也很有用。

你可以用 kubectl 插件 創建比簡單的別名更強大的功能。插件類似於其它用任何語言編寫的獨立腳本,但被設計為可以擴充 Kubernetes 管理員的主要命令。

創建一個插件,你必須用 kubectl-<your-plugin-name> 的正確的語法來拷貝這個腳本到 $PATH 中的導出目錄之一,並需要為其賦予可執行權限(chmod +x)。/<your-plugin-name>

創建插件之後將其移動到路徑中,你可以立即運行它。例如,我的路徑下有一個 kubectl-krawl 和 kubectl-kmux:

<code>$ kubectl plugin listThe following compatible plugins are available:/usr/local/bin/kubectl-krawl/usr/local/bin/kubectl-kmux$ kubectl kmux/<code>

現在讓我們見識下帶有 tmux 的 Kubernetes 的有多強大。

駕馭強大的 tmux

Tmux 是一個非常強大的工具,許多管理員和運維團隊都依賴它來解決與易操作性相關的問題:通過將窗口分成多個窗格以便在多臺計算機上運行並行的調試來監視日誌。它的主要的優點是可在命令行或自動化腳本中使用。

我創建 一個 kubectl 插件 ,使用 tmux 使故障排查更加簡單。我將通過註釋來解析插件背後的邏輯(插件的完整代碼留待給你實現):

<code># NAMESPACE 是要監控的名字空間# POD 是 Pod 名稱# Containers 是容器名稱# 初始化一個計數器 n 以計算循環計數的數量,# 之後 tmux 使用它來拆分窗格。n=0;# 在 Pod 和容器列表上開始循環while IFS=' ' read -r POD CONTAINERSdo    # tmux 為每個 Pod 創建一個新窗口    tmux neww $COMMAND -n $POD 2>/dev/null    # 對運行中的 Pod 中 的所有容器啟動循環    for CONTAINER in ${CONTAINERS//,/ }    do        if [ x$POD = x -o x$CONTAINER = x ]; then            # 如果任何值為 null,則退出。                     warn "Looks like there is a problem getting pods data."            break        fi                   # 設置要執行的命令        COMMAND=”kubectl logs -f $POD -c $CONTAINER -n $NAMESPACE”        # 檢查 tmux 會話        if tmux has-session -t  2>/dev/null;        then                    else                    fi        # 在當前窗口為每個容器切分窗格        tmux selectp -t $n \\; \\        splitw $COMMAND \\; \\        select-layout tiled \\;        # 終止容器循環    done        # 用 Pod 名稱重命名窗口以識別    tmux renamew $POD 2>/dev/null        # 增加計數器    ((n+=1))# 終止 Pod 循環done<)# 最後選擇窗口並附加會話tmux selectw -t :1 \\; \\attach-session -t \\;/<code>

運行插件腳本後,將產生類似於下圖的輸出。每個 Pod 有一個自己的窗口,每個容器(如果有多個)被分割到其窗口中 Pod 窗格中,並在日誌到達時輸出。Tmux 之美如下可見;通過正確的配置,你甚至會看到哪個窗口正處於激活運行狀態(可看到標籤是白色的)。

利用 Tmux 和 kubectl 解決 Kubernetes 故障

總結

別名是在 Kubernetes 環境下常見的也有用的簡易故障排查方法。當環境變得複雜,用高級腳本生成的kubectl 插件是一個更強大的方法。至於用哪個編程語言來編寫 kubectl 插件是沒有限制。唯一的要求是該名字在路徑中是可執行的,並且不能與已知的 kubectl 命令重複。

要閱讀完整的插件源碼,或試試我創建的插件,請查看我的 kube-plugins-github 存儲庫。歡迎提交提案和補丁。


via: opensource.com

作者: Abhishek Tamrakar 選題: lujun9972 譯者: guevaraya 校對: wxy

本文由 LCTT 原創編譯, Linux中國 榮譽推出


分享到:


相關文章: