在運維工作中,為保證業務的正常運行,我們需要定時查看指定的進程是否還存在,一旦進程退出了,說明服務可能存在問題,運維工程師就可以在第一時間處理問題。今天就跟大家分享一個實用的shell腳本——
時刻檢查你的進程狀態。在對進程進行監控時,我們一般需要得到該進程的 ID,進程 ID 是進程的唯一標識,但是有時可能在服務器上不同用戶下運行著多個相同進程名的進程。
下面的函數 GetPID 給出了獲取指定用戶下指定進程名的進程 ID 功能(目前只考慮這個用戶下啟動一個此進程名的進程),它有兩個參數為用戶名和進程名,它首先使用 ps 查找進程信息,同時通過 grep 過濾出需要的進程,最後通過 sed 和 awk 查找需要進程的 ID 值(此函數可根據實際情況修改,比如需要過濾其它信息等)。
對進程進行監控
function GetPID #User #Name { PsUser=$1 PsName=$2 pid=`ps -u $PsUser|grep $PsName|grep -v grep|grep -v vi|grep -v dbx\n |grep -v tail|grep -v start|grep -v stop |sed -n 1p |awk '{print $1}'` echo $pid }
示例演示:
1、源程序(例如查找用戶為 root,進程名為 TestApp 的進程 ID)
PID=`GetPID root TestApp` echo $PID
2、結果輸出
11426 [dyu@xilinuxbldsrv shell]$
3、結果分析
從上面的輸出可見:11426 為 root 用戶下的 TestApp 程序的進程 ID。
4、命令詳解
1)ps: 查看系統中瞬間進程信息。 參數:
- -u< 用戶識別碼 > 列出屬於該用戶的程序的狀況,也可使用用戶名稱來指定
- -p< 進程識別碼 > 指定進程識別碼,並列出該進程的狀況
- -o 指定輸出格式
2)grep: 用於查找文件中符合字符串的當前行。 參數:
- -v 反向選擇,亦即顯示出沒有 ‘搜尋字符串’ 內容的那一行
3)sed: 一個非交互性文本編輯器,它編輯文件或標準輸入導出的文件,一次只能處理一行內容。 參數:
- -n 讀取下一個輸入行,用下一個命令處理新的行而不是用第一個命令
- p 標誌 打印匹配行
4)awk:一種編程語言,用於在 linux/unix 下對文本和數據進行處理。除了在命令行中使用,它更多是作為腳本來使用。 參數:
- -F fs or –field-separator fs :指定輸入文件折分隔符,fs 是一個字符串或者是一個正則表達式,如 -F:。
PS:有時有可能進程沒有啟動,下面的功能是檢查進程 ID 是否存在,如果此進程沒有運行輸出:
The process does not exist. # 檢查進程是否存在 if [ "-$PID" == "-" ] then { echo "The process does not exist." } fi
同樣是運維,為啥優秀的同學月入2w,你卻天天米湯?因為…
一名優秀的運維,不僅要能英勇善戰走在最前線,面對運維事故化險為夷;還需要我們實現業務系統的實時監控,預防運維事故於未然。
我可以不懼生死於運維事故抗爭到底,但是防患於未然,不確定因素那麼多,真的太難了~
其實,月入2w與你只差一個全方位的監控系統!
推薦一個實用運維工具——王教授。不僅可以接入多來源的各式監控匯聚一圖展示,還可對資源使用中出現的異常、未來可能出現的風險以告警的形式手機通知到個人,最大程度減小了運維事故的發生。
綁定雲賬號AcessKey隨時查看到賬戶下所有資產狀況,獲取及時的雲資源變化情況、問題提醒。
“掌握”全局監控,進階高級運維!有需要的運維同學歡迎點擊文末王教授二維碼查看詳情!
網站崩潰找不到原因?平臺搭建無從下手?熱門技術不想落伍?想要變強找不到資料?
加入[IT拯救聯盟],讓大牛和同伴拯救你,帶你裝x帶你飛。定期乾貨分享、大牛專業解答、實用IT工具優選.....
私信小編“聯盟”,即可加入我們~