如何判斷服務器是否死機?

屈鵬濤


我們知道,不管是雲服務器還是物理服務器,絕大多數都是託管在遠程機房的,此時服務器的運行狀態我們就不能及時掌控的。

服務器全天候運行時,不排除服務器會有死機的可能。作為服務器運維人員而言,當服務器上的服務不可用時,如何快速判斷是服務器死機導致的還是其它原因導致的呢?下面結合我的運維經驗談談我對於此問題的看法。

判斷服務器是否死機的方法

1、查看服務器是否能ping通

如果你的服務器沒有禁止ICMP響應,那可以通過ping命令查看服務器是否有響應。

如果服務器沒有禁ping,此時ping服務器IP又不通時,就說明服務器不是在線狀態了。

2、查看是否能進入遠程桌面進行操作

如果是Windows服務器,我們就用遠程桌面工具連接服務器;如果是Linux服務器,我們使用XShell或者Putty或者iTerm這類終端工具連接服務器。

如果服務器無法連接上,說明服務器沒有響應,可能原因有:

  • 服務器帶寬被佔滿;

  • 服務器宕機;

3、雲服務器請登錄控制面板查看服務器運行狀態

如果是雲服務器,那我們可以第一時間登錄控制面板查看雲服運行狀態(是否在運行中、內存及CPU佔用率情況、帶寬佔用率情況)。

如果服務器是運行中狀態,但CPU、內存、帶寬中的一種佔滿了,那服務器基本上就是死機了,可以強制重啟服務器,然後進一步處理。

4、物理服務器如果運行狀態不明,請聯繫機房客服

物理服務器如果無法判斷服務器運行狀態,請第一時間聯繫機房客服人員協助查看服務器運行狀態是否正常。

5、通過站點訪問統計工具判斷網站訪問量是否處於高峰


服務器死機時的現象有哪些?

綜上所述,服務器死機時的表現主要有以下幾點:

  • 服務器上的所有服務均無法訪問,比如說:WEB站點無法訪問、數據庫無法訪問、無法登錄服務器、FTP無法使用等;而無法遠程登錄服務器時就已經說明服務器狀態異常了!

  • 雲服管理面板或者機房客服反饋說服務器內存佔滿、CPU佔滿、寬帶佔滿;

  • 服務器受到流量攻擊時也會造成死機現象,而這種攻擊留下的現象就是服務器的上行帶寬全部佔滿。

導致服務器死機的因素有哪些?

一般而言,服務器死機原因主要是軟件及系統出現故障或者是硬件存在故障導致,我們從死機狀態恢復後要查看服務器日誌來具體定位事故原因。

  • 硬件方面:
    硬件上最為常見的就是硬盤損壞、設備插槽鬆動等情況下最容易導致死機。

  • 軟件及系統方面:
    比如說一些軟件存在死循環、軟件崩潰、系統Bug會導致服務器死機。


以上就是我的觀點,對於這個問題大家是怎麼看待的呢?歡迎在下方評論區交流 ~ 我是科技領域創作者,十年互聯網從業經驗,歡迎關注我瞭解更多科技知識!


分享到:


相關文章: