原來運維不僅僅是 Linux,竟然還要知道這麼多?

【企業上雲,都選小鳥雲】為中國超過30萬家企業提供安全可靠的雲計算服務!無需服務器硬件維護,為您節約 80% 的成本投入;為您提供免費且豐富的基礎安全服務,運維無憂。

原來運維不僅僅是 Linux,竟然還要知道這麼多?

運維不僅僅是懂Linux就行,因為還有一大部分的Windows運維,最近看一個報道說,windows的服務器佔了47.71%。嗯,向windows運維人員致敬。當然我們這篇文章不是說運維除了懂Linux,還要懂Windows,而是涉及運維的其他方方面面。

環境部署

一開始這個世界是開發的,然後才是運維的。

開發實現產品邏輯,將產品開發完成後,然後提交運維進行部署。此時允許就需要準備好部署環境,如部署在Linux服務器上,安裝相應的軟件,如Apache、Nginx、tomcat、JDK、PHP、MySQL等等。你不能只裝了軟件吧,還需要看看具體是哪個版本,java 7 和java 8 的差別還是有點的,php5和php7也有些語法不兼容。把軟件都安裝好了,就可以上線了?還是不行。還需要測試吧,那就還需要部署一套測試環境。有些時候,開發環境也是需要運維來部署的。

排錯和調優

事情從來都沒有一帆風順的。

上線沒多久,服務就502了,還不被老闆罵死。儘管你有一肚子的委屈,我只是個運維,代碼不是我寫的,為什麼要我來背這鍋?!委屈歸委屈,服務訪問不了了,就是運維的事。儘快定位問題,解決問題才是王道。怎麼來定位問題呢?最簡單直接的辦法就是看日誌,看系統日誌,看軟件相關的日誌,結合故障現象和經驗,快速的進行定位和恢復。然後就是總結經驗,吸取教訓,寫事故報告。OK,現在你知道,需要對系統環境需要進行一定的調優操作,不再做背鍋俠。

相關技術: top, vmstat, iftop, awk, sed, sar, iostat, strace, ...

備份

做最好的計劃,做最壞的打算。

前不久的gitlab刪庫事件的教訓猶在眼前,丟失了幾小時的數據,雖然大部分的備份策略都失效了,但還是挽救了幾小時前的一個備份,才沒有造成更大的數據丟失和公司損失。我們需要對設備進行備份冗餘,需要對數據庫進行備份及離線備份,需要對網站靜態進行備份冗餘,需要對機房進行備用,能做到雙活,那是更好的啦。

相關技術: rsync, crontab, lvm快照, mysqldump, extrabackup, 完全備份, 差異備份, 增量備份, 離線異地備份, ...

高可用和集群

沒有永垂不朽,我們不能保證硬件24小時在線,但需要保障服務24小時在線。

出現故障後,如果做好高可用和冗餘,故障自動切換,移除故障節點,那樣也就保障了服務的實時在線。在老闆和用戶不知情的情況下,悄麼的把故障處理好的,KPI算是保住了,獎金也許就會有的吧。

相關技術: F5, Nginx, LVS, HA-proxy, MHA, Zookeeper, 各種其他分佈式集群方案,...

監控告警

運維工程師的第一次解放運動。

相關技術:Zabbix, Nagios, Cacti, Prometheus, open-falcon, Ganglia, sar, ...

安全和審計

狂奔在互聯網的康莊大道上,不過有些人是在裸奔。

不安全的網絡環境和服務器配置,無異於在網絡世界裸奔,任何人都可以窺探你的隱私。你的應用是否做了SQL防注入?你的防火牆是否開啟?是否還在用root+密碼的方式登錄服務器?網站開啟了https麼?是否對系統操作進行審計?

相關技術: iptables, firewalld, waf, auditd, 各服務的正確配置, ...

自動化和DevOps

運維工程師的第二次解放運動。

偷懶是社會進步的第一動力。聰明的我們怎麼會讓自己一直在重複枯燥的事情上浪費時間,裝系統、部署環境、發版本、批量操作,把這一切交給程序去實現吧,我們需要的是享受生活。

相關技術: shell, python, go, rundeck, ansible, saltstack, puppet, chef, cobbler, fabric, ...

虛擬化和雲服務

正在發生的一場運維革命。

這場革命的發起人是買書的亞馬遜,這傢伙希望賣一切可以賣的東西,包括自己閒置的服務器資源。現在國內的阿里雲和騰訊雲也發展得如日中天,他們幾乎提供了運維所需要的一切,甚至可以讓一個公司不再需要運維的崗位。你需要服務器,只需要幾秒鐘,就可以創建一臺。你需要數據庫集群,只需要鼠標點擊幾下,就可以開通。

相關技術:docker, Moby, kubernetes, Xen, CoreOS, Hyper-V, KVM, ...


分享到:


相關文章: