智能運維:授人以漁—爲什麼選擇藍鯨來構建企業的自動化運維體系

欄目介紹

"深度好文"旨在分享行業內的優質技術文章。【智能運維繫列】帶來的是騰訊藍鯨的相關分析文章。

想了解更多關於藍鯨的原創文章,可關注“OTPUB權威IT學習平臺”(ID:ydotpub),回覆關鍵詞“藍鯨”獲取更多幹貨。

作者注:本篇文章簡單介紹了藍鯨的設計思想和體系架構,在隨後的文章中,我們將通過實操來介紹和演示藍鯨的各平臺和官方SaaS,以及元鼎科技基於藍鯨PaaS的最佳運維實踐,包括應用發佈、自動巡檢、日誌檢索等,同時也會不定期分享實際案例中SaaS開發。

本文作者

元鼎科技·自動化運維團隊

傳統運維之殤

隨著用戶業務規模的逐漸增大,雲計算、容器和微服務等IT技術的發展和成熟,整個IT運維環境變得越來越複雜,操作和需要管控的對象也越來越龐大,傳統的運維手段已無法滿足我們的要求。

國內外的互聯網企業,由於大部分時候面對的是互聯網應用場景和相對統一的雲環境,以及文化、體制、管理和人才方面都有優勢,更容易接受並實施DevOps體系,和自研自維的工具文化。

區別與互聯網企業,傳統企業在面對雲時代帶來的海量、複雜和異構系統帶來的運維挑戰時,首先要解決運維自動化的問題,通過自動化來解放運維人員的生產力,然後才能進一步向主動精細化運維,以及DevOps和智能運維轉型。

自動化管理對象和場景千差萬別,不同企業的IT部門遇到的環境和問題也不一樣。雖然當前市場上有不少商業和開源的運維產品工具,商業產品過去有IBM、HP、BMC、CA四大傳統廠商,開源方面有Puppet、Chef、Saltstack、Ansible等產品,但是如何在滿足個性化需求前提下,找到一個可以很好適應自身企業持續變化的需求的平臺,滿足企業自動化運維訴求,把週期性、重複性、規律性的工作交給平臺去處理,通過標準化、自動化、過程優化來降低運維成本,從而提高運維效率,仍然是一個擺在大多數傳統企業面前的巨大難題。

畢竟不同行業,不同企業的管理規模、組織架構、實施環境,以及內部安全(合規)要求都不盡相同,更不用說不同企業對IT有不同的重視程度,以及企業內部不同IT部門有不同的關注點和訴求,不同運維崗位又有各自不同的運維需求和痛點。

一般來說,傳統 IT 運維在發展過程中會有以下幾個問題:

其一,運維服務人員工作忙碌卻不受重視,傳統的“救火式”運維大大增加了運 維人員的工作強度和工作壓力,難以量化的工作得不到業務部門的認可。

其二,IT 系統複雜, 維護難度高,系統宕機風險係數大。

其三,技術人員難培養,流動性大,有經驗的技術人員因 為不受重視而辭職,造成運維質量和客戶滿意度的波動。

其四,服務商難管理,技術水平參差 不齊,服務不及時,有問題不能及時解決。

你以為的運維人員地位是這樣:

智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系

其實是這樣:

智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系

智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系

在過去二十多年的發展過程中,大多數中國企業逐步構建了以研發、測試、運維團隊為主體的IT組織架構,以及基於ITIL建立了信息系統建設,服務流程和IT運維體系。

而傳統IT時代ITIL和ITSM為主的流程驅動下的運維理念 ,很難滿足自動化的需求。以四大為首,這些商業產品一般有標準化程度高,通用性強,開箱即用的特點;在某些特定功能和場景上,這些產品確實也能按預期完成任務。

然而這類產品大多不支持用戶根據自身需求自主定製,或拓展應用場景,最終用戶(尤其是運維人員)的個性化需求往往需要向產品預設功能去靠攏(或妥協);同時,由於這類產品大多都是面向單一運維場景,所以用戶在長期建設自身IT運維體系的過程中,會為了解決新的需求而不斷採購大量新的商業產品,如CMDB、監控(主機、網絡、應用性能等)、日誌等產品,而這種煙囪式的建設也會逐漸在企業內形成信息孤島,各系統之間無法互聯互通......


智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系


總結來說,傳統企業在構建自身運維體系時,往往存在以下問題:

1、雖然有完整的運維體系,但缺乏統一運維平臺和工具,運維工具主要以商業軟件為主:煙囪式建設,無法互聯互通、聯動;

2、運維工具無法定製開發,或者適應新增運維場景和需求,依然有大量人肉運維場景;

3、傳統運維的生存空間受到來自企業內外部的威脅,在內部作為成本中心要削減IT預算,要適應外部IT技術的演進向運維開發轉型。

運維痛點

智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系

智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系

智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系

藍鯨設計思想

企業需要搭建一體化的運維/運營平臺,一方面要滿足綜合性的日常運維、監管、監控和任務調度等自動化的需求,充分利用自動化運維工具實現監控告警(如系統應用服務可用性監控、數據庫及中間件性能監控),故障自愈、應用發佈、日常巡檢,以及硬件設備生命週期管理、企業設備資產管理等。另一方面,通過構建運維開發平臺降低運維工具開發門檻,促進平臺工具開發更加自主可控,更加敏捷;平臺能夠整合存量運維工具,實現工具間的互聯互通,數據共享。

藍鯨正是這樣的一體化運營思路,對用戶來說,藍鯨的設計思路更像是授人以漁:除了內置的管控平臺、CMDB、作業平臺,以及監控、日誌、標準運維和故障自愈等各種原子平臺和SaaS外,藍鯨的真正強大之處在於其內置的集成PaaS平臺,可以讓運維人員低成本的在藍鯨PaaS之上開發各種運維場景APP,併為這些APP提供運行環境(容器方式)。

同時企業服務總線(ESB & API Gateway)為藍鯨體系中的其它平臺(作業平臺、配置平臺、數據平臺、容器管理平臺)和第三方的運營系統(公眾號、郵箱、OA 等)提供 API,統一以組件的形式對接企業服務總線,實現各原子平臺 API 協議統一和集中化管理,這樣,在上層的 SaaS 應用就可以通過企業服務總線調用 API。

通俗的打個比方來說,一方面,藍鯨的PaaS更像是給運維人員提供一個兵工廠,運維人員可以持續的自己來造工具,自己武裝自己;另一方面,通過ESB & API Gateway實現了對接企業已有的運維平臺和工具的可能性,避免簡單粗暴的把存量系統推倒重來,重複建設。

智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系

對於傳統企業的運維團隊來說,要想實現工具文化,首先就是要能夠降低構建工具的成本。

上圖左邊是傳統運維/運營工具的開發模式:傳統開發模式下,開發一個運營系統,首先是產品提需求,運維準備服務器並搭建環境,開發實現公共組件和應用邏輯,然後交付給運維做代碼部署,運維在服務器上添加監控和告警,出了問題之後,運維和開發都需要通過日誌來修復bug。

右邊是基於藍鯨的PaaS開發模式,有了應用需求,開發就可以直接開發應用邏輯,其他工作可以在藍鯨上一鍵完成。

在藍鯨集成平臺上的開發流程,開發人員只需要在本地環境完成應用代碼的編寫和測試,上傳代碼到git或者svn倉庫,再到藍鯨上點擊一鍵部署,就可以在測試環境測試,測試ok之後一鍵部署到正式環境。

智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系

從某種程度上來說,最熟悉用戶自身運維場景,肯定是用戶(運維人員)本身,藍鯨設計思想的本質就是通過武裝運維,把運維的主動權和想象力交還給用戶自己,讓用戶IT部門主導自身運維體系的建設,推動自身的工具文化和DevOps轉型。

基於藍鯨的PaaS的技術解決方案,企業用戶可以實現:

1、“運維基礎服務”的無人值守,包括日常大量重複的發佈、變更和故障處理等日常運維操作

2、“運維增值服務”的低成本實現,在實現運維基礎服務無人值守的基礎上,助力運維人員轉型DevOps,為各相關聯的崗位快速、低成本的提供支撐工具和運營系統,推動企業內部的工具文化,幫助業務實現精細化運營。

藍鯨智雲體系由八大平臺組成,即管控平臺、配置平臺、作業平臺、數據平臺、容器管理平臺、AI平臺、集成平臺和移動平臺,為各種雲(公有云、私有云、混合雲)的用戶提供不同場景、不同需求的一站式技術運營解決方案。除此之外,藍鯨官方還提供了包括故障自愈、監控告警、標準運維、日誌檢索、CICDKit等SaaS應用。

藍鯨智雲體系依託企業級 SOA、PaaS 等理念,運用 Docker 等最先進的雲技術構建起了全新的運維模式,致力於以“原子服務集成”和“低成本工具構建”的方式落地 DevOps,幫助運維快速實現“基礎服務無人值守”及“增值服務”,並進一步通過 DevOps 的落地實現企業更全面和可持續的效率提升。

智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系

智能運維:授人以漁—為什麼選擇藍鯨來構建企業的自動化運維體系

關於元鼎科技

元鼎科技,作為藍鯨首批授權技術服務商,基於自身在金融、政府、教育、製造等行業客戶數據中心的海量運維實踐,結合藍鯨PaaS平臺,助力運維自動化、運維智能化,以及DevOps文化在企業內部實踐、落地。


分享到:


相關文章: