選擇RHEL還是CENTOS?

和大家分享一下我前幾年在一家規模不大的中型企業做IT運維時發生的有趣的事!


那一年跳槽剛好進入那家企業,因為離家比較近。剛開始接手企業業務的時候,有一種趕緊逃命的衝動,因為太TM亂了!由於企業規模不大,老闆又不想多花錢,所以凡有什麼業務系統需求就讓原來有些編程經驗的IT經理編寫業務系統!問題來了,系統還沒內測完,那個IT經理跑了,留下一爛攤子沒法收拾。後來啊,我硬著頭皮把相關的一些業務熟悉了一下,在現有的軟件環境儘量保障業務運行,一邊也在催促老闆趕緊購買和上線大公司的行業軟件產品。雖然現在也離開那家企業了,不過想想,那會兒哪來的那種激情呢?

選擇RHEL還是CENTOS?


期間也在網上看到了一篇大神寫的關於RHEL和CENTOS的選擇問題的故事,與各位IT運維一線的同志們共勉!

兩臺過百萬的硬件集群設備上,跑著某個證券交易所的一個業務。然後你選了Debian和centOS, 很牛X的對你的老闆說,看!我給公司省了多少萬,這種東西很容易,自己都可以搞定的,Red Hat/Novell公司的售後支持啥都不懂,還不如自己用google,網上論壇或者郵件列表問呢。

老闆用讚許的眼光看著你,心想你這個手下真的能力很強,這下今年IT基礎建設的預算,又可以有一筆錢節省出來挪作他用了。

某天,你運氣不好,系統出了問題,然後你們公司緊急要求服務器廠商的人,存儲廠商的人,Oracle的人,應用開發公司的人都緊急到場,開協調會討論排錯問題,而且要求到場的都是各個原廠商的資深技術專家。 這套集群上每天交易開盤,有大概50萬股民會上來做交易(做股票的同學都知道,一個證券公司如果有開戶交易股民50萬,那是一個小證券公司), 現在離天亮還有7個小時。

一大堆人,包括你在內,你的老闆在內,都忙起來了。大家壓力都很大,因為如果找不出故障原因和解決方案,基本上你們公司的麻煩就大了,碰巧這幾天股票不穩定,股民情緒本來就不好。

服務器和存儲廠商的人做了診斷,拿出了診斷報告,排除了硬件問題,Oracle的牛人拿出了詳細的診斷報告,排除了數據庫的問題, 業務應用開發商也是如此。

最後,大家的目光聚焦到了你的身上, 沒錯,就是你。 你的確從一個技術人員的角度,給公司推薦了成本低廉的方案,但是你的過於自信和欠缺成熟的考慮,現在要讓你付出代價了。

我不知道這裡同學知道不知道,一個正常的小證券公司,前一天的交易數據量,在清算後,為了排錯,做一次完全的數據移動前前後後要花多少時間? 2個多小時 ! 光纖櫃櫃對倒 ! 你還有4個小時!你的老闆,老闆的老闆,那個負責證券公司業務的老總,意料之中的出現在你面前,問你,為什麼操作系統廠商沒有來?為什麼不參與排錯? 你無語了。你的老闆給你打圓場, 如此這般的解釋了一下, 你的老闆的老闆嚴厲質問你老闆還有你,他說: 我們缺這些錢麼?我們需要你們的個人的小聰明麼?還有4個小時開盤,到時候系統還沒有弄好,你們都等著股民打上門吧。

那天,剛好大家的運氣都不錯,而且各個廠商來的技術專家都非常資深,在第二天開盤的前3個小時內,終於找到並排除了問題,並且重寫了數據移動的腳本,將數據移回服務器花了1個半小時,然後順利撐過了這一天的交易。

事故原因是由於公司在每臺服務器上都部署了光纖雙環路,兩塊FC HBA卡需要在linux下面做綁定,CentOS linux在安裝了廠商提供的 FC HBA驅動之後,CentOS linux並沒有在這種卡上做完整測試,而且更要命的是,那個提供FC HBA卡的硬件廠商也沒有對CentOS做測試和認證,所以CentOS 只能支持這種FC HBA上芯片家族中的一種,但是卻把這兩塊卡當作那種芯片識別出來而且去驅動了,由於是雙環,卡之間除了failover還需要做load balance,因此觸發了CentOS和驅動之間的兼容性問題,導致系統出現問題。 後來通過修改卡廠商的srpm包,調整了驅動源代碼裡面的參數,冒險嘗試了一下重新編譯掛到勒CentOS 上,結果運氣好被蒙對,驅動本身的確可以支持相近系列的芯片,但是需要在驅動源代碼的參數上做調整且重新編譯。

正確認識各個版本的優劣,精確選擇合適的Linux,才能對自己負責,對企業負責,不然搞不好是要出人命的!


分享到:


相關文章: