智安網絡訊:2018年4月美國納稅日故障歸因於IBM磁盤陣列出現缺陷,本來有兩次是可以避免的,第一次使用更新穎的微碼包,第二次使用秘密的IBM腳本。
在2018納稅年的最後一個申報日4月17日,網上納稅申報系統癱瘓了11個小時,美國國稅局(IRS)不得不將申報期延長了一天。
納稅申報系統基於大型機,使用幾個高可用性磁盤陣列,按照企業存儲服務(ESS)合同的條款規定,優利系統是主承包商,IBM是次承包商。
據美國政府本月發佈的一份報告顯示,其中一個磁盤陣列因緩存溢出而出現“熱啟動”(又叫暖開機)後出現了死鎖狀況,在美國東部標準時間(EST)02:24向IRS的管理人員發出警報,並在4月17日02:57 EST向IBM發出了call-home警報消息。
令人驚訝的是,它被歸類為“嚴重級別3”警報,理應在下一個工作日結束前作出響應。
到03:30 EST,IRS的更多系統受到了影響;後來受影響的系統越來越多,讓IRS苦不堪言,到07:45 EST共有59個系統中招,09:45 EST宣佈“重大故障”。13:40 EST開發出了一個補救腳本,有限的納稅申報工作於15:00開始,17:00申報工作完全恢復如初。
實際上,IBM在9個月前的2017年6月就發現了問題根源的固件bug,並於2017年11月7日向公眾發佈了微碼修復程序微碼包88.24.6.0。
從IRS發佈的報告中可以看出,導致這一事件發生的原因可以歸納為:人為錯誤、不夠到位的程序以及被系統的單一故障點所傷害。
故障報告全文:
閱讀更多 智安網絡 的文章