西門子400H冗餘系統燈紅閃爍,處理過程尷尬,差點進坑

突發狀況:

客戶一套400H系統突然故障,著急打來電後,讓過去處理,可惜疫情雖然好多了,但也不容鬆懈,大意不得,出不了門。客戶又很著急,沒辦法,遠程視頻處理吧。

嘮叨兩句:

400H系統,真的不得不說又愛又恨,單一套冗餘CPU幾十萬,好誘人的說,加上PCS7系統,想想都高大上,但是你也不要總是鬧脾氣啊,三天兩頭整出點事,而且是同樣的問題,還沒根治法。西門大官人,你怎麼說?

故障現象:

主站REDF紅燈常亮;從站REDF紅燈閃爍,BUSF2紅燈常亮。

具體如下視頻:



處理過程:

起初客戶說冗餘出問題了,以為很簡單,停電關機,讓他休息,一會再上電就好了,經驗訣竅啊,一般人我不告訴他。但是,處理了一遍,還是老樣子,好尷尬的說。

這怎麼搞,REDF就是冗餘錯誤,那是冗餘錯誤嗎?看看燈沒問題,主從站光纖冗餘,通信燈都正常閃爍。BUSF就是DP網絡錯誤,這個簡單,去查下就行了,不多說了,重點還是在冗餘錯誤上。

讓我好好想想,400H+PCS7冗餘容錯系統,很高大上的東西,出這是什麼問題哈。這個時候,已經有段時間了,讓現場人員,先把BUSF處理掉。然後,冗餘我來想辦法。搞不定,豈不是對不起自己和客戶。

過了會,客戶把BUSF處理掉了,有個分站DP有點問題。然後,就沒然後了,REDF也好了。這是各什麼狀況?你知道嗎?

結果是好的,過程是複雜的,想通費腦子的,經驗是總結的、分享的。

經驗分享:

首先你要明白,這個平臺真的高大上,它不但故障檢測,而且預報。它預測你如果進行下一步進行什麼操作的話可能會產生什麼結果,什麼故障,這個都給你先擺到檯面上,先預報給你。

不一定能明白這句話哈,看我給你解釋:

1 BUSF紅燈,DP網絡故障,這個肯定是有問題了。

2 REDF一個紅燈常亮,一個紅燈閃爍,常亮告訴你冗餘有問題了,但不是本尊哦,閃爍告訴你冗餘有問題,且還就是我有問題。

但從主從站CPU通信燈上看,又沒有冗餘問題,這個很奇怪,問題就出在這裡。

這個情況就是由BUSF故障引起的,DP網絡一個分站有問題,掉站,被從站網絡檢測到了,紅燈閃爍報警,如果不切換到主站,系統就維持現狀,有報警的工作,但如果主從切換,可能就會切換不成功,會有問題,因為冗餘系統,也包含網絡冗餘,這裡就有一路網絡故障。至於問題,也要具體情況具體分析了。


最後,歡迎關注,私信,互相交流學習。這個問題不太好處理,情況也比較多,仁者見仁智者見智吧。希望這個過程能幫到你,更希望學習下你所遇到的狀況。


分享到:


相關文章: