新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
一套OSN7500設(shè)備為網(wǎng)關(guān)網(wǎng)元,主機版本為5.21.16.13。做為網(wǎng)關(guān)網(wǎng)元可以登錄且可以PING通,但發(fā)生過5、6次所有下掛的網(wǎng)元無法登錄。當(dāng)25槽位主控板做為讓主用時,下掛網(wǎng)元全部脫管,進(jìn)行硬復(fù)位,故障仍不解決。切換到24槽位為主用時,下掛網(wǎng)元全部可以登錄。
處理過程
1、 查詢主機版本,剛開始懷疑為序號SC0000385405的預(yù)警問題:SSN3GSCC在網(wǎng)關(guān)網(wǎng)元上使用時導(dǎo)致網(wǎng)元脫管問題。
2、 根據(jù)預(yù)警判斷方法,telnet上主主控,未發(fā)現(xiàn)有預(yù)警中藍(lán)色字體的打印信息。
3、 硬復(fù)位或插拔主控單板無效,懷疑為硬件故障。
4、 最后更換主控板后故障解決。將故障單板返回公司分析。
根因
1、線路ECC誤碼導(dǎo)致網(wǎng)元脫管。
2、ECC震蕩導(dǎo)致下掛網(wǎng)元脫管。
3、主控板故障導(dǎo)致網(wǎng)元脫管。
4、主機版本缺陷導(dǎo)致網(wǎng)元脫管。
建議與總結(jié)
根據(jù)公司重現(xiàn)故障分析得出原因:通過返回的參數(shù)轉(zhuǎn)換成HEX可發(fā)現(xiàn)如下錯誤規(guī)律:錯誤都是每隔31個字節(jié)在BIT3(即每隔2Mbit)由0跳變到1。從以上現(xiàn)象確定是OSN7500主控由于CPU處理接收D字節(jié)的數(shù)據(jù)區(qū)有故障,導(dǎo)致接收下帶網(wǎng)元的ECC數(shù)據(jù)BIT有跳變,存在誤碼,從而引起ECC通信不正常,下帶網(wǎng)元就會脫管。