新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關產(chǎn)品Related Product
問題描述
工程師在網(wǎng)管發(fā)現(xiàn)一臺新建OSN6800子架有多塊單板上報COMMUN_FAIL告警,且告警上報時間相同,該子架為主子架,沒有配置從子架;
查看該網(wǎng)元歷史告警,發(fā)現(xiàn)在出現(xiàn)COMMUN_FAIL告警之前,該網(wǎng)元曾上報過SUBRACK_LOOP告警。
告警信息
COMMUN_FAIL;SUBRACK_LOOP
處理過程
安排站點工程師帶AUX備件去現(xiàn)場,拔插AUX板,單板復位后告警消失,觀察20分鐘,該告警沒有再上報。
根因
1、查看COMMUN_FAIL告警參數(shù),參數(shù)為0x010x000x03,表示板間ETH通信失效
2、網(wǎng)元曾上報過SUBRACK_LOOP,該告警一分鐘后消除,該告警表示子架間網(wǎng)口環(huán)回,可以引起廣播風暴,從而導致個別通信端口吊死
3、AUX單板故障也可引起COMMUN_FAIL
建議與總結(jié)
此案例是由于設備主從模式下,子架間內(nèi)網(wǎng)口連接成環(huán),引起以太網(wǎng)廣播風暴,沖掉了AUX一些單板的通信端口,導致這些單板通信失效。
由此可見,如COMMUN_FAIL告警同時伴隨SUBRACK_LOOP,建議仔細檢查子架間的網(wǎng)線連接,如SUBRACK_LOOP告警已消失,但COMMUN_FAIL仍存在,則建議硬復位AUX單板。
另外,COMMUN_FAIL告警參數(shù)如下,供參考:
參數(shù)為0x010x000x01時,表示RS485的1號通道失效;
參數(shù)為0x010x000x02時,表示RS485的2號通道失效;
參數(shù)為0x010x000x03時,表示板間ETH通信失效;
參數(shù)為0x010x000x04時,表示子架間緊急ETH通信失效。