新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
ASON的Trail業(yè)務(wù)中斷,由于該業(yè)務(wù)的計劃預(yù)置路徑?jīng)]有打通,因此該Trail中斷。檢查Trail發(fā)現(xiàn)該鏈路中的H站點OSN8800設(shè)備上有四塊NS3單板不斷復(fù)位,而且該四塊NS3單板及網(wǎng)元上的部分板卡出現(xiàn)頻繁脫管現(xiàn)象。
告警信息
1、脫管單板出現(xiàn)BD_STATUS告警。
2、HARD_BAD
3、TEMP_OVER
處理過程
1、到現(xiàn)場后發(fā)現(xiàn)該站點的空調(diào)掉電,由于該站點在沙漠地帶,室外溫度達(dá)到70度,加上機器不斷持續(xù)發(fā)熱導(dǎo)致該站點溫度過高。部分設(shè)備的前面板及走線槽都出現(xiàn)了融化現(xiàn)象。多塊單板告警等不斷閃爍。
2、空調(diào)故障排除后從新上電,發(fā)現(xiàn)該站點仍然能在網(wǎng)管上PING通ECC,但是多塊單板包括NS3單板都出現(xiàn)脫管現(xiàn)象。
3、三天后該站點網(wǎng)元脫管。
4、研發(fā)和一線技服定位后確認(rèn)該站點的AUX板卡、NS3板卡等多塊板卡內(nèi)的部分模塊由于溫度過高而燒毀,通信及各項性能均不能實現(xiàn),整套設(shè)備需要從新發(fā)貨。
5、從新發(fā)貨后該站點上的ASON業(yè)務(wù)恢復(fù)正常。
根因
1、出現(xiàn)HARD_BAD是因為該站電之前多次掉電,目前網(wǎng)元可以PING通,排除掉電問題。
2、NS3單板以及多塊單板出現(xiàn)BD_STATUS告警,分析原因如下:AUX單板故障;已經(jīng)配置邏輯單板,物理單板未插入對應(yīng)槽位;單板插頭與背板插座間松動;單板故障;背板故障。
3、NS3等單板出現(xiàn)TEMP_OVER告警,估計該站點出現(xiàn)空調(diào)故障導(dǎo)致單板溫度過高現(xiàn)象。
建議與總結(jié)
由于沙漠站點非常偏僻而且溫度非常高,加上都是無人值守的站點,一旦空調(diào)出現(xiàn)故障設(shè)備都非常容易燒毀,因此建議:
1、考慮到沙特等高溫場境,為板卡提供耐高溫保護。
2、為板卡提供遠(yuǎn)程掉電人工控制。