新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關產(chǎn)品Related Product
問題描述
OSN3500設備因機房停電掉電,OSN3500恢復供電后主控,交叉,業(yè)務板上報一系列告警,導致業(yè)務不通。
主機版本:5.21.20.55,單配主控,雙配交叉,故障時刻9槽位交叉板是主用。
告警信息
HARD_BAD:
7槽位EGS2參數(shù):0X010X000X060XFF0XFF
13槽位EFS0參數(shù):0X010X000X060XFF0XFF
18槽位GSCC參數(shù):0X020XFF0XFF0XFF0XFF
9槽位SXCSA參數(shù):0X020X000X040XFF0XFF
CHIP_FAIL:
9槽位SXCSA參數(shù):0X000X000X000X010X00
2槽位PQ1
OOL
9槽位SXCSA參數(shù):030001ffff
10槽位SXCSA參數(shù):010001ffff
Temp_over
9槽位SXCSA參數(shù):01000101ff
HSC_UNAVAIL
9槽位SXCSA參數(shù):030109ffff
Bus_err
10槽位SXCSA參數(shù):0d010301ff
Syn_bad
10槽位SXCSA參數(shù):0801ffffff
處理過程
1、現(xiàn)場測試電壓-54V,屬于正常范圍。
2、再次同步核對告警,AUX沒有任何告警,結合現(xiàn)場單板指示燈狀態(tài)正常,如果AUX異常單板是不能開工的。
3、網(wǎng)元上報告警比較多,使用命令行查詢單板物理板和邏輯板狀態(tài)正常,現(xiàn)場反饋板卡指示燈也是正常,考慮到業(yè)務是全阻,故主控和交叉板的故障可能性最大。通過分析單配主控的HARD_BAD告警,參數(shù)定位是2槽位PQ1異常,主控問題可能性不大。繼續(xù)分析,發(fā)現(xiàn)9槽位(主用)交叉板告警較多。嘗試網(wǎng)管倒換復位交叉板失敗。
4、網(wǎng)管反饋10槽位交叉板主動變?yōu)橹饔脿顟B(tài),告警條數(shù)和參數(shù)無變化,網(wǎng)管硬復位9槽位后,告警條數(shù)和參數(shù)持續(xù)不變。
5、網(wǎng)管查詢交叉板溫度,命令行為(:cfg-get-bdtemp:9),溫度是70度,已經(jīng)超過溫度上門限,故上報tempover正常,現(xiàn)場核實機房空調停電后未工作,機房溫度較高。故懷疑9槽位單板工作異常,和溫度有關。
5、建議現(xiàn)場拔出9槽位觀察,同時協(xié)調好備件。現(xiàn)場反饋拔出9槽位等待幾分鐘后,所有告警逐漸消失,核實業(yè)務也恢復了。
6、為了準備定位是9槽位交叉板異常就是溫度導致(之前單板持續(xù)上報tempover),將單板重新插入9槽位后,觀察業(yè)務持續(xù)正常,查詢交叉溫度較之前低10度。
根因
定位是溫度過高引起單板重新上電后工作異常,上報一系列告警。
建議與總結
定位清洗風扇防塵網(wǎng),控制好機房溫度和濕度。
OptiXOSN設備正常運行對溫度和濕度的要求為:(溫度、濕度的測量點,是指在機架前后沒有保護板時測量,距地板以上1.5m和距機架前方0.4m處測量的數(shù)值。)
長期運行溫度:0℃~45℃
短期運行溫度(短期運行是指連續(xù)工作不超過96小時和每年累計不超過15天。):-5℃~55℃
長期運行濕度5%~85%
短期運行濕度5%~95%
同時為提升產(chǎn)品應用可靠性,機房應配備機房專用精密空調,將溫度和濕度控制在下面范圍:
空調控制溫度:15-30℃。
空調控制濕度:40%-75%。
注意:空調禁止安裝在設備上方,空調出風口應避免直接吹向設備,空調安裝時應盡量遠離窗戶,以避免將透窗的濕氣通過空調吹向設