新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
OSN3500 EMS4單板LPT功能被觸發(fā)但前段無(wú)相關(guān)告警(ETH_LOS),當(dāng)前端路由器發(fā)生短時(shí)業(yè)務(wù)中斷,LPT功能被使能,業(yè)務(wù)中斷。由于前端的EMS4打開了告警防抖功能,前端的EMS4單板并沒有上報(bào)相關(guān)告警(ETH_LOS)。
告警信息
一端上報(bào)告警LPT_RFI,另一端不上報(bào)ETH_LOS
處理過程
關(guān)閉相關(guān)網(wǎng)元的的告警防抖功能。
根因
LPT_RFI和ETH_LOS實(shí)現(xiàn)如下:
LPT_RFI:250ms,100優(yōu)先級(jí)任務(wù)輪詢。
ETH_LOS:1000ms,140優(yōu)先級(jí)任務(wù)輪詢。
告警防抖:LPT_RFI告警2秒防抖后上報(bào)主機(jī),ETH_LOS告警依靠主機(jī)的2秒防抖。
主機(jī)防抖:2次
防抖過程:LPT_RFI檢測(cè)到端口link_down持續(xù)2秒后,隨即持續(xù)上報(bào)主機(jī),間隔250ms。主機(jī)收到這個(gè)告警,根據(jù)是否需要防抖(默認(rèn)需要)決定是否立即上報(bào)網(wǎng)管。由于有2次防抖,注意這里是兩次不是兩秒。所以,主機(jī)在收到這個(gè)告警500ms后就上報(bào)給網(wǎng)管。而對(duì)于ETH_LOS任務(wù),主機(jī)在收到ETH_LOS告警后,如果要防抖2次,單板1秒報(bào)一次,那么2秒后才會(huì)上報(bào)網(wǎng)管。
所以如果告警時(shí)間很短,那么網(wǎng)管上就只能顯示出LPT_RFI,但沒有ETH_LOS告警。
但根據(jù)上面的分析,如果使用:alm-set-condetect:disable命令去掉主機(jī)的防抖功能,那么就沒有上面的問題了。
建議與總結(jié)
如發(fā)生LPT功能使能但對(duì)端單板無(wú)上報(bào)相關(guān)告警,建議關(guān)閉網(wǎng)元的告警防抖功能。