新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問(wèn)題描述
某網(wǎng)絡(luò)NG-SDH設(shè)備由5.21.16.13/5.21.17.31版本升級(jí)到5.21.18.50P01+SPH001時(shí),出現(xiàn)大面積非網(wǎng)關(guān)網(wǎng)元脫管現(xiàn)象,網(wǎng)管上可以登錄網(wǎng)元,但不久后又重新脫管。該網(wǎng)絡(luò)有10個(gè)網(wǎng)關(guān)網(wǎng)元,均為OSN3500與OSN7500,接入層設(shè)備多為Metro100,Metro1000等盒式設(shè)備,市區(qū)環(huán)網(wǎng)關(guān)網(wǎng)元下掛載網(wǎng)元數(shù)量為50個(gè)左右,未出現(xiàn)脫管現(xiàn)象,郊縣環(huán)網(wǎng)關(guān)網(wǎng)元下掛載設(shè)備大多超過(guò)140個(gè),最多的達(dá)到184個(gè),出現(xiàn)大面積網(wǎng)元脫管現(xiàn)象。
告警信息
大面積網(wǎng)元在網(wǎng)管上變灰色,呈脫管狀態(tài),有網(wǎng)元脫管告警。
處理過(guò)程
1、檢查網(wǎng)管與網(wǎng)關(guān)網(wǎng)元的可達(dá)性,用PING命令檢查網(wǎng)管與網(wǎng)關(guān)之間的網(wǎng)絡(luò)連通性和丟包率。
2、在網(wǎng)管功能樹(shù)上選擇“通信>網(wǎng)元ECC鏈路管理”,關(guān)閉含有脫管網(wǎng)元子網(wǎng)的環(huán)路,把一部分設(shè)備從現(xiàn)有ECC網(wǎng)絡(luò)中完全隔離出來(lái),待ECC不在震蕩后,等待15-20分鐘然后逐漸放開(kāi),當(dāng)打開(kāi)的網(wǎng)元數(shù)量超過(guò)120個(gè)左右時(shí),ECC風(fēng)暴再次出現(xiàn)。
3、與客戶溝通,決定臨時(shí)增加幾個(gè)主要節(jié)點(diǎn)的網(wǎng)關(guān)網(wǎng)元重新進(jìn)行ECC劃分,減少當(dāng)前某些網(wǎng)關(guān)的網(wǎng)元掛載數(shù)量以解決問(wèn)題;根據(jù)現(xiàn)場(chǎng)可能實(shí)現(xiàn)的條件,臨時(shí)添加了兩個(gè)網(wǎng)關(guān)網(wǎng)元,閃斷脫管現(xiàn)象消失,問(wèn)題得到解決。
根因
初步判斷為ECC風(fēng)暴震蕩導(dǎo)致大面積網(wǎng)元脫管,原因?yàn)楫?dāng)設(shè)備版本由5.21.16.13/5.21.17.31版本升級(jí)到5.21.18.50P01+SPH001時(shí),新版本占用了更多的主控板CPU資源,使得主控板CPU處理ECC通信的能力下降,且該網(wǎng)絡(luò)掛載的網(wǎng)元數(shù)量遠(yuǎn)大于建議規(guī)劃的64個(gè)以下,故形成ECC網(wǎng)絡(luò)風(fēng)暴。
建議與總結(jié)
設(shè)備資料中都有建議的ECC規(guī)模說(shuō)明,雖然超過(guò)建議值后也不一定馬上就會(huì)出現(xiàn)ECC風(fēng)暴,但新版本一般都帶有新特性以及新維護(hù)功能,這些功能或多或少會(huì)占用主控板以及單板的CPU資源,可能造成其他方面處理能力的下降,所以完全可能出現(xiàn)升級(jí)前網(wǎng)絡(luò)運(yùn)行正常但升級(jí)后出現(xiàn)ECC風(fēng)暴的問(wèn)題;進(jìn)行重大操作簽,建議按照公司標(biāo)準(zhǔn)對(duì)ECC進(jìn)行分割,如確實(shí)不具備分割條件,請(qǐng)準(zhǔn)備好風(fēng)險(xiǎn)防范措施。