1告警系統(tǒng)分析
C&C08程控交換機在運行過程中,當某些部件出現(xiàn)故障時,交換機的告警系統(tǒng)就會檢測收集到各種軟、硬件故障,然后經(jīng)維護軟件處理后在告警臺輸出告警信息報告,并通過告警箱顯示告警級別及告警原因,發(fā)出可視、可聞信號,提示維護人員進行必要的處理,以保證設備的正常運行。
C&C08交換機的告警系統(tǒng)采用分散采集、集中處理的方式,將各種告警信息集中到告警通信板分類處理后,再分別送到告警燈、告警箱和遠端網(wǎng)管中心。根據(jù)故障對設備的影響程度、重要性及緊迫性分為緊急故障、重要故障、一般故障和提示性故障等4個告警級別。
1.1緊急告警(一級告警)
緊急告警需要緊急處理,這種告警往往具有全局性,會導致主機癱瘓,對應紅色告警級別指示燈和急促鈴聲。如主機板故障、網(wǎng)板故障、時鐘板故障等,故障內(nèi)容涉及CPU、EMA、BNET、CNT、CTN、SNT、FBI等重要部件。
1.2重要告警(二級告警)
重要告警指局部范圍內(nèi)的單板或線路故障告警和事故告警,需要及時處理,否則會影響重要功能的實現(xiàn),如用戶板故障、數(shù)字中繼板故障等;對應信號為紅色指示燈及次急促鈴聲。故障內(nèi)容涉及SIG、MFC、DRV、ST、ASL、MC2、OPT及NOD等板件,以及信令鏈路故障等。
1.3一般告警(三級告警)
一般告警,指一般性的,描述各單板或線路工作是否工作的狀態(tài)故障告警和事故告警;提醒維護人員及時查找告警原因,消除故障隱患,對應信號為黃色指示燈及斷續(xù)鈴聲。故障內(nèi)容涉及單板復位、PCM告警等。
1.4警告告警(四級告警)
警告告警是提示性告警,指不會影響系統(tǒng)性能的提示性的故障告警和事故告警,如測試板告警,這種告警不會影響系統(tǒng)性能,不必及時處理,但對交換機運行狀態(tài)要做到心中有數(shù),對應信號為綠色指示燈及單次鈴聲。
在日常維護中,機房維護人員應從以下5個方面察看告警信息:一是機架行列告警燈,二是告警箱,三是維護終端的告警臺,四是單板指示燈,五是維護臺的“設備控制”單板狀態(tài)。另外有些故障可能在上述5處都無法查覺,而是來自用戶的申告。通過以上方面察看可以獲得告警信息和用戶申告信息。
2故障分析和處理的原則
C&C08的操作系統(tǒng)不僅具有各種軟件管理協(xié)調(diào)功能,同時還具有差錯分析和處理能力。對于機房維護人員來說,后者更具有重要現(xiàn)實意義。因為在實際操作中,我們可以利用交換機的差錯分析處理軟件對故障進行分析和判斷。
當C&C08的操作系統(tǒng)發(fā)出告警信息后,機房維護人員首先應根據(jù)告警的級別判斷障礙性質(zhì)、重要性及地點,并遵循以下原則對故障進行分析和處理:
(1) 處理重要事件時,首先要提取話單,以免話單丟失;
(2) 在能夠處理的范圍內(nèi),盡量不影響全局通話;
(3) 避免在話務量高峰時處理,最好在話務空閑時進行故障處理;
(4) 觀察單板指示燈和維護終端的狀態(tài),分析相關單板;
(5) 不要盲目更換單板,防止故障擴散;
(6) 插拔單板時,一定要帶防靜電腕套,并將接地端靠地連接。
3交換機的故障定位與處理方法
3.1C&C08交換機的測試診斷功能
C&C08具有較強的測試診斷功能。一方面,各智能單板都具有自檢功能,設備運行過程中,各智能單板可實時進行自檢,一旦發(fā)生故障將自動報警或倒換;另一方面可通過測試子系統(tǒng)向主機發(fā)送命令,對指定設備進行測試。
3.1.1測試系統(tǒng)的組成和基本原理
(1) 測試系統(tǒng)的組成。C&C08機的測試系統(tǒng)由硬件測試設備、主機軟件和終端軟件組成。硬件測試設備主要包括用戶電路測試板(TSS)、用戶模塊母板測試總線以及帶有自測功能的各種智能單板。測試系統(tǒng)的主機軟件是指運行于交換模塊MPU板的主機軟件中的TEST程序模塊。測試系統(tǒng)的終端軟件由BAM上的測試服務器和工作站上的測試臺組成。
(2) 測試系統(tǒng)的基本原理。測試子系統(tǒng)通過終端系統(tǒng)向主機發(fā)送人機命令,由主機下達相應的測試命令給相應的設備,啟動相應的測試任務。測試完成后將測試結果通過主機送回終端,由終端系統(tǒng)進行分析、統(tǒng)計、顯示與打印。
3.1.2測試系統(tǒng)的主要內(nèi)容
C&C08測試系統(tǒng)的主要內(nèi)容包括3個部分,即用戶電路測試、系統(tǒng)單板測試、測試系統(tǒng)自檢。
(1) 用戶電路測試。電路測試主要指對交換機用戶電路的各項性能或指標的測試。主要包括用戶內(nèi)線測試、用戶外線測試及用戶儀表測試。測試的性能指標包括:線路絕緣電阻、絕緣電壓、絕緣電容及用戶板性能測試。
(2) 系統(tǒng)單板測試。系統(tǒng)單板測試是指系統(tǒng)對23種單板提供的單板自檢功能,如MPU、EMA、BNET板等。各智能單板在平時即可進行實時自檢,一旦有故障將自動向終端發(fā)送告警信息。當測試系統(tǒng)向上列單板發(fā)出測試命令后,根據(jù)各單板返回的測試結果可判斷出各單板的運行狀態(tài),從面進行故障定位。
(3) 測試系統(tǒng)自檢。測試系統(tǒng)自檢主要是對測試板、測試總線的檢測,以防止因測試板或測試總線的原因?qū)е聹y試結果出現(xiàn)錯誤。
在日常的維護工作中,維護人員經(jīng)常需要利用交換系統(tǒng)提供的各種測試手段對設備出現(xiàn)的各類故障進行定位及定性分析,所以掌握交換機的各種測試內(nèi)容尤為重要。
3.2C&C08交換機故障分析和處理的方法
故障不同,故障的表現(xiàn)形式也不盡相同。機房維護人員要根據(jù)不同故障的表現(xiàn)形式,結合實際工作經(jīng)驗,判斷故障的級別,分析故障現(xiàn)象,找出故障產(chǎn)生的原因,并準確鎖定故障位置,迅速排除故障。C&C08交換機故障處理方法一般有以下5種:
(1) 排除法。某些故障由于涉及的故障點較多,應先羅列出故障現(xiàn)象及故障發(fā)生的可能性,根據(jù)話音和信令的流程進行分析,逐步排除。分析故障可能性時,要盡可能做到全面、客觀,不要有遺漏,實際排除可能性時,應從可能性低的開始排除,層層遞進。
(2) 對比法。參照本系統(tǒng)正常運行的設備或其他工作場地正常運行的設備數(shù)據(jù)作基準,仔細對比故障設備和正常設備之間的參數(shù)區(qū)別,分析故障發(fā)生的可能性,找出故障的準確位置。
(3) 替換法。對硬件設備故障的處理往往采用替換法。即當懷疑某個電路板出現(xiàn)問題時,維護人員可通過替換電路板的方法進行判斷和驗證。替換時應做到替換的正常設備要與被替換的設備完全相符,替換后進行相關的后續(xù)處理及恢復性的操作,如果一切恢復正常,則表示此故障為硬件設備發(fā)生問題。
(4) 數(shù)據(jù)修改、數(shù)據(jù)再設定法。此方法適用于軟件方面的故障鑒定。如果系統(tǒng)軟件在設計和編制時存在某種缺陷,或是系統(tǒng)參數(shù)、數(shù)據(jù)及用戶數(shù)據(jù)等出現(xiàn)某種錯誤,會導致系統(tǒng)不能在特定情況下正常執(zhí)行某些任務。當此類現(xiàn)象發(fā)生時,維護人員可采用數(shù)據(jù)修改或數(shù)據(jù)再設定的方法進行處理。
(5) 人工啟動和邏輯復位法。即重新啟動或復位法,一般采取按復位鍵,重新插拔單板,或者直接關閉電源重新復位,對單板的硬件、軟件進行邏輯初始化,使其恢復正常的工作狀態(tài)。此種方法一般是在單板硬件或軟件發(fā)生混亂而無法正中國論文聯(lián)盟www.Lwlm.com常工作的時候采用。