前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的網(wǎng)絡故障主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:網(wǎng)絡故障診斷;路由器;分層診斷技術;網(wǎng)絡接口
中圖分類號:TP393文獻標識碼:A
文章編號:1009-2374 (2010)25-0070-02
0引言
計算機網(wǎng)絡是指將地理位置不同的具有獨立功能的多臺計算機及其外部設備,通過通信線路連接起來,在網(wǎng)絡操作系統(tǒng),網(wǎng)絡管理軟件及網(wǎng)絡通信協(xié)議的管理和協(xié)調(diào)下,實現(xiàn)資源共享和信息傳遞的計算機系統(tǒng)。實現(xiàn)計算機網(wǎng)絡有四個基本要素:通信線路和通信設備;有獨立功能的計算機;網(wǎng)絡軟件軟件支持;實現(xiàn)數(shù)據(jù)通信與資源共享。所以網(wǎng)絡故障無非就是這四個方面的故障。本文先介紹網(wǎng)絡和路由器的基本概念,而后通過介紹網(wǎng)絡分層診斷技術來詳細闡述排除網(wǎng)絡連通性故障的方法。
1網(wǎng)絡與路由器概述
網(wǎng)絡診斷是一門綜合性技術,涉及網(wǎng)絡技術的方方面面。為方便下面的討論,首先回顧一下網(wǎng)絡和路由器的基本概念。
(1)計算機網(wǎng)絡按其覆蓋范圍通常被分為局域網(wǎng)和廣域網(wǎng)。局域網(wǎng)覆蓋地理范圍較小,一般在數(shù)米到數(shù)十公里之間。廣域網(wǎng)覆蓋地理范圍較大。按拓撲分類可分為總線型,星型,環(huán)形以及網(wǎng)狀網(wǎng)絡。
(2)為了完成計算機間的通信,把每部計算機互連的功能劃分成定義明確的層次,規(guī)定了同層進程通信的協(xié)議及相鄰層之間的接口和服務,將這些層、同層進程通信的協(xié)議及相鄰層之間的接口統(tǒng)稱為網(wǎng)絡體系結(jié)構(gòu)。國際標準化組織(ISO)提出的開放系統(tǒng)互連參考模型(OSI)是當代計算機網(wǎng)絡技術體系的核心。該模型將網(wǎng)絡劃分為7個層次:物理層、數(shù)據(jù)鏈路層、網(wǎng)絡層、傳輸層、會話層、表示層和應用層。
(3)Internet依靠TCP/IP協(xié)議,在全球范圍內(nèi)實現(xiàn)不同硬件結(jié)構(gòu)、不同操作系統(tǒng)、不同網(wǎng)絡系統(tǒng)的互聯(lián)。在Internet上,每一個節(jié)點都依靠唯一的IP地址互相區(qū)分和相互聯(lián)系。IP地址是一個32位二進制數(shù)的地址,由4個8位字段組成,每個字段之間用點號隔開,用于標識TCP/IP宿主機。
(4)路由器(Router)是用于連接多個邏輯上分開的網(wǎng)絡,所謂邏輯網(wǎng)絡是代表一個單獨的網(wǎng)絡或者一個子網(wǎng)。當數(shù)據(jù)從一個子網(wǎng)傳輸?shù)搅硪粋€子網(wǎng)時,可通過路由器來完成。因此,路由器具有判斷網(wǎng)絡地址和選擇路徑的功能,它能在多網(wǎng)絡互聯(lián)環(huán)境中,建立靈活的連接,可用完全不同的數(shù)據(jù)分組和介質(zhì)訪問方法連接各種子網(wǎng),路由器只接受源站或其他路由器的信息,屬網(wǎng)絡層的一種互聯(lián)設備。路由器技術始終處于核心地位。
2網(wǎng)絡故障診斷概述
網(wǎng)絡故障診斷有以下三方面的目的:確定網(wǎng)絡的故障點,恢復網(wǎng)絡的正常運行;找到網(wǎng)絡配置和規(guī)劃中的欠缺之處,改善和優(yōu)化網(wǎng)絡的性能;觀察網(wǎng)絡的運行狀況,及時預測網(wǎng)絡通信質(zhì)量。
網(wǎng)絡故障診斷以網(wǎng)絡原理、網(wǎng)絡配置和網(wǎng)絡運行的知識為基礎。從故障現(xiàn)象出發(fā),以網(wǎng)絡診斷工具為手段獲取診斷信息,確定網(wǎng)絡故障點,查找問題的根源,排除故障,恢復網(wǎng)絡正常運行。
網(wǎng)絡診斷可以使用包括局域網(wǎng)或廣域網(wǎng)分析儀在內(nèi)的多種工具:路由器診斷命令;網(wǎng)絡管理工具和其它故障診斷工具。CISCO提供的工具足以勝任排除絕大多數(shù)網(wǎng)絡故障。查看路由表,是解決網(wǎng)絡故障開始的好地方。ICMP的ping、trace命令和Cisco的show命令、debug命令是獲取故障診斷有用信息的網(wǎng)絡工具。
網(wǎng)絡故障的故障癥狀包括一般性和較特殊的。一般故障排除模式如下:第一步,當分析網(wǎng)絡故障時,首先要清楚故障現(xiàn)象;第二步,收集需要的可能的故障原因信息,充分了解故障現(xiàn)象;第三步,根據(jù)收集到的情況考慮可能的故障原因,然后根據(jù)具體故障現(xiàn)象排除不符合的故障原因;第四步,根據(jù)最后的可能的故障原因,建立一個診斷計劃;第五步,執(zhí)行診斷計劃,認真做好每一步測試和觀察,直到故障癥狀消失;第六步,每改變一個參數(shù)都要確認其結(jié)果。
3網(wǎng)絡故障分層診斷技術
3.1物理層及其診斷
物理層是第一層,它雖然處于最底層,卻是整個開放系統(tǒng)的基礎。物理層為設備之間的數(shù)據(jù)通信提供傳輸媒體及互連設備,為數(shù)據(jù)傳輸提供可靠的環(huán)境。
物理層的故障主要表現(xiàn)在設備的物理連接方式是否正確;MODEM、CSU/DSU等設備的配置及操作是否正確。可以使用show interface命令來檢查路由器各端口物理連接是否正常,檢查端口狀態(tài),EIA狀態(tài)和協(xié)議建立狀態(tài)。
3.2數(shù)據(jù)鏈路層及其診斷
數(shù)據(jù)鏈路層是OSI參考模型的第二層,該層解決兩個相鄰結(jié)點之間的通信問題,實現(xiàn)兩個相鄰結(jié)點鏈路上無差錯的協(xié)議數(shù)據(jù)單元傳輸。數(shù)據(jù)鏈路層傳輸?shù)膮f(xié)議數(shù)據(jù)單元稱為數(shù)據(jù)幀。數(shù)據(jù)鏈路層不關心數(shù)據(jù)包中包含什么信息,而僅是將其傳遞到網(wǎng)絡中的下一結(jié)點。
3.3網(wǎng)絡層及其診斷
網(wǎng)絡層提供建立、保持和釋放網(wǎng)絡層連接的手段,包括路由選擇、流量控制、傳輸確認、中斷、差錯及故障恢復等。
排除網(wǎng)絡層故障的基本方法是:沿著從源到目標的路徑,查看路由器路由表,同時檢查路由器接口的IP地址。如果路由沒有在路由表中出現(xiàn),應該通過檢查來確定是否已經(jīng)輸入適當?shù)撵o態(tài)路由、默認路由或者動態(tài)路由。然后手工配置一些丟失的路由,或者排除一些動態(tài)路由選擇過程的故障,包括RIP或者IGRP路由協(xié)議出現(xiàn)的故障。
4路由器接口故障排除
4.1串口故障排除
串口出現(xiàn)連通性問題時,為了排除串口故障,一般是從show interface serial命令開始,分析它的屏幕輸出報告內(nèi)容,找出問題之所在。串口報告的開始提供了該接口狀態(tài)和線路協(xié)議狀態(tài)。接口和線路協(xié)議的可能組合有以下幾種:串口運行、線路協(xié)議運行,這是完全的工作條件。該串口和線路協(xié)議已經(jīng)初始化,并正在交換協(xié)議的存活信息;串口運行、線路協(xié)議關閉,這個顯示說明路由器與提供載波檢測信號的設備連接,表明載波信號出現(xiàn)在本地和遠程的調(diào)制解調(diào)器之間,但沒有正確交換連接兩端的協(xié)議存活信息;串口和線路協(xié)議都關閉,可能是電信部門的線路故障、電纜故障或者是調(diào)制解調(diào)器故障;串口管理性關閉和線路協(xié)議關閉,這種情況是在接口配置中輸入了shutdown命令。通過輸入no shutdown命令,打開管理性關閉。
正常通信時接口輸入或輸出信息包不應該丟失,或者丟失的量非常小,而且不會增加。如果信息包丟失有規(guī)律性增加,表明通過該接口傳輸?shù)耐ㄐ帕砍^接口所能處理的通信量。解決的辦法是增加線路容量。
4.2以太接口故障排除
以太接口的典型故障問題是:帶寬的過分利用;碰撞沖突次數(shù)頻繁;使用不兼容的類型。使用show interface ethernet命令可以查看該接口的吞吐量、碰H沖突、信息包丟失、和類型的有關內(nèi)容等。
(1)通過查看接口的吞吐量可以檢測網(wǎng)絡的利用。如果網(wǎng)絡廣播信息包的百分比很高,網(wǎng)絡性能開始下降。光纖網(wǎng)轉(zhuǎn)換到以太網(wǎng)段的信息包可能會淹沒以太口?;ヂ?lián)網(wǎng)發(fā)生這種情況可以采用優(yōu)化接口的措施,即在以太接口使用no ip route-cache命令,禁用快速轉(zhuǎn)換,并且調(diào)整緩沖區(qū)和保持隊列。
(2)兩個接口試圖同時傳輸信息包到以太電纜上時,將發(fā)生碰H。以太網(wǎng)要求沖突次數(shù)很少,不同的網(wǎng)絡要求是不同的,一般情況發(fā)現(xiàn)沖突每秒有三五次就應該查找沖突的原因了。
(3)如果節(jié)點的物理連接正常,接口和線路協(xié)議報告運行狀態(tài)也正常,可是還是不能通信。原因可能是兩個節(jié)點使用了不兼容的幀類型。可以嘗試重新配置使用相同幀類型。
4.3異步通信口故障排除
互聯(lián)網(wǎng)絡的運行中,異步通信口的任務是為用戶提供可靠服務,但又是故障多發(fā)部位。
異步通信口故障一般的外部因素是:撥號鏈路性能低劣;電話網(wǎng)交換機的連接質(zhì)量問題;調(diào)制解調(diào)器的設置。如果調(diào)制解調(diào)器丟失了它的設置,應采用一種方法來初始化遠程調(diào)制解調(diào)器。簡單的辦法是使用可通過前面板配置的調(diào)制解調(diào)器,另一種方法是將調(diào)制解調(diào)器接到路由器的異步接口,建立反向telnet,發(fā)送設置命令配置調(diào)制解調(diào)器。
show interface async 命令、show line命令是診斷異步通信口故障使用最多的工具。show interface async 命令輸出報告中,接口狀態(tài)報告關閉的唯一的情況是接口沒有設置封裝類型。線路協(xié)議狀態(tài)顯示與串口線路協(xié)議顯示相同。show line命令顯示接口接收和傳輸速度設置以及EIA狀態(tài)顯示。show line命令可以認為是接口命令(show interface async)的擴展。show line命令輸出的EIA信號及網(wǎng)絡狀態(tài):
noCTS noDSR DTR RTS:調(diào)制解調(diào)器未與異步接口連接。
CTS noDSR DTR RTS:調(diào)制解調(diào)器與異步接口連接正常,但未連接遠程調(diào)制解調(diào)器。
CTS DSR DTR RTS:遠程調(diào)制解調(diào)器撥號進入并建立連接。
確定異步通信口故障一般可用下列步驟:檢查電纜線路質(zhì)量;檢查調(diào)制解調(diào)器的參數(shù)設置;檢查調(diào)制解調(diào)器的連接速度;檢查rxspeed 和txspeed是否與調(diào)制解調(diào)器的配置匹配;通過show interface async 命令和 show line命令查看端口的通信狀況;從show line命令的報告檢查EIA狀態(tài)顯示;檢查接口封裝;檢查信息包丟失及緩沖區(qū)丟失情況。
5結(jié)語
網(wǎng)絡發(fā)生故障是不可避免的。網(wǎng)絡建成運行后,網(wǎng)絡故障診斷是網(wǎng)絡管理的重要技術工作。搞好網(wǎng)絡的運行管理和故障診斷工作,提高故障診斷水平需要注意以下幾方面的問題:認真學習有關網(wǎng)絡技術理論;清楚網(wǎng)絡的結(jié)構(gòu)設計,包括網(wǎng)絡拓樸、設備連接、系統(tǒng)參數(shù)設置及軟件使用;了解網(wǎng)絡正常運行狀況、注意收集網(wǎng)絡正常運行時的各種狀態(tài)和報告輸出參數(shù);熟悉常用的診斷工具,準確的描述故障現(xiàn)象。
參考文獻
[1] 李江,戴金萍,彭婷.淺談醫(yī)院網(wǎng)絡常見故障的分類診斷[J].中國管理信息化,2010,(7).
[2] 莊保新.網(wǎng)絡中的常見故障診斷及分析[J].硅谷,2010,(8).
[3] 代樹強.計算機網(wǎng)絡日常維護方略[J].硅谷,2010,(1).
關鍵詞:網(wǎng)絡故障 物理故障 邏輯故障
中圖分類號:TP393.1 文獻標識碼:A 文章編號:1672-3791(2013)02(a)-0022-01
為適應職業(yè)教育的快速發(fā)展,校園網(wǎng)絡成為了學校必不可少教學設施。隨著校園網(wǎng)絡建設規(guī)模的不斷擴大,各種網(wǎng)絡設備的使用量也大大增加,網(wǎng)絡出現(xiàn)故障的頻率也越來越高。由于網(wǎng)絡具有多樣性和復雜性的特點,當遇到網(wǎng)絡故障時,就需要網(wǎng)絡管理者利用豐富的實踐經(jīng)驗和網(wǎng)絡知識進行綜合分析。本文就從網(wǎng)絡故障的性質(zhì)進行分析,希望能給予大家一定的幫助。
1 網(wǎng)絡物理故障的分析排查
網(wǎng)絡物理故障通常包括線路故障、端口故障、設備故障等,就是指因各種網(wǎng)絡設備和線路引發(fā)的故障。下面筆者就對幾類常見的物理故障進行分析排查。
1.1 線路故障排查
線路故障是網(wǎng)絡故障中最常見和最頻繁的一類故障,日常的網(wǎng)絡維護中排查線路就是處理故障的一個重要方法。
(1)線路不通。
當線路不通時,首先檢查水晶頭是否接觸不良或掉出,還可使用網(wǎng)絡電纜測試儀對故障線路兩端進行測試,通過測試可分析是否為線路損壞,這類故障比較容易排查,重新更換網(wǎng)線或重做水晶頭即可解決。
錯誤的線序也是導致線路不通的重要原因,根據(jù)網(wǎng)絡規(guī)范要求,各類設備之間的連接需采用交叉線或直通線連接(T568A或T568B)。這類故障通過測試儀也能排查出來。
1.2 端口故障排查
常見的端口故障主要是指網(wǎng)絡設備端口的故障,包括路由器端口、網(wǎng)卡端口等。由于長時間的氧化作用,導致網(wǎng)絡設備的端口接觸不良或損壞。
(1)利用設備信號燈。
網(wǎng)卡、交換機都有狀態(tài)指示燈,當設備端口出現(xiàn)故障時,在設備上的信號燈就會出現(xiàn)提示。以交換機450T為例,“綠色”表示100M連接,“桔黃色”表示10M連接,“閃爍”表示此端口被禁用,“不亮”表示無連接。通過對信號燈的狀態(tài)分析,判斷出可能發(fā)生的故障范圍和原因,處理時可轉(zhuǎn)接至空閑端口調(diào)試,看是否可以正常通信,從而判定是否是端口問題。
1.3 路由器故障排查
在實踐經(jīng)驗中,路由器由于運行環(huán)境或自身硬件配置等原因,可能會出現(xiàn)路由器CPU溫度過高、CPU利用率過高和路由器內(nèi)存余量太小等故障。
(1)CPU溫度過高。
如果CPU溫度過高可能導致路由器燒毀,這是最容易被忽視的故障。由于機房環(huán)境的原因,導致路由器灰塵積聚、熱量無法散出,從而使路由器的負載過高。預防此類故障就要從常規(guī)管理中做起,在做好網(wǎng)絡設計的同時,更要保證機房環(huán)境。
(2)CPU利用率太高、可用內(nèi)存容量太小。
此類故障會對網(wǎng)絡提供服務的質(zhì)量與速度產(chǎn)生影響。檢測這類故障時,需要利用MIB變量瀏覽器工具,從路由器MIB變量中讀出有關的數(shù)據(jù),通常情況下網(wǎng)絡管理系統(tǒng)有專門的管理進程不斷地檢測路由器的關鍵數(shù)據(jù),并及時給出報警。要想有效的解決這種故障,通常的方法就是對路由器進行硬件升級,或者重新規(guī)劃網(wǎng)絡的拓撲結(jié)構(gòu)。
2 網(wǎng)絡邏輯故障的分析排查
邏輯故障通常包括網(wǎng)絡設備配置錯誤、端口參數(shù)設定不正確等,就是指通過軟件重新配置相關參數(shù)即可解決的故障。下面筆者對幾類常見的邏輯故障進行分析排查。
2.1 設備配置錯誤
(1)路由器配置錯誤。
路由器配置錯誤導致的故障分析解決時相對復雜,需要對配置方法和參數(shù)比較熟悉。當發(fā)現(xiàn)網(wǎng)絡中某條線路沒有流量,但可以Ping通線路兩端的端口,這時很可能是路由器錯誤導致的死循環(huán)。診斷該故障可以用Traceroute命令,可以發(fā)現(xiàn)在Traceroute結(jié)果中某一段之后,兩個IP地址循環(huán)出現(xiàn)。這時可能就是線路遠端把端口路由器再次指向了線路近端,最終導致IP包在該線路上來回反復傳遞。解決這種故障時,需要把遠端路由器的端口配置進行更改,并將路由設置為正確配置,從而排除問題。
(2)網(wǎng)卡參數(shù)設置故障。
在網(wǎng)卡設置中,常見的邏輯故障主要包括與其他硬件的I/O地址、IRQ、DMA等發(fā)生沖突,另外就是網(wǎng)卡的驅(qū)動程序未能正確安裝。如果出現(xiàn)沖突故障時,打開“控制面板-系統(tǒng)-設備管理”窗口查找原因,嘗試更改網(wǎng)卡的IRQ或I/O地址等;驅(qū)動程序安裝不正確,可在“網(wǎng)絡適配器”窗口中查看網(wǎng)卡設備有無黃色“!”或紅色“×”號,如有可判定為網(wǎng)卡的驅(qū)動程序未能成功安裝,這時可找到相應的驅(qū)動程序重新安裝。
(3)主機配置故障。
主機由于配置不當而產(chǎn)生故障最為常見,其故障可分為IP地址沖突、安全配置不完善等。當某主機IP地址配置與其他主機發(fā)生沖突時,或IP地址不在子網(wǎng)范圍之內(nèi),都會導致該主機無法正常連通。主機安全配置不完善時,惡意攻擊者可以利用主機上沒有控制的Finger、RPC、rlogin等服務對主機進行攻擊,甚至造成主機資源外泄或遭到非法控制等。因此完善的主機安全配置是保護主機的重要手段。
2.2 重要進程或端口意外關閉
在網(wǎng)絡中,當一些關于網(wǎng)絡連接數(shù)據(jù)參數(shù)的重要進程或端口受系統(tǒng)或病毒的影響時,會導致出現(xiàn)意外關閉的情況。常見的故障有路由器的SNMP進程意外關閉或死掉,當發(fā)生這種故障時,網(wǎng)絡管理系統(tǒng)將不能從路由器中采集到任何數(shù)據(jù),網(wǎng)絡管理系統(tǒng)也因此失去了對該路由器的控制。解決此類故障時可利用Ping命令,如果發(fā)現(xiàn)線路近端的端口Ping不通,這時應檢查該端口是否處于Down狀態(tài),如果是說明該端口已經(jīng)關閉,從而導致故障發(fā)生。處理時只需要重新啟動該端口應可以使線路恢復連通。
3 網(wǎng)絡管理和故障排查經(jīng)驗
(1)排查雙絞線:網(wǎng)絡中大約一半以上的網(wǎng)絡故障產(chǎn)生于雙絞線,其主要原因是由于水晶頭質(zhì)量不合格、線路老化、與設備端口接觸不良、線序不符合標準等所造成,也是主要的排查對象。
(2)排查網(wǎng)絡配置:配置錯誤是較難分析和解決的故障,一般情況下需檢查計算機的IP地址、子網(wǎng)掩碼、網(wǎng)關、相關協(xié)議(如TCP/IP協(xié)議)和DNS服務器的設置是否正確。
(3)保存網(wǎng)絡資料:網(wǎng)絡資料需要分類保管,當發(fā)生故障時可通過資料及時對比調(diào)試來解決問題。常用的資料包括網(wǎng)絡的設計方案、網(wǎng)絡布線圖、用戶上網(wǎng)端口表、交換機端口配置表等。
(4)維護機房環(huán)境:網(wǎng)絡設備的運行對機房環(huán)境要求很高,要做到科學規(guī)劃、合理布局,對電氣、衛(wèi)生、溫度、電磁干擾等因素不要忽視。
(5)檢查電源:網(wǎng)絡發(fā)生故障時,電源故障是最容易被忽略的,不能因沒掉電,就判定電源就沒問題,如果遇到莫名其妙的故障時,可以事先檢查一下電源是否正常。
無論什么類型的網(wǎng)絡故障,只要能掌握網(wǎng)絡的故障性質(zhì),逐步進行分析排查,最終還是可以找到相應的解決方法的。作為網(wǎng)絡管理者,在維護日常網(wǎng)絡運行環(huán)境的同時,要善于學習知識,認真分析思考,不斷總結(jié)經(jīng)驗,掌握一套自己的網(wǎng)絡故障排查方法。
參考文獻
計算機網(wǎng)絡技術的普及和發(fā)展,給人們的生存方式帶來了巨大的變革。人們通過計算機網(wǎng)絡獲取資源、交換信息已經(jīng)成為一種常態(tài),但在網(wǎng)絡的使用過程中難免會存在各種問題,對人們的學習、工作和生活造成不便,甚至影響到關鍵數(shù)據(jù)和經(jīng)濟財產(chǎn)的安全。因此,了解計算機網(wǎng)絡的常見故障和處理方法尤為重要。
1 計算機網(wǎng)絡的故障類型
計算機網(wǎng)絡故障一般可分為物理故障和邏輯故障兩類。
物理故障是指由于硬件原因引起的網(wǎng)絡故障,常常表現(xiàn)為本地連接斷開、網(wǎng)絡時斷時續(xù)等。常見的物理故障包括網(wǎng)線損壞、路由器和交換機故障、網(wǎng)卡損壞、元件接觸不良等。
邏輯故障通常表現(xiàn)為本地連接受限、網(wǎng)絡不穩(wěn)定、瀏覽器顯示異常等。邏輯故障主要由計算機網(wǎng)絡參數(shù)錯誤、網(wǎng)卡驅(qū)動不兼容、路由器配置不合理和病毒入侵等原因造成。
2 計算機網(wǎng)絡故障的診斷方法
計算機網(wǎng)絡故障具有多變性和復雜性,涉及網(wǎng)線、網(wǎng)卡、路由器、病毒等多方面原因,當計算機網(wǎng)絡發(fā)生故障時,我們可以根據(jù)經(jīng)驗初步判斷故障類型,逐層排查,最終確定故障所在。計算機網(wǎng)絡故障的診斷應從三個方面入手。[1]
1)先檢查可直接觀察和判斷情況的外部設備,如網(wǎng)線是否損壞、路由器指示燈是否正常等,再考慮設備內(nèi)部的軟硬件問題。
2)先檢查是否為本地計算機的網(wǎng)絡故障,如病毒入侵、驅(qū)動程序損壞、網(wǎng)卡松動等,再考慮網(wǎng)絡鏈路、路由器、交換機的故障。
3)先檢查計算機、路由器的網(wǎng)絡參數(shù)配置,如果沒有問題,再考慮設備的硬件故障。
3 常見故障的分析和處理方法
3.1 物理故障
1)線路連接問題
線路連接問題是硬件故障中最常見的一種,占所有網(wǎng)絡故障的70%以上。[2]常見的線路故障包含接口松動、線路損壞和電磁干擾三類,例如路由器或交換機的電源插頭未通電、RJ45水晶頭損壞或松動、網(wǎng)線因擠壓和拉扯而損壞、周邊有較強電磁波干擾等。線路連接的檢測可通過替換排除法和專業(yè)儀器測試的方式進行。對于水晶頭和線路損壞等問題,可通過更換來解決;對于電磁干擾問題,則可選用屏蔽強度較高的網(wǎng)線。
2)路由器和交換機故障
路由器和交換機是計算機網(wǎng)絡中路由轉(zhuǎn)發(fā)和數(shù)據(jù)交換的核心設備,是局域網(wǎng)內(nèi)設備能否連通廣域網(wǎng)的關鍵。路由器和交換機故障主要是指物理損壞,造成設備不能通電、端口故障等問題,可通過信號燈的狀態(tài)和替換排除法進行判斷。
信號燈的狀態(tài)直接反映了路由器和交換機的工作狀態(tài),如系統(tǒng)運行和端口連通是否正常。在使用替換排除法時,可將網(wǎng)線逐個連接到路由器和交換的端口進行檢測,如果部分端口連通正常,則可判定為設備的端口故障;如果所有端口均不能連通,則可判定為零部件發(fā)生故障。如果路由器不能加電而電源線連通正常,則考慮是路由器的電源問題。
3)計算機網(wǎng)卡問題
計算機網(wǎng)卡發(fā)生故障,也將導致網(wǎng)絡連接出現(xiàn)問題,常見的故障包括網(wǎng)卡松動、網(wǎng)卡金手指氧化、網(wǎng)卡硬件故障、卡槽損壞等。網(wǎng)卡的故障檢測分為兩個步驟進行:(拔出網(wǎng)卡,仔細清理卡槽內(nèi)的灰塵,用橡皮擦小心擦拭網(wǎng)卡金手指,之后重新插入卡槽,如果恢復正常則認定為網(wǎng)卡松動和金手指氧化所引起的接觸不良。(如步驟一無法恢復正常,可將正常使用的網(wǎng)卡更換到故障計算機中,如果問題得以解決則說明是網(wǎng)卡硬件故障,更換網(wǎng)卡即可,否則就可能是網(wǎng)卡的插槽損壞。
3.2 邏輯故障
1)路由器參數(shù)配置問題
路由器在購買和安裝之后通常需要進行參數(shù)配置,包括網(wǎng)絡參數(shù)、DHCP、安全管理等設置,如果參數(shù)配置錯誤,則會引起網(wǎng)絡連接不上、經(jīng)常掉線等問題。路由器的參數(shù)配置首先是WAN口的配置,需要根據(jù)具體的網(wǎng)絡環(huán)境設置WAN口的連接類型和連接模式,例如靜態(tài)IP還是PPPOE撥號、是自動連接還是定時連接等。
在一些大型的局域網(wǎng)環(huán)境中,難以做到給每一臺計算機進行參數(shù)分配,為了避免IP地址沖突和提高使用運行效率,還需進行DHCP服務器的配置,如果參數(shù)配置出現(xiàn)問題,則會影響整個局域網(wǎng)的連接。此外,有些路由器還進行了安全管理設置,如訪問限制、防火墻和遠程web端口的設置等,都影響了用戶的網(wǎng)絡連接。
2)計算機網(wǎng)絡配置問題
計算機的網(wǎng)絡配置主要是指通信協(xié)議(TCP/IP)的配置,通信協(xié)議被破壞或遭到篡改都會導致網(wǎng)絡連接故障。當計算機出現(xiàn)網(wǎng)絡連接受限等提示時,應首先檢查TCP/IP的設置是否正確,如是否設置了靜態(tài)IP和DNS服務器的地址,以及IP地址是否和路由器在同一個網(wǎng)段等。如果網(wǎng)絡連接正常,QQ能正常使用但不能訪問瀏覽器網(wǎng)頁時,則往往是DNS的配置出現(xiàn)錯誤,一般來說,重新設置DNS服務器的地址即可解決問題。
3)計算機網(wǎng)卡驅(qū)動程序問題
計算機網(wǎng)卡驅(qū)動程序的問題一般分為兩種:驅(qū)動程序未安裝或被卸載、驅(qū)動程序與網(wǎng)卡不兼容。使用者由于誤操作而刪除驅(qū)動程序和相關文件的事情時有發(fā)生,造成網(wǎng)絡連接錯誤或找不到本地連接等問題,可打開設備管理器,查看網(wǎng)絡適配器的運行狀態(tài),如果有黃色問號或運行不正常等提示,則卸載驅(qū)動程序重新進行安裝。
網(wǎng)卡驅(qū)動程序不兼容的問題常常出現(xiàn)在重裝電腦的過程中,造成驅(qū)動程序無法安裝或網(wǎng)絡連接故障等,可對驅(qū)動程序進行升級,或下載官方驅(qū)動程序重新安裝,一般可解決問題。
4)網(wǎng)絡病毒攻擊和黑客入侵問題
網(wǎng)絡病毒攻擊和黑客入侵波及范圍大、危害程度高,是最常見網(wǎng)絡故障誘因之一,可造成計算機網(wǎng)絡訪問異常、整個局域網(wǎng)運行緩慢、核心設備參數(shù)被篡改、關鍵數(shù)據(jù)被盜取等種種問題,嚴重的可引起整個網(wǎng)絡癱瘓、造成經(jīng)濟損失和威脅人身安全,是計算機網(wǎng)絡安全防護的重中之重。一旦出現(xiàn)網(wǎng)絡連接異常和安全信息提示時,應立即進行漏洞修復、病毒掃描等相關處理。此外,路由器、防火墻等核心網(wǎng)絡設備的管理賬號和口令應具備較高的復雜性,以提高網(wǎng)絡安全防護性能。
4 計算機網(wǎng)絡的維護
為了減少網(wǎng)絡故障的發(fā)生、提高網(wǎng)絡運行的效率和安全性,在使用過程中,我們還需對計算機網(wǎng)絡進行合理的維護,主要包括以下幾方面。
1)定期檢查設備的運行情況
定期檢查計算機、路由器、交換機等設備的運行情況,對出現(xiàn)故障的設備進行及時的維修和更換,避免因設備的突然損壞造成不必要的損失;同時應對軟件系統(tǒng)進行維護和更新,及時修復系統(tǒng)漏洞、安裝系統(tǒng)更新、升級安全防護軟件,保證網(wǎng)絡的穩(wěn)定運
2)加強安全防護措施
加強路由器的安全性措施,限制系統(tǒng)的物理訪問,禁用不必要的功能和端口,嚴格管理登錄賬號和口令,防止病毒攻擊和黑客入侵;[3]還可設置一定的網(wǎng)絡訪問限制,規(guī)定哪些網(wǎng)站用戶不可訪問,避免用戶因誤操作而帶來的安全隱患。
3)保持網(wǎng)絡機房的環(huán)境衛(wèi)生
計算機、路由器等設備在使用的過程中,CPU、主板、風扇、卡槽等部位容易積累大量的灰塵?;覊m會影響設備的散熱性能,造成零部件的接觸不良,加速設備的老化,而且容易引發(fā)靜電,可能導致元件的損壞。因此,需定期對設備進行除塵,保持網(wǎng)絡機房的環(huán)境衛(wèi)生。
5 結(jié)束語
隨著科學技術的發(fā)展,計算機網(wǎng)絡已經(jīng)成為人們生活的重要組成部分,了解計算機網(wǎng)絡的常見故障和處理方法,重視計算機網(wǎng)絡的日常維護,才能使我們做到在故障發(fā)生前積極防范、在故障發(fā)生后迅速補救,使網(wǎng)絡的運行更穩(wěn)定、更高效、更安全。
故障現(xiàn)象:一輛2011年產(chǎn)奧迪Q5運動型多功能車,行駛里程1.5萬km,用戶反映該車信息娛樂顯示屏黑屏,但是有聲音,其他功能正常。
檢查分析:維修人員接車后確認故障現(xiàn)象同用戶所描述的一樣,分別打開收音機和DVD播放機,都能聽見聲音,但顯示屏無顯示。該車采用第三代MMI多媒體交互系統(tǒng),其光纖網(wǎng)絡(MOST)結(jié)構(gòu)如圖1。從中可以看出前部信息控制單元J685(即前部顯示屏)并不在MOST系統(tǒng)上,而是通過LIN線與信息系統(tǒng)控制單元(J794)相連的。該車只是顯示屏黑屏,沒有影響到其他功能,也說明MOST總線上的信號傳遞沒有受到影響,能正常傳遞信號。
連接VAS5052診斷儀,檢查控制單元故障存儲器內(nèi)的故障碼,有故障碼02259——前部信息控制單元J685無信號(圖2)。分析故障碼的可能原因有:供電熔絲SD3熔斷;熔絲前供電問題;熔絲到J685的線路故障;J794和J685之間的LIN總線短路或斷路;J685本身故障。于是按照這一思路逐項檢查。
根據(jù)電路圖檢查J685供電熔絲SD3,正常i測量SD3熔絲輸入端的電壓,為蓄電池電壓。拆下顯示屏J685,斷開其后部的插接器,用萬用表測量其供電線,發(fā)現(xiàn)電壓為0 V,說明熔絲到J685之間的線路出現(xiàn)故障。拔下熔絲仔細檢查線路導通性時,發(fā)現(xiàn)熔絲盒上的針腳太大,熔絲連接松曠,處于斷路狀態(tài)。原來這便是故障根源。
故障排除:處理熔絲盒上的針腳,保證其連接可靠,裝復試車,故障排除。
故障2 關鍵詞:MOST診斷線
故障現(xiàn)象:一輛201 2年產(chǎn)奧迪A6L轎車,行駛里程9083 km,用戶反映該車信息娛樂系統(tǒng)癱瘓無法使用,按壓操作面板任何按鍵均無反應,顯示屏黑屏。
檢查分析:維修人員接車后檢查發(fā)現(xiàn)MMl顯示屏只能伸出一些,完全無法正常使用。連接診斷儀VAS5052檢測,在數(shù)據(jù)總線診斷控制單元(J533)中有故障碼U104900——光纖數(shù)據(jù)總線斷路。讀取網(wǎng)關列表,發(fā)現(xiàn)有關MOST總線的控制單元都無法達到。
造成這種現(xiàn)象的原因是,當某個控制單元向光纖發(fā)送光信號時,此信號會一直沿著光纖傳遞下去,直到該控制單元再次接受到這個信號,才會終止這個信號的傳遞。這樣就形成了一個由光纖連接所有MOST總線控制單元的環(huán)形結(jié)構(gòu)。當其中任何一個控制單元或者光纖出現(xiàn)故障時,無法形成回路,就會使整個系統(tǒng)處于癱瘓狀態(tài),所有控制單元都無法診斷。
為了能準確判斷故障,MOST系統(tǒng)在開發(fā)時就在每個控制單元上安裝了1根并聯(lián)的診斷線(圖3)。J533的“回路中斷診斷”功能通過此診斷線向MOST系統(tǒng)中的各控制單元發(fā)送信號,要求各控制單元檢查自身的功能、供電和搭鐵,并在光纖上發(fā)送光信號,同時通過光纖接收上一個控制單元發(fā)出的光信號。檢查完畢后,各控制單元通過診斷線向主控單元J533反饋一個信號(包括控制單元自身的功能、供電和搭鐵是否正常,是否發(fā)送了光信號,是否接收到上一個控制單元發(fā)出的光信號)。
J533根據(jù)這些信號會判斷出是哪個控制單元出現(xiàn)電器故障或是光學故障。J533先診斷電器故障然后再診斷光學故障,電氣正常(控制單元的供電和搭鐵正常)是判斷光學故障的基礎。當J533診斷出某控制單元光學故障時,系統(tǒng)只能判斷出這個控制單元沒有檢測到光信號,無法判斷出是自身接收信號的問題,還是上一個控制單元發(fā)出的信號問題,或是這2個控制單元之間的光纖存在故障。這就需要進一步確定故障的原因,可以采用短接法,即不經(jīng)過報出故障碼的控制單元而讓光纖直接形成回路。這樣可以快速確定是否該控制單元自身問題。此種方法必須在形成最小的光纖回路上有2個控制單元:數(shù)據(jù)總線診斷控制單元(J533)和信息系統(tǒng)控制單元(J794)。
維修人員連接VAS5052診斷儀,選擇引導功能進入J533,選擇回路中斷診斷測試,根據(jù)提示選擇相應的配置,診斷結(jié)果如圖4。系統(tǒng)給出的電器方面的故障原因有:熔絲有故障:控制單元供電中斷:控制單元有故障;控制單元診斷線斷路。
檢查MOST系統(tǒng)中所有控制單元的熔絲和搭鐵,均正常。而信息系統(tǒng)控制單元(J794)、儀表板控制單元(J285)和收音機(R)這3個控制單元同時損壞的概率很低。因此,維修人員把檢查方向主要放在了控制單元的診斷線上。查閱電路圖(圖5),發(fā)現(xiàn)診斷線是和所有MOST系統(tǒng)上的控制單元并聯(lián)在一起的。測量J533的T32b插接器32號腳,電壓11.5 V,在正常范圍內(nèi)(J533診斷線有電壓輸出,說明控制單元正常)。再分別測量該針腳與J285的T32插接器1號腳、J794的T8h插接器7號腳以及收音機T101插接器的11號腳之間的導通性,發(fā)現(xiàn)均為斷路。繼續(xù)測量發(fā)現(xiàn),J285的T32插接器1號腳和J794的T8h插接器7號腳之間的導線是導通的,由此可以初步判定,J533到診斷線結(jié)點之間的導線存在問題。于是維修人員沿著這一線束查找斷點,在拆除地毯后發(fā)現(xiàn)J533與總線線束連接的地方線束破損。
然而,修復線束后啟動MMI系統(tǒng),還是無法打開。維修人員再次連接診斷儀,執(zhí)行回路中斷診斷測試,系統(tǒng)再次診斷出收音機故障(圖6)。檢查收音機熔絲,沒有熔斷,斷開收音機上的插接器測量,有12V供電電壓,但是發(fā)現(xiàn)收音機插接器上的供電端插孔比較松曠,造成接觸不良。
關鍵詞:計算機網(wǎng)絡故障;步驟;工具;維護
中圖分類號:TP393文獻標識碼:A文章編號:1009-3044(2009)26-7362-02
Failure and Maintenance of Computer Networks
LUO Xiu-di
(The State Administration of Radio Film and Television Station 751, Shaowu 354011, China)
Abstract: The failure of computer networks have been classified in a computer network failure put forward for resolving the general steps, common tools, as well as common computer network fault diagnosis and treatment.
Key words: computer network failure; steps; tools; maintenance
隨著電子政務、企業(yè)信息化和電子商務的迅速發(fā)展,計算機網(wǎng)絡正在融人社會生活的各個方面。計算機網(wǎng)絡的廣泛應用帶來了許多便利,人們對網(wǎng)絡的穩(wěn)定運行提出越來越高的要求。但隨之而來的網(wǎng)絡故障也帶來了很多煩惱,輕則影響用戶網(wǎng)絡運行質(zhì)量,重則導致整個網(wǎng)絡癱瘓,帶來巨大的經(jīng)濟損失。在網(wǎng)絡出現(xiàn)故障時要做到及時發(fā)現(xiàn)網(wǎng)絡故障、準確定位網(wǎng)絡故障并且能及時排除故障就顯得特別重要。
1 網(wǎng)絡故障的分類
計算機網(wǎng)絡按不同的方法可以分為許多種類[1],下面介紹常見的三種分類方法。
1.1 按故障性質(zhì)分類
以網(wǎng)絡故障的性質(zhì)可分為物理故障和邏輯故障。物理故障也稱為硬件故障,一般指的是設備或線路損壞、插頭松動、線路受到嚴重電磁干擾等情況,或為人為疏忽導致網(wǎng)絡連接錯誤等現(xiàn)象。此類故障所引起的故障表現(xiàn)通常是時斷時續(xù)或網(wǎng)絡完全斷開。
邏輯故障也稱為軟件故障,主要是軟件安裝或配置錯誤引起的網(wǎng)絡異?;蚬收?相對來說比硬件故障要復雜得多。主要是網(wǎng)卡驅(qū)動問題、網(wǎng)絡協(xié)議問題、IP地址沖突問題等。通常表現(xiàn)為無法瀏覽網(wǎng)頁、時斷時續(xù)、網(wǎng)速緩慢等。
1.2 按TCP/IP模型分類
TCP/IP協(xié)議將網(wǎng)絡分為四層,分別是網(wǎng)絡接入層,網(wǎng)絡層,傳輸層和應用層。各層中的主要故障劃分為網(wǎng)絡接入層故障、網(wǎng)絡層故障、傳輸層故障和應用層故障。
1.3 按覆蓋范圍分類
按照網(wǎng)絡故障覆蓋的區(qū)域劃分,可分為小范圍故障、網(wǎng)段內(nèi)故障、局域網(wǎng)故障和廣域網(wǎng)連接故障等。
2 網(wǎng)絡故障診斷和排除的一般步驟
網(wǎng)絡故障診斷以網(wǎng)絡原理、網(wǎng)絡配置和網(wǎng)絡運行的知識為基礎。從故障現(xiàn)象出發(fā),以網(wǎng)絡診斷工具為手段獲取診斷信息,確定網(wǎng)絡故障點,查找問題的根源,排除故障,恢復網(wǎng)絡正常運行[2]。
2.1 了解故障,歸納癥狀,找出故障點
排除網(wǎng)絡故障的第一步就是要確定故障的具體現(xiàn)象,發(fā)現(xiàn)癥結(jié)所在,并確定其對網(wǎng)絡產(chǎn)生的影響。搜集與當前故障相關的準確信息,縮小故障原因排查范圍。尋找故障點的思路為:嘗試重新執(zhí)行用戶任務再現(xiàn)故障狀況,排除應用程序操作不當、權限設置問題、本地計算機故障等原因,然后再將故障原因鎖定在網(wǎng)絡系統(tǒng),再逐步明確到服務器、路由器、集線器或線纜等特定組件;最后再將各特別組件故障的原因定位到部件的軟件故障還是硬件故障上。
2.2 確定原因,制定實施解決方案,測試效果
在網(wǎng)絡故障排查過程中,應從最明顯的跡象開始尋求最有可能導致故障的原因,制定詳細的故障排除方案,并嚴格按照方案的相關措施進行故障排查,在故障排查的過程中做好故障排查記錄。在故障得到解決后,還應測試網(wǎng)絡的相關效果,確保在排除網(wǎng)絡故障的同時不至于引發(fā)另一故障隱患。
2.3 分析解決方案,編制解決方案文檔
在故障排除過程中,應將網(wǎng)絡當成一個不可分割的整體,避免將精力過分集中于某個用戶、應用或局域網(wǎng)的故障―這一點非常重要。在某些情況下,在實施某項故障解決方案的同時,可能引發(fā)更加嚴重或波及更多用戶的故障。
建立健全事件管理體系,將每次故障登記在冊,并包含與問題和隔離解決步驟相關的完整記錄。認真記錄檔案資料還可為以后的網(wǎng)絡管理工作提供經(jīng)驗和資料。
3 常用的網(wǎng)絡故障診斷工具
常見的網(wǎng)絡故障診斷工具有很多,下面簡單介紹幾個。
3.1 Ping命令
Ping命令[3]通過向遠程目的設備發(fā)送ICMP回應報文并且監(jiān)聽回應報文的返回,來校驗與遠程設備的連通性。帶“-t”,“-l”命令參數(shù)的Ping命令還可以檢查網(wǎng)絡連通的可靠性,如果大包的Ping命令成功返回,就可以證實源點到目標之間所有物理層、數(shù)據(jù)鏈路層和網(wǎng)絡層的運行功能基本正常。Ping網(wǎng)址還可以檢查位于應用層的DNS是否工作正常。
3.2 Tracert應用程序
Tracert命令提供了數(shù)據(jù)包從源到達目的地的網(wǎng)絡路徑的路由器列表,所顯示的路徑是源主機與目標主機間的路徑中,路由器的近側(cè)接口列表,主要用于路由追蹤。
3.3 PathPing命令
PathPing命令主要用于提供在來源和目標之間的中間躍點處的網(wǎng)絡滯后和網(wǎng)絡丟失信息。PathPing將多個回響請求消息發(fā)送到來源和目標之間的各個路由器,然后根據(jù)各個路由器返回的數(shù)據(jù)包大小計算路由器或鏈接的數(shù)據(jù)包的丟失程度,從而確定引起網(wǎng)絡問題的路由器或子網(wǎng)。
3.4 CHARIOT軟件
CHARIOT是一種多功能網(wǎng)絡業(yè)務測試軟件,支持FTP,HTTP,IPTV,Netmeeting,RealAudio等120多個應用層網(wǎng)絡功能測試,通過它可以測量點到點之間的傳輸速率,主要用于網(wǎng)絡Ping命令測試,屬應用層網(wǎng)絡故障分析診斷工具。
3.5 SNIFFER類軟件
SNIFFER類軟件可以捕捉TCP/IP協(xié)議模型各個層次上網(wǎng)絡傳輸?shù)臄?shù)據(jù)包,通過對網(wǎng)絡實時信息進行監(jiān)控,對保存的歷史數(shù)據(jù)報進行統(tǒng)計分析,從而定位網(wǎng)絡故障發(fā)生的原因,SNIFFER類工具有很多,較常用的有SINFFER,OMNIPEEK等。
3.6 線纜測試儀
線纜測試儀是針對TCP/IP模型的物理層設計的,這是一種便攜的、能快速排查線纜故障的診斷儀器,常用的測試電纜儀表有萬用表、RJ45或RJ11網(wǎng)絡線纜測試儀等,測試光纜的有激光筆、光功率計等。
3.7 網(wǎng)絡測試儀
網(wǎng)絡測試儀通過檢查所有通過儀器的信息,發(fā)現(xiàn)相關的線索,從中得到故障診斷信息,這種設備是為TCP/IP下3層故障診斷設計的。
4 常見故障的維護
4.1 電纜連接故障或端口
線路故障[4]一般包括線路的損壞及線路受到嚴重的電磁干擾等,該故障的發(fā)生幾率非常高,大約占所有物理故障的70%。對于線路損壞故障的檢檢測方法為:若線路短,可將網(wǎng)絡線一端插入一臺能夠正常接入局域網(wǎng)主機的RJ45插座,另一端插入正常的HUB端口,然后從主機上Ping線路另一端的主機或路由器,根據(jù)通斷來判斷;假如線路稍長,或者網(wǎng)線不方便調(diào)動,可用網(wǎng)線測試器測量網(wǎng)線的好壞;假如線路很長,是由電信部門提供,那就需要他們檢查線路,確定線路情況。對于嚴重的電磁干擾,可以用屏蔽性較強的屏蔽線在該段網(wǎng)絡上進行通信測試。若通信正常,則表明存在著電磁干擾,這時應將網(wǎng)絡遠離高壓電線和電磁場較強的設備;若通信不正常,則應考慮其他原因。
端口故障通常包括插頭松動等物理故障,一般影響與其相連的設備,可以通過檢查信號指示燈的狀態(tài),判斷故障的發(fā)生范圍及原因,也可以使用其他端口檢查連接是否正常。其中最為常見的是網(wǎng)卡故障,采取的措施多為重新插卡或換卡的方法進行。
4.2 集線器或路由器故障
集線器或路由器故障[4]有軟故障和硬故障。若為硬故障導致網(wǎng)絡不通。最簡易的方法是替換排除法,用通信正常的網(wǎng)線和主機來連接集線器(或路由器),如能正常通信,則集線器或路由器正常;否則,再轉(zhuǎn)換集線器端口排查,是端口故障還是集線器(或路由器)的故障;很多時候,集線器(或路由器)的指示燈也能提示其是否有故障,正常情況下對應端口的燈應為綠燈。如始終不能正常通信,則可認定是集線器或路由器故障。
路由器軟故障通常包括路由器端口參數(shù)設定有誤、路由器路由配置錯誤、路由器CPU利用率過高和路由器內(nèi)存余量太小等。路由器端口參數(shù)設定有誤,會導致找不到遠端地址,用Ping命令或用Traceroute命令,查看在遠端地址哪個節(jié)點出現(xiàn)問題,對該節(jié)點參數(shù)進行檢查和修復。路由器路由配置錯誤,會使路由循環(huán)或找不到遠端地址,解決路由循環(huán)的方法就是重新配置路由器端口的靜態(tài)路由或動態(tài)路由,把路由設置為正確配置,就能恢復線路了。路由器CPU利用率過高和路由器內(nèi)存余量太小,導致網(wǎng)絡服務的質(zhì)量變差,解決這種故障,只有對路由器進行升級、擴大內(nèi)存等,或者重新規(guī)劃網(wǎng)絡拓撲結(jié)構(gòu)。
4.3 軟件系統(tǒng)故障
架構(gòu)網(wǎng)絡[3]的目的就是為了提供各項網(wǎng)絡應用服務。由于網(wǎng)絡軟件系統(tǒng)(包括網(wǎng)絡操作系統(tǒng)、網(wǎng)絡協(xié)議軟件以及網(wǎng)上應用系統(tǒng))自身存在各種缺陷,再加上各類病毒軟件的危害,造成主機安全性故障。排除此類故障通常采用升級系統(tǒng)、安裝補丁、安裝殺毒軟件進行查殺病毒和防防火墻來防范病毒蔓延和攻擊。新的應用系統(tǒng)在投入使用之前應根據(jù)運行環(huán)境、數(shù)據(jù)量的大小和用戶數(shù)量做好相應測試和小范圍試運行的工作,然后再投入正常使用。
主機的網(wǎng)絡地址參數(shù)設置不當是常見的邏輯故障。包括主機配置的IP地址與其他主機沖突,或IP地址根本就不在于網(wǎng)絡范圍內(nèi),這將導致該主機不能連通。發(fā)生類似的情況,可通過查看網(wǎng)絡鄰居屬性中的連接屬性窗口,檢查TCP/IP選項參數(shù)是否符合要求,包括IP地址、子網(wǎng)掩碼、網(wǎng)關和DNS參數(shù),對錯誤的設置進行修復。
4.4 主機安全性故障
主機主機性故障包括主機資源被盜和黑客入侵。對于主機資源要注意不要輕易地共享本機硬盤;對于主機被黑客
控制的故障可以通過監(jiān)視主機的流量、掃描主機端口和服務,安裝防火墻和加補系統(tǒng)補丁來防止可能的漏洞。
5 結(jié)束語
網(wǎng)絡故障的發(fā)生是不可避免的,當網(wǎng)絡故障發(fā)生后,如何快速地定位網(wǎng)絡故障點,恢復網(wǎng)絡的正常運行,是網(wǎng)絡維護技術人員必修的課題。在面對網(wǎng)絡故障時,我們不僅要具有相關的知識和豐富的經(jīng)驗,還應注意遵循網(wǎng)絡故障診斷的一般方法和步驟。
參考文獻:
[1] 劉伯華,李新強,魏宏昌.網(wǎng)絡故障的診斷和排除[J].計算機與網(wǎng)絡,2008(10):47-51.
[2] 劉建友.常見網(wǎng)絡故障的維護[J].裝備制造技術,2008(7):133-134.
關鍵字:計算機;網(wǎng)絡故障;故障診斷;維護排除策略
中圖分類號:TP393.06 文獻標識碼:A 文章編號:1007-9599 (2012) 10-0000-02
一、前言
計算機網(wǎng)絡技術的發(fā)展,促使人們的生活生產(chǎn)方式發(fā)生重大變革。隨著網(wǎng)絡用戶日益增多,計算機網(wǎng)絡成為人們生活中不可或缺的重要組成部分。人們通過將不同的計算機終端互聯(lián)起來形成一個計算機網(wǎng)絡系統(tǒng)。然而,計算機網(wǎng)絡故障一旦發(fā)生就會給日常工作、生活帶來巨大不便,甚至造成巨大的損失[1]。同時,網(wǎng)絡故障是影響計算機網(wǎng)絡系統(tǒng)穩(wěn)定性、有效性的重要影響因素[2]。這就需要人們不斷探討計算機網(wǎng)絡維護的策略,從而確保通過不同通訊設備和線路進行信息交換、資源共享等的網(wǎng)絡系統(tǒng)安全、可靠、穩(wěn)定運行。本文研究了計算機網(wǎng)絡維護中所注意的事項以及常見網(wǎng)絡故障的診斷與排除策略,提出了有關計算機網(wǎng)絡的邏輯類故障、物理類故障、網(wǎng)絡病毒故障等的策略,希望有助于加深人們對計算機網(wǎng)絡故障的了解與認識。
二、計算機網(wǎng)絡維護注意事項
(一)強化服務器操作系統(tǒng)的管理
服務器操作系統(tǒng)是整個網(wǎng)絡正常運轉(zhuǎn)的保障,只有服務器操作系統(tǒng)安全、穩(wěn)定運行,才能為用戶提供更便捷的網(wǎng)絡。因此,這句需要相關管理人員利用操作系統(tǒng)提供的和從網(wǎng)上下載的管理軟件,實時監(jiān)控系統(tǒng)的運轉(zhuǎn)情況,并記錄系統(tǒng)運轉(zhuǎn)的詳細數(shù)據(jù)資料,優(yōu)化系統(tǒng)性能,及時發(fā)現(xiàn)故障征兆并進行處理。
(二)注重網(wǎng)絡的安全管理
近年來,計算機病毒、黑客越來越普遍,使得人們對計算機網(wǎng)絡安全提出了更高的要求。然而,網(wǎng)絡安全管理應該說是網(wǎng)絡管理中難度比較高,長期以來都是相關管理人員所面臨的難題。因為,計算機網(wǎng)絡用戶可能會訪問各類網(wǎng)站,并且安全意識比較淡薄,不注重就算計防毒處理,所以感染到病毒是再所難免的。在同一個網(wǎng)絡中,一旦有一臺機器感染,那么就會起連鎖反應,致使整個網(wǎng)絡陷入癱瘓,從而影響到計算機網(wǎng)絡系統(tǒng)的正常工作。因此,必須注重網(wǎng)絡的安全管理,對系統(tǒng)進行安全漏洞掃描,為服務器設置好防火墻,安裝殺毒軟件,還要定期的進行病毒掃描。
(三)強化對網(wǎng)絡基礎設施的管理
一般情況下,對于網(wǎng)絡基礎設施的主要涉及到掌握機房主干設備的配置及配置參數(shù)變更情況,各項網(wǎng)絡指標是否合格,服務器、交換機和路由器等是否工作正常。因此,在網(wǎng)絡維護管理過程中,相關負責人員必須進行網(wǎng)絡布線配線架的管理,掌握內(nèi)部網(wǎng)絡連接情況,確保配線的合理有序,一旦發(fā)現(xiàn)問題迅速定位,及時找出解決策略,并且還要實時監(jiān)控整個機房內(nèi)部網(wǎng)絡的運轉(zhuǎn)和通信流量情況,確保計算機網(wǎng)絡的正常運轉(zhuǎn)。
三、計算機網(wǎng)絡故障的診斷與排除策略
(一)邏輯類故障
1.用戶的網(wǎng)絡IP地址參數(shù)設置不合理
用戶的網(wǎng)絡IP地址參數(shù)設置正確與否直接關系到用戶能否接入因特網(wǎng),這也是常見的主機邏輯故障,在聯(lián)網(wǎng)之前必須確保IP地址等設置正確。例如,所設置的IP地址是根本就不處于網(wǎng)絡規(guī)定的圍內(nèi)時,將導致該主機不能連通,不能正常上網(wǎng)。排查方法:查看網(wǎng)絡鄰居屬性中的連接屬性窗口,點擊并查看TCP/IP選項參數(shù)是否符合要求,是否是處于你所連入網(wǎng)絡的地區(qū)的IP地址范圍,同時還要查看子網(wǎng)關、網(wǎng)掩碼和DNS參數(shù)等,一旦發(fā)現(xiàn)問題必須進行修復。
2.主機邏輯故障
在常見網(wǎng)絡故障中,主機邏輯故障是導致網(wǎng)絡故障的常見影響因素,其中包括網(wǎng)卡設備有沖突、網(wǎng)卡的驅(qū)動程序安裝不當、主機網(wǎng)絡協(xié)議或服務安裝不當和主機安全性故障等。排查方法:檢查檢查網(wǎng)卡選項,看主機驅(qū)動是否安裝正常,在檢查中如果網(wǎng)卡型號前標示出現(xiàn)“x” 或“!”符號時,表明此時網(wǎng)卡無法正常工作,需要重新找到正確的驅(qū)動程序進行安裝[3]。
3.主機的網(wǎng)絡協(xié)議或服務安裝不正確
主機安裝的協(xié)議必須與網(wǎng)絡上的其它主機相一致,一旦主機服務或者網(wǎng)絡協(xié)議安裝不當時,將會導致網(wǎng)絡無法連通,計算機出現(xiàn)網(wǎng)絡故障。例如,出現(xiàn)無法正常通信,協(xié)議不匹配,不安裝會使自身無法共享資源給其他用戶,還有一些服務如 “文件和打印機共享服務”,等。此外, E-mail服務器設置不合理也會影響用戶收發(fā)E-mail的情況。排查方法:通常情況下,只需要在本地連接屬性窗口或者網(wǎng)上鄰居屬性中在查看所安裝的協(xié)議是否與其他主機是相一致的,如果不一致直接更改過來即可。
(二)網(wǎng)絡病毒故障
計算機網(wǎng)絡病毒每天都在不停地更新?lián)Q代,它具有種類繁雜多樣、傳播范圍廣、破壞性強和傳播速度快等特點,嚴重地影響用戶的正常上網(wǎng),已經(jīng)引起了社會各界的重視。很多病毒都是通過電子郵件和網(wǎng)例如,網(wǎng)卡驅(qū)動正常,用路由器上網(wǎng),中病毒后,路由器也無法登陸,當各種網(wǎng)絡協(xié)議都存在,并且沒有什么設置不合理, ping路由器地址可以ping通[4]。這種情況很可能是中了具有ARP欺騙的病毒。對于此類故障在CMD窗口下輸入命令:
ping172.19.37.126(輸入你所在網(wǎng)絡的網(wǎng)關)
如果ping得通,那么一般情況下你的電腦還沒有收到ARP欺騙,如果返回Request timed out則一般說明你的電腦受騙了,不過就算ping得通但是仍然有可能是受到ARP欺騙,還需要在CMD窗口下輸入靜態(tài)綁定網(wǎng)關的命令:
arp -s 172.19.37.126 00-e0-fc-59-ef-68。
(三)物理類故障
關鍵詞 網(wǎng)絡故障;故障分析;排除方法
中圖分類號TP393.0 文獻標識碼A 文章編號 1674-6708(2010)22-0076-02
網(wǎng)絡故障的現(xiàn)象一般表現(xiàn)為網(wǎng)絡不通、速度慢或經(jīng)常掉線。引起網(wǎng)絡故障的原因有很多,但歸納起來只有兩種:硬件故障和軟件故障,而軟件故障包括協(xié)議故障與配置故障。故障查找的目的是及時地修復網(wǎng)絡,投入服務。故障查找既是一門科學也是一門藝術,產(chǎn)生故障的因素很多,可能交織在一起發(fā)生,對這些問題技術人員都要認真進行分析與排查。
1 網(wǎng)絡故障觀察與分析
認真觀察故障現(xiàn)象,必要時做好記錄。在觀察和記錄時一定要仔細,尤其要仔細分析設備反饋的信息,有很多智能型的設備會自動記錄設備運行的信息。
首先,觀察故障。觀察故障最重要的目的就是要了解故障現(xiàn)象,從而判斷故障位置。觀察故障時,應注意以下問題:1)故障現(xiàn)象描述;2)該故障是否出現(xiàn)過;3)故障現(xiàn)象發(fā)生時做過的操作;4)故障發(fā)生后,系統(tǒng)或整個網(wǎng)絡發(fā)生的變化。根據(jù)統(tǒng)計大約75%的網(wǎng)絡故障發(fā)生在OSI七層協(xié)議的下三層。根據(jù)有關資料統(tǒng)計,網(wǎng)絡發(fā)生故障具體分布為:應用層3%,傳輸層10%,網(wǎng)絡層12%、數(shù)據(jù)鏈路層25%,物理層35%。
分析故障產(chǎn)生的可能原因,根據(jù)網(wǎng)絡結(jié)構(gòu),分析故障產(chǎn)生的原因,如網(wǎng)卡硬件故障、連接故障、網(wǎng)絡設備故障,或者是TCP/IP協(xié)議設置不當?shù)鹊?進行分析后不用急于下結(jié)論。進行技術測試,分析可能導致錯誤的原因,利用軟件或硬件工具進行測試,并作好記錄。
網(wǎng)終管理員在進行故障排除之前,必須確切地知道網(wǎng)絡出了什么毛病,是不能共享資源,還是不能瀏覽Web頁等。知道發(fā)生了什么問題并能夠及時識別,是成功排除故障最重要步驟。對一名優(yōu)秀網(wǎng)絡管理員的最基本要求,首先就是對問題進行快速定位,也就是說,能夠及時找到處理問題的出發(fā)點。當然,為了與故障現(xiàn)象進行對比,必須非常清楚網(wǎng)絡的正常運行狀態(tài)。因此,了解網(wǎng)絡設備、網(wǎng)絡服務、網(wǎng)絡軟件、網(wǎng)絡資源在正常狀態(tài)下的表現(xiàn)方式,了解網(wǎng)絡拓樸結(jié)構(gòu)、理解網(wǎng)絡協(xié)議、掌握操作系統(tǒng)和應用程序,都是故障排除必不可少的理論和知識準備。在識別故障現(xiàn)象之前,必須明了網(wǎng)絡系統(tǒng)的正常運行特性。
網(wǎng)絡管理員必須搞清楚故障是如何發(fā)生的,是什么原因?qū)е铝斯收系陌l(fā)生,以后如何避免類似故障的發(fā)生,擬定相應的對策,采取必要的措施,制定嚴格的規(guī)章制度。對于一些非常簡單明顯的故障,對于一些復雜的問題,這卻是必須遵循的操作規(guī)程。
最后,記錄和保存所有的問題。另外,經(jīng)?;仡櫾?jīng)處理過的故障也是一種非常好的習慣,這不僅是一種經(jīng)驗的積累,便于以后處理類似故障,還會啟發(fā)思考許許多多與此相關聯(lián)的問題,從而進一步提高理論和技術水平。
2 排除的故障方法與策略
2.1 硬件故障與排除
硬件故障即物理故障。當網(wǎng)絡發(fā)生故障時,首先,想到的就是硬件故障。硬件故障常常涉及很多設備。其中,任何一個設備故障或損壞,都可以導致網(wǎng)絡連接的中斷。網(wǎng)絡的連通性是故障發(fā)生后首先應當考慮的原因。任何一個設備的損壞,都會導致網(wǎng)絡連接的中斷。連通性通??刹捎密浖陀布ぞ哌M行測試驗證。所以,最好先查看雙絞線的RJ-45水晶頭與網(wǎng)卡或交換機是否連接,觀察網(wǎng)卡和交換機接口上的指示燈是否正常。還可以采用軟件和硬件工具進行測試驗證。例如,當某一臺計算機不能瀏覽Web網(wǎng)頁時首先考慮是網(wǎng)絡不通的問題??捎肞ing命令測試,如果Ping命令測試能夠得到網(wǎng)絡內(nèi)的其他計算機,那就可以斷定本機到交換機的網(wǎng)路是通的。否則,就有可能是該段網(wǎng)絡物理層出現(xiàn)故障。當然也有可能是計算機的網(wǎng)絡協(xié)議的配置不正確導致的故障。
檢查網(wǎng)卡和網(wǎng)絡協(xié)議是否安裝完好,如果無法Ping通本地的IP地址或計算機名,通常是協(xié)議配置不正確。這時可以在計算機的“控制面板”的“系統(tǒng)”中,查看硬件列表中有沒有網(wǎng)絡適配器,這就說明網(wǎng)卡沒有安裝正確,用鼠標右鍵單擊該設備,在彈出菜單中“卸載”,單擊“掃描硬件改動”,重新安裝網(wǎng)卡,并正確配置網(wǎng)絡協(xié)議,然后進行應用測試。為了進一步進行確認,可再換一臺確認沒有問題的計算機用同樣的方法進行判斷,若連接正常,則故障一定是先前的那臺計算機有故障。網(wǎng)絡管理員必須采用有效的軟硬件工具,從各種可能導致錯誤的原因中一一剔除非故障因素。對所有列出的可能導致錯誤的原因――進行測試,不要根據(jù)一次測試就斷定某一區(qū)域的網(wǎng)絡是運行正?;蚴遣徽?也不要停止測試,并使用所有可能的方法來測試。
硬件故障的排除,關鍵是故障點的定位。硬件故障排除的方法一般是:清掉積塵,重新安裝硬件,更換配件安裝位置(如更換網(wǎng)卡插槽),更換出故障的硬件或配件。
2.2 軟件故障與配置問題
軟件故障可分為協(xié)議故障與配置故障。網(wǎng)絡設備和計算機之間是通過網(wǎng)絡協(xié)議進行通信的。網(wǎng)絡協(xié)議配置不正確,也會引起網(wǎng)絡不通。如果說沒有網(wǎng)絡協(xié)議就沒有網(wǎng)絡,沒有網(wǎng)絡協(xié)議,網(wǎng)絡內(nèi)的網(wǎng)絡設備和計算機之間就無法進行通信,所有的硬件設備也不過都是一雄擺設而己。因此,網(wǎng)絡協(xié)議的配置在網(wǎng)絡中居于舉足輕重的地位,決定著網(wǎng)絡能否正常運行。網(wǎng)絡協(xié)議的含義非常廣泛,既包括交換機和路由器執(zhí)行的網(wǎng)絡協(xié)議,也包括計算機和路由器執(zhí)行的網(wǎng)絡協(xié)議。其中任何一個協(xié)議配置不當,或沒有正常工作,都有可能導致網(wǎng)絡癱瘓,或?qū)е履承┓毡唤K止。
所有的交換機和路由器都有配置文件,所有的服務器、計算機都有配置選項,配置文件和配置選項設置不當,同樣會導致網(wǎng)絡故障。例如,路由器的訪問列表配置不當,會導致網(wǎng)絡連接故障;交換機的VLAN設置不當,會導致VLAN間的通信故障。因此,當排除硬件故障之后,就需要重點檢查配置文件和選項的故障。當網(wǎng)絡內(nèi)所有的服務都無法實現(xiàn),則應當檢查交換機的配置。如果只有個別服務無法實現(xiàn),則應當檢查提供相應服務的服務器配置。
參考文獻
[1]蔣凌云.淺談校園局域網(wǎng)故障分析[J].科技資訊,2006 (14).
[2]李強.網(wǎng)絡常見的幾種故障診斷[J].網(wǎng)絡與信息,2009 (2).
【關鍵詞】氣象業(yè)務網(wǎng)絡故障診斷故障排除
隨著越來越多的先進技術和服務引入到氣象業(yè)務網(wǎng)絡中,網(wǎng)絡管理和維護工作變得越來越復雜。局域網(wǎng)在氣象系統(tǒng)廣泛應用中,常遇到各種故障,正式運行的網(wǎng)絡一旦出了問題,需要及時進行檢測和診斷,盡快定位并排除故障。
下面介紹一下網(wǎng)絡故障的診斷和排除方法。
一、主要的故障種類
根據(jù)網(wǎng)絡故障的性質(zhì)把網(wǎng)絡故障分為物理故障與邏輯故障,也可根據(jù)網(wǎng)絡故障的對象把網(wǎng)絡故障分為路由故障和主機故障。
1.1物理故障
物理故障即硬件連接故障,指的是設備或線路損壞、插頭松動、線路受到嚴重電磁干擾等情況。網(wǎng)卡沒有連接到主板上,網(wǎng)卡的電源燈和數(shù)據(jù)燈都不亮,設備管理器中檢測不到網(wǎng)卡。網(wǎng)線沒有連接好,網(wǎng)卡已經(jīng)驅(qū)動,協(xié)議也添加,但仍然不能上網(wǎng),觀察網(wǎng)卡硬件連接,網(wǎng)卡只有一個燈亮,不閃爍。
如兩個路由器Router直接連接,這時應該讓一臺路由器的出口連接另一臺路由器的入口,而這臺路由器的入口連接另一路由器的出口才行。當然,集線器C6D、交換機、多路復用器也必須連接正確,否則也會導致網(wǎng)絡中斷。還有一些網(wǎng)絡連接故障比較隱蔽,要診斷它只有靠經(jīng)驗。
1.2邏輯故障
邏輯故障中最常見的情況就是配置錯誤,指因為網(wǎng)絡設備的配置原因而導致的網(wǎng)絡異常或故障。配置錯誤可能是路由器端口參數(shù)設定有誤,或路由器路由配置錯誤以至于路由循環(huán)或找不到遠端地址,或者是路由掩碼設置錯誤等。邏輯故障的另一類就是一些重要進程或端口關閉及系統(tǒng)的負載過高。如線路中斷,沒有流量,用ping發(fā)現(xiàn)線路端口不通,檢查發(fā)現(xiàn)該端口處于down的狀態(tài),說明該端口已經(jīng)關閉,導致故障。
1.3路由器故障
線路故障中很多情況都涉及到路由器,也可以把一些線路故障歸結(jié)為路由器故障。檢測這種故障,需要利用MIB變量瀏覽器,用它收集路由器的路由表、端口流量數(shù)據(jù)、計費數(shù)據(jù)、路由器CPU的溫度、負載以及路由器的內(nèi)存余量等數(shù)據(jù),通常情況下網(wǎng)絡管理系統(tǒng)有專門的管理進程,不斷地檢測路由器的關鍵數(shù)據(jù),并及時給出報警。
1.4主機故障
主機故障常見的現(xiàn)象就是主機的配置不當。如主機配置的IP地址與其它主機沖突,或IP地址根本就不在子網(wǎng)范圍內(nèi),由此導致主機無法連通。主機的另一故障就是安全故障。主機沒有控制其上的finger、RPC、rlogin等多余服務。而攻擊者可以通過這些多余進程的正常服務或bug攻擊該主機,甚至得到Administractor的權限等。
二、故障的檢測和診斷
大多計算機用Windows操作系統(tǒng),Windows提供了一些命令行檢測工具,這些工具是網(wǎng)絡診斷中常用的,而且一般的問題大都可以通過這些命令診斷出來。如果對這些命令很熟悉,在網(wǎng)絡出故障時就會運用自如。
2.1用連接故障診斷工具Ping網(wǎng)絡診斷
輸入命令:ping172.18.82.201(172.18.82.201為本機地址),顯示:Pinging172.18.82.201with32bytesofdata:Replyfrom172.18.82.201:bytes=32time=10msTTL=128有"time="的內(nèi)容,表明可以ping通,網(wǎng)絡協(xié)議TCP/IP協(xié)議正常。執(zhí)行ping命令后得到信息:Pinging172.18.82.201with32bytesofdata:Requesttimedout.表示不可以ping通,或者是tcp/ip協(xié)議可能有問題,或者是計算機到交換機間的硬件連接存在問題。
測試數(shù)據(jù)傳輸丟包,輸入Pingstatisticsfor172.18.72.56,顯示:Packets:Sent=4,Received=2,Lost=2(50%loss),Approximateroundtriptimesinmilli-seconds:Minimum=177ms,Maximum=182ms,Average=89ms信息表示發(fā)送了4個數(shù)據(jù)包,回送收到2個,丟失2個,丟失率為50%。發(fā)送數(shù)據(jù)包最快回送時間177ms,最慢回送時間182ms,平均89ms。如可以ping通自己,也可以ping通鄰居或能看到其他機器,表明本地設置正確。網(wǎng)關可以通過軟件實現(xiàn)協(xié)議轉(zhuǎn)換操作,能起到與硬件類似的作用。ping網(wǎng)關地址,例如ping172.18.82.17-t,就可以查看與網(wǎng)關是否連通。
2.2pathping命令
pathping用于跟蹤數(shù)據(jù)包到達目標所采取的路由,并顯示路徑中每個路由器的數(shù)據(jù)包損失信息,也可以用于解決服務質(zhì)量連通性問題。是一個比tracert更為有用的工具。它將ping和tracert命令的功能和這2個工具所不提供的其他信息結(jié)合起來。由于該命令顯示數(shù)據(jù)包在任何給定路由器或鏈路上丟失的程度,因此可以很容易地確定可能導致網(wǎng)絡問題的路由或鏈路。不過WIN9X/Me、WindowsNT不提供此命令。
可以看出,它先提供給我們查看路由的結(jié)果,然后等待75s(此時間根據(jù)躍點數(shù)變化)最后顯示測試結(jié)果。第3列是源到當前的丟包數(shù)。第4列是指明線路和路由器丟包情況,最右邊的欄中標記為"|",表明沿線路轉(zhuǎn)發(fā)丟失的數(shù)據(jù)包,該丟失表明鏈阻塞;最右邊欄中為IP地址的,表明該路由器的丟失率,可能是由于路由器CPU超負荷所致。如果某一處丟包嚴重,則應采取必要的措失,以提高通信質(zhì)量。
三、故障排除的解決方案
不系統(tǒng)的故障診斷與排除方法將導致在網(wǎng)絡故障現(xiàn)象相互依賴和偶然性的迷宮中浪費時間。系統(tǒng)的網(wǎng)絡故障排除方法的總體思路是系統(tǒng)地將產(chǎn)生故障可能的原因所構(gòu)成的1個大集合縮減成1個小的子集或者直接確定故障起因。
3.1網(wǎng)絡適配卡中斷與其他硬件資源沖突
在"系統(tǒng)"的"設備管理器"查找旁邊出現(xiàn)感嘆號的有黃圈的網(wǎng)絡適配器項目,找到項目網(wǎng)絡適配器可能與其它設備使用同樣的資源設置。雙擊網(wǎng)絡適配器項目,在網(wǎng)絡適配器"資源"中更改網(wǎng)絡適配器的中斷和I/O地址,避免與其它硬件沖突。用即插即用的網(wǎng)絡適配卡,可使用制造商提供的安裝盤將即插即用型改為跳線型,設置網(wǎng)絡適配卡的中斷和I/O地址。
3.2在"網(wǎng)上鄰居"中沒有顯示網(wǎng)絡中的其它計算機
主要研究現(xiàn)有視頻監(jiān)控設備與網(wǎng)絡故障診斷分析技術;首先闡述了視頻監(jiān)控設備與網(wǎng)絡發(fā)生故障后對診斷與檢修工作造成的困難,然后論述了故障診斷關鍵技術,以及基于故障缺陷庫和知識庫的故障分析統(tǒng)計方法,最后通過實例論證了方法的可行性,對視頻監(jiān)控設備與網(wǎng)絡故障診斷分析技術的擴展性做了展望。
關鍵字:
視頻監(jiān)控;故障診斷;網(wǎng)絡性能預警;自動巡檢
1背景
電網(wǎng)視頻監(jiān)控平臺是智能電網(wǎng)的一個重要組成部分,廣泛應用于電網(wǎng)的建設、生產(chǎn)、運行、經(jīng)營等方面,通過對電力系統(tǒng)中設備、線路及周邊環(huán)境等生產(chǎn)、經(jīng)營要素的實時監(jiān)視及記錄,為事故分析提供相關圖像資料,是對“四遙”(遙測、遙信、遙控、遙調(diào))功能的進一步補充-“遙視”。新疆電網(wǎng)統(tǒng)一視頻監(jiān)控平臺的建設,使不同的視頻監(jiān)控系統(tǒng)能夠互聯(lián)互通,實現(xiàn)統(tǒng)一監(jiān)控、分級控制、分域管理。目前,視頻監(jiān)控平臺共接入15000多個視頻監(jiān)控點位,覆蓋了各部門各地州營業(yè)廳、變電站、輸電線路、信息機房、庫房、機關大樓等各個場所,支撐各部門、各單位的視頻應用需求。新疆電網(wǎng)統(tǒng)一視頻監(jiān)控平臺所涉及設備型號及數(shù)量規(guī)模越來越大、產(chǎn)品種類越來越多、設備也越來越復雜,同時由于新疆地域廣袤、監(jiān)控場所分布不均勻,運維檢修難度較大。另外,平臺目前主要提供粗獷型的設備接入狀態(tài)信息(設備離/在線狀態(tài)),無法對具體原因進行分析、定位,對于出現(xiàn)故障的設備無法做出快速響應,與運維檢修人員故障排查、運維檢修脫節(jié),對于設備檢修流程缺少有效的跟蹤,對平臺運行維護造成了新的困難。因此,需要開展對監(jiān)控設備故障和網(wǎng)絡通道故障的分析、精確定位,以及檢修過程精益化管控的研究和應用。
2故障診斷關鍵技術
電網(wǎng)監(jiān)控設備與網(wǎng)絡故障診斷分析技術研究,是進一步提升平臺實用化水平,通過故障診斷分析定位、融合設備檢修流程等方法,實現(xiàn)對故障設備的快速分析定位協(xié)助運維檢修人員做好設備故障排查、運維檢修工作。主要實現(xiàn)以下目標:
1)通過故障精確診斷分析功能,實現(xiàn)對平臺接入設備的實時狀態(tài)監(jiān)測,對于離線設備進行快速故障診斷分析、問題定位,并告知運維檢修人員進行設備故障檢修。
2)通過與現(xiàn)有設備檢修流程高效融合,在設備運維檢修過程中,實現(xiàn)對運維檢修各環(huán)節(jié)中所涉及的檢修人員、響應時間、檢修流程進行全過程跟蹤。
3)通過大數(shù)據(jù)分析策略實現(xiàn)對故障原因、故障設備類型、故障頻率、典型故障區(qū)域、典型故障場景等多維度分析,為后續(xù)視頻監(jiān)控建設選型、網(wǎng)絡配置標準化提供數(shù)據(jù)支撐。
2.1網(wǎng)絡性能預警技術
網(wǎng)絡故障在視頻監(jiān)控故障類中的發(fā)生率占比超過50%,而視頻信息丟失、帶寬不足、路由配置錯誤、時延過大等情況,是網(wǎng)絡故障的最常見情況,因此需要形成以通信網(wǎng)絡信道性能預測為中心的關鍵技術研究。視頻傳輸是基于Internet網(wǎng)絡的應用中對網(wǎng)絡時延要求較高,一般有兩種預測時延的方法:一種是根據(jù)時延數(shù)據(jù)之間的關系,進行擬合,預測未來的時延;另一種通過構(gòu)建Internet的網(wǎng)絡模型,實現(xiàn)對時延的預測。后一種方法相對于前一種方法有著更好的預測效果,這是因為后者不但能夠包含時延數(shù)據(jù)之間的規(guī)律,而且能夠更好地反映出當前的網(wǎng)絡狀況以及未來時刻網(wǎng)絡的狀況和時延情況。本課題采用隱馬爾科夫(HMM,HiddenMarkovModel)的方法構(gòu)建Internet網(wǎng)絡模型,預測Internet網(wǎng)絡時延。該方法通過預測未來時刻的可觀測狀態(tài)值,準確表示時延數(shù)據(jù)集的規(guī)律以及Internet網(wǎng)絡的特性;同時,該方法對于未來的可觀測狀態(tài)的預測有較高的準確性,能夠更好地對Internet時延敏感的應用作出決策。
2.2視頻質(zhì)量分析技術
將常見視頻質(zhì)量故障類型、原因、采取的檢修方法,以故障缺陷庫和知識庫的形式固化在監(jiān)控平臺中,通過視頻圖像質(zhì)量分析的方法結(jié)合缺陷庫和故障知識庫,在巡檢工單或檢修方案中給出故障檢修建議。按照視頻圖像質(zhì)量、系統(tǒng)登錄情況、網(wǎng)絡信號丟失率等故障分類,自動填寫檢修工單,視頻質(zhì)量故障。
2.3故障自動巡檢方法
人工方式通過監(jiān)控畫面巡檢,發(fā)現(xiàn)故障的效率非常低,而且不能精確定位故障原因。因此,需要研究設備故障自動巡檢功能,通過設置任務的定期重復執(zhí)行來實現(xiàn),如下圖1所示:對故障診斷任務設置每日、每天、每月執(zhí)行的方式,簡化工作人員重復建立故障診斷任務的工作量,提高工作效率。同時,診斷功能對任務診斷到的異常設備自動生成工單在夜間進行下發(fā),次日可以在設備運維人員的賬號上看到設備工單,進而進行消缺。
3故障診斷實施方案
3.1故障知識庫與運行缺陷庫構(gòu)建
在構(gòu)建知識庫的基礎上,通過對設備故障原因、故障類型、故障頻率、典型故障區(qū)域、典型故障場景等多維度分析,形成設備運行缺陷庫。通過對具體設備故障或網(wǎng)絡故障的進行細分,實現(xiàn)對設備故障的定位,精確到單個路由器,例如設備網(wǎng)絡不通時,經(jīng)過哪些路由后網(wǎng)絡不通,大大簡化設備故障的消除。通過平臺設備運行數(shù)據(jù)綜合統(tǒng)計和分析功能的建設,實現(xiàn)對平臺視頻設備歷史運行情況多時間維度的統(tǒng)計和分析,可以方便運維和檢修人員對重點故障區(qū)域和故障設備類型制定針對性整改方案,有效提高平臺指標情況。并通過對歷史數(shù)據(jù)信息進行多維度統(tǒng)計分析為運維檢修人員提供重點故障區(qū)域和設備類型等信息,為運維檢修人員進行針對性整改提供決策數(shù)據(jù)輔助。
3.2故障診斷業(yè)務架構(gòu)
電網(wǎng)統(tǒng)一視頻監(jiān)控平臺為各業(yè)務領域下的變電站、輸電線路、營業(yè)廳、變電站、辦公大樓、應急場所等視頻監(jiān)控應用場景提供視頻源,實現(xiàn)實時視頻、錄像回放、運行工況、資源管理、資源調(diào)度等業(yè)務功能。新增設備故障精確分析診斷功能,實現(xiàn)設備運行故障快速診斷分析定位,規(guī)范設備檢修流程,形成設備運行缺陷庫。故障診斷分析定位:通過網(wǎng)絡跟蹤的技術對電網(wǎng)統(tǒng)一視頻監(jiān)控平臺設備運行故障進行診斷分析,協(xié)助運維檢修人員快速定位、分析、排查故障的原因。通過網(wǎng)絡故障診斷,能夠精確到監(jiān)控設備所經(jīng)過的的故障路由位置(IP地址)。檢修流程標準化:通過設備診斷結(jié)果與設備檢修流程的高效融合,實現(xiàn)設備檢修流程各環(huán)節(jié)的實時跟蹤處理,規(guī)范設備檢修流程。缺陷庫:通過對設備故障原因、故障類型、故障頻率、典型故障區(qū)域、典型故障場景等多維度分析,形成設備運行缺陷庫。統(tǒng)計分析:對設備接入故障信息進行多維度統(tǒng)計分析,可以按照監(jiān)控設備部署區(qū)域或者運維區(qū)域進行故障統(tǒng)計,生成設備故障統(tǒng)計分析報表、圖表。
4實現(xiàn)與展望
電網(wǎng)監(jiān)控設備與網(wǎng)絡故障診斷分析技術,已經(jīng)在新疆電網(wǎng)統(tǒng)一視頻監(jiān)控平臺中推廣應用,各全疆地州通過巡檢功能對本地區(qū)設備進行定期全面檢測,可以對全疆13地州15000余路視頻情況進行定期診斷。通過電網(wǎng)視頻監(jiān)控設備離線率原因分析、網(wǎng)絡通道故障預測和定位、設備檢修流程各環(huán)節(jié)實時跟蹤處理,構(gòu)建視頻監(jiān)控設備和網(wǎng)絡運維檢修標準化流程、多維度分析運行缺陷庫、故障情況實時跟蹤和檢索機制、歷史運行情況多時間維度的統(tǒng)計和分析功能,為后續(xù)設備選型、制定標準化網(wǎng)絡配置、設備運行情況分析、重點故障區(qū)域和故障設備類型制定整改方案等過程提供輔助決策數(shù)據(jù)。視頻監(jiān)控設備與網(wǎng)絡故障診斷分析技術,對于規(guī)模越來越大、業(yè)務越來越多、設備越來越復雜的電網(wǎng)系統(tǒng)的安全運行,以及監(jiān)控平臺的運維檢修具有較高的實用價值和推廣意義,。后續(xù),對于信息通信系統(tǒng)和資源的運維管控,會趨于在統(tǒng)一管控平臺上實現(xiàn),例如網(wǎng)絡和通信網(wǎng)管、設備管理系統(tǒng)、運維檢修平臺等,將會出現(xiàn)一個統(tǒng)一的、協(xié)同的運維管控平臺。
參考文獻:
[2]高楊.視頻質(zhì)量診斷算法研究與實現(xiàn)[D].沈陽:東北大學,2011.
[3]吳貴達.基于Internet的動態(tài)網(wǎng)絡資源管理—網(wǎng)絡故障監(jiān)控與性能趨勢分析[D].西安:西北工業(yè)大學,2004.
[4]潘瑞雪.基于SVM的故障視頻圖像識別與診斷技術研究與實現(xiàn)[D].武漢:華中師范大學,2014.