碰撞問(wèn)題
如果碰撞較多,要算一下有多帶寬被碰撞損失了。把本地和遠(yuǎn)端碰撞的損失都加起來(lái),如果平均碰撞的值大于5—10%,就要進(jìn)行進(jìn)一步的故障查找。同樣要檢查一下碰撞是否是突發(fā)的,也就是說(shuō)碰撞明顯地增多不是因?yàn)榱髁棵黠@增大引起的,如果是這樣就意味著某處的物理層出現(xiàn)了比較嚴(yán)重的問(wèn)題。在碰撞與流量之間應(yīng)是有一定的關(guān)系的。這種關(guān)系應(yīng)當(dāng)在做網(wǎng)絡(luò)參照基準(zhǔn)測(cè)試時(shí)收集到。如果碰撞始終是比較多的(但仍是可以接受),可能是太多站點(diǎn)同時(shí)在參與發(fā)送,或者網(wǎng)絡(luò)結(jié)構(gòu)應(yīng)做一些優(yōu)化使近距離的站點(diǎn)分在一起。過(guò)多的碰撞最常見(jiàn)是與介質(zhì)有關(guān)的故障導(dǎo)致的。比如:不正確的端接,特性阻抗不連續(xù)(壞接點(diǎn)、殘留支纜、殘破線纜)等和壞網(wǎng)卡。
過(guò)載網(wǎng)段
如果利用率很高(持續(xù)峰值超過(guò)60%)而碰撞又可以接受(平均碰撞小于10%),那么網(wǎng)絡(luò)就飽和了。這時(shí)就應(yīng)該增加網(wǎng)段或用路由器把網(wǎng)段分成較小的可以支持正常流量的網(wǎng)段。
硬件故障
如果出現(xiàn)幀錯(cuò)誤,利用專業(yè)儀表可以找出錯(cuò)誤幀的來(lái)源。此后的工作就是在Hub口、網(wǎng)卡和電纜中隔離出特定的故障,如果故障是間歇性的,就替換掉有懷疑的網(wǎng)卡。檢查一下服務(wù)器/服務(wù)是否接在廣域網(wǎng)路由器的遠(yuǎn)端。如果是這樣,就用Ping測(cè)試來(lái)測(cè)一下響應(yīng)時(shí)間并與基準(zhǔn)測(cè)試比較一下。為了保證沒(méi)丟失幀的情況就要連續(xù)運(yùn)行多次的Ping測(cè)試,檢查測(cè)試請(qǐng)求包與響應(yīng)包是否相等。如果不相等,遠(yuǎn)端的介質(zhì)或互連設(shè)備(網(wǎng)橋、路由器等)就有可能是容量問(wèn)題或有故障。丟幀也是電纜故障之一。比如:UTP布線中的線對(duì)串繞和同軸纜由線的環(huán)地故障。如果懷疑有丟幀就進(jìn)行電纜測(cè)試。測(cè)試接在反應(yīng)慢的工作站的電纜,也要測(cè)一下服務(wù)器方向的電纜。
軟件故障
運(yùn)行網(wǎng)絡(luò)統(tǒng)計(jì)測(cè)試,如果是高流量,低碰撞,而且有一點(diǎn)錯(cuò)誤幀,就先確定發(fā)出錯(cuò)誤幀的站點(diǎn)。也可以由繁忙站點(diǎn)測(cè)試來(lái)找出有問(wèn)題的站點(diǎn)。到該站點(diǎn)現(xiàn)場(chǎng)來(lái)查看該用戶在做什么。要問(wèn)明在非高峰時(shí)間用戶在干什么或把這個(gè)用戶移到其它網(wǎng)段上,以改善本網(wǎng)段上的其它用戶工作情況。如果利用率、碰撞、錯(cuò)誤幀都低,要詢問(wèn)抱怨網(wǎng)絡(luò)性能不好的用戶是使用哪個(gè)服務(wù)器和哪個(gè)應(yīng)用軟件。檢查該服務(wù)器是否處在高負(fù)載狀況下,它和網(wǎng)絡(luò)的利用率是不同的概念。要找到使用這個(gè)服務(wù)器資源最多的用戶,這可以用服務(wù)器上的用戶監(jiān)測(cè)功能或協(xié)議分析儀來(lái)完成。
無(wú)論是網(wǎng)絡(luò)流量高或低時(shí)發(fā)生的問(wèn)題,如果是碰撞很少而且是沒(méi)有幀錯(cuò)誤,這類問(wèn)題多出自應(yīng)用軟件或與文件服務(wù)器有關(guān)。服務(wù)器可能是Cache設(shè)置的太小,保留的緩沖不足,服務(wù)器內(nèi)存不夠,服務(wù)器硬盤所余空間有限,8-bit網(wǎng)卡等等,這也可能是另一類軟件問(wèn)題,他們可能造成不正常的“網(wǎng)絡(luò)磁盤請(qǐng)求”,這時(shí)有必要將某一應(yīng)用移到另一個(gè)服務(wù)器上,要么升級(jí)現(xiàn)有的服務(wù)器,要么再加入一個(gè)新的服務(wù)器。
網(wǎng)絡(luò)故障可能是很復(fù)雜的,很多問(wèn)題會(huì)導(dǎo)致同樣的故障表現(xiàn)不同。查找故障的基本方法是二分法。為了有效地解決故障,我們需要有網(wǎng)絡(luò)的文檔。了解在網(wǎng)絡(luò)正常工作時(shí)的參數(shù),要裝備合理的工具以幫助我們找出網(wǎng)絡(luò)的故障。從上述的兩大類故障中可以看出,網(wǎng)絡(luò)管理人員不僅需要網(wǎng)絡(luò)的幀監(jiān)測(cè)工具,也要有主動(dòng)測(cè)試硬件和功能的能力,方便地找出網(wǎng)絡(luò)中最常見(jiàn)故障的地址。