解決網(wǎng)絡(luò)問題容易。數(shù)據(jù)包丟失、超額配置、安全補丁和軟件版本控制等問題讓網(wǎng)絡(luò)工程師噩夢連連。但很多IT專業(yè)人員發(fā)現(xiàn),良好的網(wǎng)絡(luò)設(shè)計和管理可以幫助他們緩解這些問題。
Apex Tool Group LLC公司架構(gòu)和桌面服務(wù)經(jīng)理Patrick Miller記得很多年前試圖追查令牌環(huán)網(wǎng)絡(luò)中經(jīng)常出現(xiàn)的一個問題,這個問題現(xiàn)在在很多企業(yè)網(wǎng)絡(luò)仍然經(jīng)常出現(xiàn)。“我曾經(jīng)遇到過這樣的情況,每天晚上10點,我們工廠外的UPS(不間斷電源系統(tǒng))就會斷電,沒有人能解釋為什么會這樣,”Miller表示,“于是,我?guī)е崽狡骱凸P記本去做ping和traceroute,最后,我還檢查了電纜。”
最終,Miller發(fā)現(xiàn)一個受控訪問單元的電源插頭被拔掉,一位清潔阿姨每天晚上會拔掉它,以便她能使用吸塵器,正是這樣造成整個網(wǎng)絡(luò)宕機。“這樣奇怪的事情時有發(fā)生,”他表示,“有時候你會部署1萬美元的設(shè)備來試圖解決這個問題,而有時候你只需要跟蹤電纜就能解決。而數(shù)據(jù)包丟失則是一個完全不同的問題,數(shù)據(jù)包丟失是非常怪異的事情之一,有時候你根本找不到解決辦法。”
解決網(wǎng)絡(luò)問題的靈丹妙藥很難找到,但網(wǎng)絡(luò)工程師希望能夠減少他們花在這些問題上的時間。不幸的是,很多公司仍然有很長的路要走。MyITassessment.com是幫助大型系統(tǒng)集成商評估客戶網(wǎng)絡(luò)的基于軟件即服務(wù)的基礎(chǔ)設(shè)施評估供應(yīng)商,該公司從其對2000多家企業(yè)網(wǎng)絡(luò)的掃描中總結(jié)了一些有價值的統(tǒng)計數(shù)據(jù)。
1.在63%的企業(yè)網(wǎng)絡(luò)中,3層設(shè)備出現(xiàn)過數(shù)據(jù)包丟包情況。
2.在35%的網(wǎng)絡(luò)中,已超用配額的交換機造成性能問題。
3.在44%企業(yè)的交換機和路由器中有未打補丁的安全漏洞。
4.超過75%的企業(yè)在同一產(chǎn)品系列的設(shè)備上有版本不一致的IOS。
5.在54%的網(wǎng)絡(luò)中,交換機和路由器已經(jīng)不再受供應(yīng)商支持。
這些問題依然存在,很多網(wǎng)絡(luò)供應(yīng)商正在積極尋求方法來對付它們。
解決丟包和超額配置問題
工程師可能永遠無法完全避免其網(wǎng)絡(luò)中的數(shù)據(jù)包丟失問題,但嚴密的監(jiān)控和更好的網(wǎng)絡(luò)設(shè)計可以幫助緩解這些問題。全球人力資源公司Randstad網(wǎng)絡(luò)經(jīng)理Forrest Schroth在其多協(xié)議標簽交換機(MPLS)云中監(jiān)管300個站點,他密切地監(jiān)察四個指標來防止數(shù)據(jù)包丟包。
“我通常會尋找抖動,錯誤組裝的數(shù)據(jù)包,這有可能是電信運營商的問題,也有可能是因為我們內(nèi)部的壞的接口卡。我要確保使用率不會違反某些閾值,對此我想你可以增加延遲性,”Schroth表示,“當我早上來上班時,我會有一個圖表來向我顯示所有站點的情況,以及哪個出現(xiàn)最多錯誤、最多抖動,哪個站點的利用率最大。我們會對此進行流量整形。當有錯誤出現(xiàn)時,我們會呼叫所有與我們接口的運營商,以及位于我們供應(yīng)商邊緣和我們客戶邊緣之間的運營商,試圖找出錯誤的來源,這通常是一個工程師的日常工作。”
布萊恩特大學計算機和電信服務(wù)主管Rich Siedzik表示,然而,數(shù)據(jù)包丟失在局域網(wǎng)上很難追查。“對于我們來說,通常是這樣的,當你開始看到服務(wù)降低或者用戶投訴時,你會發(fā)現(xiàn)數(shù)據(jù)包丟失的情況,然后你開始追查這個問題。這個工作很困難,因為有太多網(wǎng)段和太多不同的路徑,”Siedzik表示,“在每個路徑運行檢測工具幾乎是不可能的事情,于是,當我們在網(wǎng)絡(luò)的不同網(wǎng)段中檢查時,我們會優(yōu)先考慮某些網(wǎng)段,例如從核心到分布層的網(wǎng)段。然后,當你到達接入層時,就只有較少的監(jiān)控,因為有更多點需要監(jiān)控。”
很多時候,數(shù)據(jù)包丟失是壞的電纜或者端口造成的。有時候,則是因為糟糕的設(shè)計。網(wǎng)絡(luò)工程師犯的最大的設(shè)計錯誤是專注于帶寬,而不是交換機處理數(shù)據(jù)包的能力,Randstad公司的Schroth表示:“它是一個千兆接口,并不意味著它要接收所有的流量。我更感興趣的是一臺設(shè)備接收流量的速率,即每秒數(shù)據(jù)包接收率。我看到很多人已經(jīng)進入10千兆,這很好,但你需要確保設(shè)備是線率。”
myITassessment.com首席執(zhí)行官兼首席分析師Jeremy Littlejohn表示同意。太多工程師用帶寬來解決問題,而不是深入問題的根源。“不知怎么的,帶寬成了所有事物的首要指標,這并不是好事,”他表示,“工程師應(yīng)該專注于數(shù)據(jù)包丟失,檢查是缺乏帶寬還是其他東西在造成數(shù)據(jù)包丟失。”
超額配置的交換機和路由器也是令人頭疼的網(wǎng)絡(luò)瓶頸問題。有時候因為對單個設(shè)備的管理不善,導(dǎo)致設(shè)備的超額配置。還有一些企業(yè)則是沒有追蹤模塊化交換機和路由器上的背板容量,并且在線卡上安裝太多帶寬,而造成超額配置。