超大規(guī)模網(wǎng)絡架構管理需求愈發(fā)凸顯
佚名 發(fā)表于:11年12月16日 16:00 [來稿] DOIT.com.cn
若超大規(guī)模存儲網(wǎng)絡像城市交通一樣去進行粗放型管理的話,其結果有多么恐怖完全可想而知。交通堵塞,延遲和數(shù)據(jù)丟失……網(wǎng)絡架構管理與道路交通管理不同,它具備實時流量監(jiān)控和用于故障排除的端對端視圖功能。
不過我們要考慮到任務的難易程度。若一個網(wǎng)絡有800個服務器和網(wǎng)絡適配器,300個交換機,2個控制器和50個存儲陣列,還有1150個網(wǎng)絡設備和超過5000個的網(wǎng)絡端口-這種規(guī)模并非具備云標準的特殊超大型網(wǎng)絡架構所獨有-市面上常見的架構管理系統(tǒng)同樣可以輕松擴展到9000個交換端口和20000個終端設備。在這種情況下,我們根本無法通過監(jiān)控屏幕中的狀態(tài)信息來搞定全部設備及端口的問題,更不用說進行故障排查了。
這項工作相當復雜。我們首先要對這個網(wǎng)絡進行路徑配置,并建立域,還要嘗試創(chuàng)建不同的流量策略并確保網(wǎng)絡資源的合理運用,避免低優(yōu)先級應用占用高優(yōu)先級應用的流量資源。
如上所描述,這樣的網(wǎng)絡就需要智能網(wǎng)絡架構管理系統(tǒng)了。事實上我們幾乎可以斷言,如果沒有這套系統(tǒng),上述網(wǎng)絡完全無法加以管理。
它們也沒有足夠的監(jiān)控設備和網(wǎng)絡端口。網(wǎng)絡是一個單一的實體,并提供了服務器應用、存儲陣列和外部服務之間的數(shù)據(jù)傳輸服務,還有管理系統(tǒng)應監(jiān)測服務級別和進行端到端的管理。
端到端
讓我們還回到那個城市交通的比喻上,端到端的監(jiān)控就像是監(jiān)測紐約大中央火車站和Laguardia機場之間的道路一樣。也許這樣的比喻有點可笑,在市區(qū)或是城鎮(zhèn)中進行端到端的監(jiān)控是不切實際的。然而同樣的監(jiān)控手段卻是數(shù)據(jù)網(wǎng)絡正常動作的必備條件,沒有它的話,我們將無從搞清設備故障到底影響到了哪些網(wǎng)絡服務項目。
通過像思科Fabric Manager和博科的數(shù)據(jù)中心網(wǎng)絡架構管理系統(tǒng)(IBM的OEMed)這樣的產(chǎn)品,你可以自定義網(wǎng)絡架構中端到端的流量監(jiān)測規(guī)則。它們可以對流量和網(wǎng)絡通信時間之類的數(shù)據(jù)進行實時記錄,這些統(tǒng)計數(shù)據(jù)可以保存到歷史記錄當中。
博科DCFM界面
這個系統(tǒng)也可以監(jiān)控單個設備,如果設備的使用頻率超過了設置的初始值,它就會發(fā)出警報。通過這個軟件我們就可以及時管理調(diào)試這些設備,比如交換機和交換機端口,還有網(wǎng)絡架構中的應用服務和需求響應什么的都可以查看到。如果某項端對端服務開始出現(xiàn)故障,那么立即會有相應的單獨設備信息被發(fā)送到管理人員手上;該信息將在識別交換設備問題、尋找服務失敗原因以及之后的補救方案實施方面帶來發(fā)揮巨大的作用。