龔文濤 魏秀英 肖天航 孔凡華 彭柳





關鍵詞:網絡;評估;分析
20世紀中期,位于美國密歇根州的通用汽車公司的一個汽車變速箱廠發生了火災,直接導致其損失了數千萬美元,這一事件成為美國歷史上損失最為嚴重的重大火災之一。正是這場大火與20世紀其他嚴重的安全事故,倒逼了美國的風險管理活動在學術界及民營企業研究和實踐活動中興起。后來,美國商學院里出現了一門涵蓋風險管理的學科,主要職責是對公司的員工、公司的財產、公司的責任及公司的財務資源等進行保護。
目前,風險管理已經逐步發展成企業管理中的核心領域之一,風險管理具有相對獨立職能的管理領域,主要研究對象圍繞企業的各個經營環節和長足發展目標。針對企業來說,風險管理已逐步與企業的經營管理及戰略管理等環節一樣具有非常重要的意義。
隨著時代發展和對風險控制理論的深入研究,風險控制逐步深入各行各業,其中具代表性的是Boehm和Charette的風險管理體系,其架構中將風險管理流程細化分解,具體細分為風險識別環節、風險分析環節、風險優先級排序環節、制定風險管理計劃環節、風險解決環節及風險監督環節。其風險管理架構的缺點是無法對風險事故和因素進行細化管理及量化分析,為此有研究學者提出了LEC評價法。
LEC評價法的核心思想是先期細化出風險因素集合,后期對這些風險因素進行量化評估,最終得出一個總體的風險因素影響值,進而對各種風險事故進行預先評估和后期的預防。基于這種量化評估和細化管理的思想,具有很好的擴展性,能夠廣泛應用于各行各業。
高校園區網作為一個獨立的網絡服務平臺,也有各種網絡故障因素導致其網絡服務中斷或者受到影響,其影響因素包括網絡交換機故障、終端硬件網卡故障及操作失誤等諸多因素,如何定位和分析這些網絡故障因素是一個研究難點和熱點。目前高校中還缺乏一種量化評估手段和先前的預防方案,結合格雷厄姆(BenjaminGraham)評價法中評估算法的思想的優勢,將其評估和預防思想及流程引入高校園區網的網絡故障定位分析中,有助于高校網絡故障精細化定位和量化分析,從故障原因集合中挖掘出內在的一些聯系,探尋網絡故障頻發的客觀普遍規律,最終制定相應的預防方案和方法,強化網絡故障分析的深度和廣度,將網絡故障風險封殺在萌芽中,為維護高校園區網網絡服務穩定作智慧庫保障。
1園區網網絡風險評估需求
1.1園區網架構
高校網絡的建設目的是保障廣大在校師生的教學、學習和工作,保障科研和辦公。隨著高校規模日益擴大,某高校園區網越來越大,形成了傳統的校園網絡核心網絡、匯聚網絡、接入網絡等三層架構。
三層架構中,核心骨干網絡主要通過千兆乃至萬兆鏈路互聯,上聯到出口路由器再到運營商出口,下聯到各個樓宇的大型匯聚交換機端口上,核心骨干主要負責核心數據包的路由和轉發,保障全校核心數據流量暢通無阻;匯聚流量主要通過三層虛擬局域網將各個樓宇的網絡連接起來,將樓宇的網絡匯聚在該處,上聯到骨干核心,下聯到各個接入機房的接入交換機;接入交換機則將各個終端連接起來,是網絡接口的擴展,將各個網絡接入終端連接起來。如圖1所示。
校園園區網按照用戶角色和應用區分,邏輯分為教學網、辦公網及學生網,網絡資源也日益豐富,從先前的有線網,擴展為有線網和無線網交匯共存的局面。
1.2園區網故障定位需求分析
作為網絡建設者和管理者,如何為使用廣大園區網的教師和學生提供更加穩定的網絡服務,如何強化網絡管理水平,如何提升網絡服務質量變得日益迫切,需要我們減少網絡故障,提升網絡運維水平。而隨著園區網絡的規模擴展及用戶終端的增多,各種網絡故障頻發,導致原因廣大教工和學生不能夠正常上網,以某高校為例,主要的網絡故障包括電腦故障、線路故障、個人操作失誤、認證密碼遺忘、接入交換機網絡故障、匯聚網絡故障、核心骨干網絡故障等。
這就需要對網絡故障因素進行定量分析,細化風險評估因素,量化評估風險故障程度,保障進而做針對性的調整和風險評估預防,切實為網路正常運作提供技術保障。
2基于LEC的園區網網絡風險評估
2.1 LEC評估流程
從風險控制理論產生到成熟的幾十年的發展過程中,有關風險和風險管理的研究逐漸成為國際社會高度關注的一個熱點和難點問題,風險管理由此成為世界各國首腦和政府共同面臨的重大挑戰。其主要經過三個重要時期,第一個時期是20世紀初期到中后期,也是風險管理理論探索和學科發展時期,其間經歷從風險管理思想的萌芽到學科體系發展,再到建立獨立的論文體系。第二個時期是20世紀70年代后期,風險管理的理念和技術逐步在歐洲等系列國家和地區獲得非常深入而廣泛的研究和傳播,被當時公認為企業管理領域內的一項核心環節,當時風險管理研究的熱點包括控制企業環境中的風險因素及不確定性因素等論題。在這一個階段中,風險管理已經從企業管理逐步深入擴展到社會領域,而風險管理也逐漸規范化、標準化和程序化。
風險控制中能夠細化評估因素和量化最終評估結果的有代表性的是LEC評價法,又稱格雷厄姆評價法,其算法主要是對危險源進行定量的安全評價,在此我們將其引入校園網絡故障定性分析中,并對其特定的角色和作用做了必要的更改。
針對校園園區網中風險評估和預防環節的需求,引入基于格雷厄姆評價法中評估算法的思想。
LEC的主要評估計算公式是:D=L×E×C
針對高校網絡故障風險評估需求,本文實例化的評估公式是:
對其可能的網絡故障風險依托LEC的評估思想,將其定義在校園網網絡故障定性分析和評估中,分別在校園園區網中實例化,主要依靠如下三個核心參數:
定義1:NL值表示的是網絡故障風險發生的可能性,表達網絡故障發生的可能性;
定義2:NE值表示網絡故障出現的概率,表達網絡故障出現的頻繁程度;
定義3:NC值表示網絡故障可能產生的后果,表達其對網絡故障事件的影響力。
定義4:ND值表示該網絡故障因素最終對學校整體網絡的風險影響值。
2.2基于LEC的園區網網絡風險評估流程
針對LEC評估算法的核心流程和思路,結合園區網的風險因素集合,細化風險因素評估集合,量化。具體流程如圖2所示。
第一步:給出園區網網絡故障的風險因素評估集合,以此來深入細化基于LEC評估算法的校園網絡風險故障各個因素;
第二步:確定具體網絡故障的風險集合對象后,制定對園區網網絡故障風險因素的量化評估,為每個風險值給出一個量化的網絡故障評估值;
第三步:確定園區網中常見的網絡故障出現概率,依據這個概率值來量化評估后期對網絡風險的作用力。
第四步:確定園區網中網絡故障事件造成的后果因素集合,以此來確定最后一個量化值。
第五步:總結上述三個量化值,并最終核算出園區網中網絡故障風險值。
第六步:針對網絡故障風險值,量化分析其值大小規律,最終給出定性的建議和意見,以期增強網絡穩定性。
2.3網絡故障風險評估集合量化和細化
針對校園園區網的網絡故障情況,結合網絡故障風險分析需求,首先抽象出網絡故障對象集合。
依據調研和分析,主要的網絡故障對應集合如下:
定義5:網絡故障因素集合A,表示所有故障因素。A={a1,a2,a3,a4,…,a},a1至a2表達n個網絡故障原因,n的值隨著具體網絡情況而定。
本文抽取了7項常見故障,其中A={電腦故障,線路故障,個人操作失誤,認證密碼遺忘,接入交換機網絡故障,匯聚網絡故障,核心骨干網絡故障}。
定義6:網絡故障發生可能性集合B,表示某個故障的可能性因素的集合。表達n個網絡故障發生的可能性程度,n的值隨著具體網絡情況而定,本文中抽取了五種可能性程度。
依據前文中的定義首先確定網絡故障風險發生的可能性(NL)值。設定對象集合,其可能性集合B={0.1,0.5,1,5,10}分別對應的集合是{網絡故障很不可能,網絡故障可能發生,網絡故障極有可能發生,網絡故障很可能發生,網絡故障非常可能發生}。其(NL)值越小,表示網絡故障發生可能性越小,網絡相對越穩定。
定義7:網絡故障發生概率集合c,表示某個故障的可能性因素的集合。表達n個網絡故障發生的概率,n的值隨著網絡具體情況而定,本文中抽取了五種可能性程度。
依據前文中的定義首先確定網絡故障風險發生頻率(NE)值。設定對象集合,其概率集合c={0.1,0.7,1,7,10}分別對應的集合是{網絡故障很少見,網絡故障比較少見,網絡故障平常,網絡故障很平常,網絡故障頻繁)。其(NE)值越小,表示網絡故障發生概率越小,網絡相對越穩定。
定義8:網絡故障影響后果集合D,表示網絡故障的后果情況因素集合。D={d1,d2,d3,d4,…,d},d1至d2表達n種故障后果程度n的值隨著網絡具體情況而定,本文中抽取了五種可能性程度。
依據前文中的定義首先確定網絡故障影響(Nc)值。設定對象集合,其后果值集合為D={0.1,0.8,1,8,10)分別對應的集合是{網絡故障后果不嚴重,網絡故障影響不好,網絡故障影響教學和辦公,網絡故障很影響教學和辦公,網絡故障非常影響教學和辦公}。其(NC)值越小,表示網絡故障影響范圍和深度越小,網絡質量相對好。
定義9:網絡故障衡量值E,表示網絡故障的衡量值集合。別對應A值集合的因素,通過將可能性集合B、網絡故障發生概率集合c、網絡故障影響后果集合D等集合評估量計算出具體的網絡故障衡量集合E。
依據風險發生的可能性(NL)、暴露于危險環境的頻繁程度(NE)、發生事故產生的后果(Nc)等參數的值,依靠計算公式ND=NL×NE×NC來衡量其對學校教學工作的負面影響值。
2.4基于LEC擴展的網絡故障衡量評估方法
傳統的LEC評估中的計算公式是:L=NL×NE×NC。其中對可能性、概率及后果嚴重性是等價的評估和計算,本文提出一種基于權值的網絡故障評估方法。
定義10:網絡故障可能性權值a,衡量網絡故障可能性集合在綜合衡量中的權值。
定義11:網絡故障頻率權值b,衡量網絡故障頻率集合在綜合衡量中的權值。
定義12:網絡故障后果權值c,衡量網絡故障后果集合在綜合衡量中的權值。
定義13:基于權值的網絡故障衡量計算公式ND=a×NL×b×NE×c×NC,其中a,b,c的值在0到10之間定義。
依托基于權值的計算公式,可以更加靈活來控制網絡故障發生可能性集合B、網絡故障發生概率集合c、網絡故障影響后果集合D等要素對最終衡量結果的影響力,能夠主動、靈活控制各個因素對網絡故障衡量值E的影響。
默認情況下,即a=6=c=1/3的時候,就和原始的LEC評估流程一致,但是可以隨著主動性管理需求,對其進行后期的調整,更加靈活地控制風險控制的因素集合和環節的權值。
3基于LEC的園區網網絡風險評估
3.1網絡故障風險評估分析
基于園區網網絡故障風險評估和分析需求,結合LEC的評估思想和流程,針對特定的網絡用戶群體,總結出表1所示的網絡故障風險評估分析表,對故障因素集合中的故障對象,分別設定其NL值、NE值及NC值。
依據評估分析矩陣,針對NL值來說,匯聚網絡故障和核心網絡故障發生概率是“網絡故障很不可能”,相對來說校園網核心是比較穩定的,而普通用戶最常見的“網絡故障極有可能發生”故障分別是電腦故障和認證密碼遺忘導致網絡服務受到影響。線路故障和個人操作失誤是“網絡故障可能發生”。
針對NE值來說,發生頻率中,最低的是匯聚網絡故障和核心網絡故障,是“網絡故障很少見”。而相對頻繁的是接入網絡故障,是“網絡故障比較少見”。最頻繁的是電腦故障、線路故障、個人操作失誤、認證密碼遺忘等故障因素,是“網絡故障平常”。
針對NC值,發生后果中,影響最深遠的是匯聚網絡,代表是“網絡故障非常影響教學和辦公”。校園骨干網絡是“網絡故障很影響教學和辦公”。接入網絡故障和線路故障是“網絡故障影響教學和辦公”。電腦故障、個人操作失誤、認證密碼遺忘是“網絡故障影響不好”。
3.2網絡故障風險評估量化矩陣表
針對網絡故障風險評估分析矩陣表,得出網絡故障風險評估量化矩陣表,計算出最終的ND值,如表2所示。
3.3網絡故障基于權值的評估矩陣表
在基于經典LEC評估矩陣中,沒有考慮權值的因素,在本環節中,引入了評估權值,比如學校最關注的網絡故障后果的影響力,將其權值設置最高;若其次再關注其網絡頻率,將其權值設置次高,將網絡故障可能性設置最低。
針對電腦故障和線路故障,對其頻繁因素考慮權值最重要,其他都次要,故其評估權值設定:a=1,b=2,c=1。
針對個人操作失誤和認證密碼遺忘,對其可能性考慮最主要,其他都次要,故其評估權值設定:a=2,b=1,c=1。
針對接入網絡故障對頻繁因素考慮最主要,對后果次之,對可能性考慮最小,對其評估權值設定:a=1,b=2,c=3。
針對核心和匯聚網絡故障,對后果考慮最主要,對可能性次要,故頻率考慮最低,故其評估權值設定為:a=2,6=1,c=3。基于此,最終基于權值的量化評估表如表3所示。
3.4網絡故障風險評估分析和預案
在引入了評估權值后,表3相對于表2其評估值發生了巨大變化,這是基于主動需求的一種權值選擇結果,高校網絡管理者和建設者可以基于管理需求,在網絡故障可能性、網絡故障頻繁、網絡故障后果中合理靈活選定權值來研究和解決網絡故障。
針對表2的網絡故障風險量化矩陣表,提出如下針對性預案:
針對網絡故障風險評估量化矩陣表,最終算出的ND值中,最高的分別是電腦故障和認證密碼遺忘。針對此,要做好電腦軟件和硬件的升級和維護,重視電腦安全和認證安全。
ND值中其次是線路故障,針對學校固有的老化鏈路要注意維修,老舊設備要更換,具體網絡維修過程中注意不影響在網運行的網線,以期降低網絡故障發生概率。
ND值中值得注意的是個人操作失誤也是非常重要的一個網絡故障根源,注意對廣大網絡用戶的規范操作培訓。
排在ND值末端的是接入網絡故障、匯聚網絡故障、核心網絡故障。雖然其值相對小,但是其影響力較大,需要從校園骨干核心層,強化網絡安全,強化配置優化,確保校園頂層設計的規范和安全。這樣能夠進一步降低網絡故障頻率,進一步減少網絡影響的深度和廣度。但是要注意的是接人交換機的故障率比較高,可能是接入設備老化和性能不足等因素導致,這就要求對接人設備定期巡查、更換。包括電源模塊、操作系統版本等,進一步在接入端強化網絡安全,確保網絡穩定。
4結論
結合高校網絡故障風險的分析需求和校園網絡故障原因集合實況,引入了基于LEC的評估算法和流程,并提出了評估量化流程,抽象出實例化的評估因素集合。
創新點在于結合故障因素和特點,給出了故障因素集和評估權值,細化了網絡故障因素,給出了可能性集合、故障概率集合及影響后果集合等,便于量化評估網絡故障后果程度。通過具體實例化,給出了網絡故障風險評估分析矩陣表和網絡故障風險評估量化矩陣表,針對細化的故障集合及量化評估結果,最終給出了網絡故障應對的預案,為確保高校園區網的穩定和安全提出了相關建議。