楊靖凡,孔繁鵬,韓立強(qiáng)
(中鐵信(北京)網(wǎng)絡(luò)技術(shù)研究院有限公司,北京 100038)
隨著信息技術(shù)的不斷發(fā)展和深入應(yīng)用,信息系統(tǒng)運(yùn)維成為企業(yè)信息化建設(shè)中不可或缺的一環(huán)。然而,隨著系統(tǒng)規(guī)模的逐漸擴(kuò)大、復(fù)雜性的增加,傳統(tǒng)的手工運(yùn)維方式帶來了更多新的挑戰(zhàn)和風(fēng)險(xiǎn),已經(jīng)難以滿足管理和優(yōu)化的需求[1]。知識(shí)圖譜作為一種新型的智能化技術(shù),可以通過對(duì)大量異構(gòu)數(shù)據(jù)進(jìn)行語義建模和圖論分析,實(shí)現(xiàn)知識(shí)的自動(dòng)獲取、處理和推理,實(shí)現(xiàn)信息系統(tǒng)運(yùn)維的問題快速發(fā)現(xiàn)并解決,提升運(yùn)維效率和服務(wù)質(zhì)量[2]。因此,知識(shí)圖譜在信息系統(tǒng)運(yùn)維領(lǐng)域中的應(yīng)用研究,具有重要的研究意義和實(shí)際應(yīng)用價(jià)值。
作為一種能夠廣泛結(jié)構(gòu)化各類知識(shí)的通用技術(shù),知識(shí)圖譜已在學(xué)術(shù)界及工業(yè)界取得了廣泛關(guān)注。知識(shí)圖譜是一種表示知識(shí)的語義網(wǎng)絡(luò),它能夠?qū)⒏鞣N不同來源、不同類型、不同格式的數(shù)據(jù)進(jìn)行融合和鏈接,并通過語義化建模來實(shí)現(xiàn)知識(shí)的自動(dòng)獲取、處理和分析[3]。
知識(shí)圖譜通常由基本的三元組構(gòu)成,即實(shí)體、屬性和關(guān)系。實(shí)體指現(xiàn)實(shí)世界中相對(duì)獨(dú)立存在且可區(qū)分的事物,如人、物與地點(diǎn)等,每個(gè)實(shí)體在知識(shí)圖譜中都有具有唯一性;屬性針對(duì)實(shí)體而言,主要描述實(shí)體的各類特征,如名字、顏色、價(jià)格等,與此同時(shí)屬性也可以作為實(shí)體使用,因?yàn)樗鼈円部梢該碛凶约旱倪M(jìn)一步屬性描述;關(guān)系指知識(shí)圖譜中實(shí)體之間的關(guān)聯(lián),其主要負(fù)責(zé)描述實(shí)體間的語義聯(lián)系,例如關(guān)聯(lián)關(guān)系、工作關(guān)系、位于關(guān)系等[4]。
知識(shí)圖譜作為一種新型的智能化技術(shù),可以通過三元組概念將各類數(shù)據(jù)結(jié)構(gòu)化,實(shí)現(xiàn)實(shí)體間的關(guān)系檢索及聯(lián)動(dòng)分析[5]。而在企業(yè)信息系統(tǒng)系統(tǒng)中,信息系統(tǒng)設(shè)備具有數(shù)量眾多、關(guān)系繁雜的特點(diǎn)。知識(shí)圖譜的技術(shù)特性很好地適配了這一情況,可以使運(yùn)維人員在運(yùn)維工作中快速檢索設(shè)備間的關(guān)系,同時(shí)縮短故障處置時(shí)間,綜合提升運(yùn)維效率與服務(wù)質(zhì)量文。
(1) 更強(qiáng)大的知識(shí)抽取與融合能力
本質(zhì)上,知識(shí)圖譜是建立在知識(shí)抽取和數(shù)據(jù)融合上的綜合技術(shù)。知識(shí)抽取可以實(shí)現(xiàn)對(duì)非結(jié)構(gòu)化數(shù)據(jù)的知識(shí)重構(gòu),自動(dòng)化提取出使用者感興趣的相關(guān)信息,并以實(shí)體、屬性及關(guān)系等三元組形式進(jìn)行展現(xiàn);而數(shù)據(jù)融合則將來自不同來源的數(shù)據(jù)進(jìn)行清洗,清除重復(fù)信息,并形成清晰統(tǒng)一的語義空間。這兩項(xiàng)技術(shù)的結(jié)合使得知識(shí)圖譜更加具有可擴(kuò)展性、靈活性和豐富性。
(2) 更易理解的知識(shí)結(jié)構(gòu)
知識(shí)圖譜的體系架構(gòu)往往包含了多領(lǐng)域的各類知識(shí),在提供全面豐富的知識(shí)檢索服務(wù)的同時(shí),繁雜的知識(shí)體系往往帶來知識(shí)的難以理解以及整合困難,而知識(shí)圖譜的特質(zhì)可優(yōu)化這一問題。知識(shí)圖譜可將實(shí)體和關(guān)系進(jìn)行結(jié)構(gòu)化組織與標(biāo)注,使內(nèi)容更易被人理解,同時(shí)具有更好的組織性和可讀性。另外對(duì)于機(jī)器而言,相較于傳統(tǒng)的數(shù)據(jù)處理方式,知識(shí)圖譜獨(dú)有的結(jié)構(gòu)化表示方式更容易被機(jī)器理解和處理,從而提升了系統(tǒng)在語義理解和深度挖掘方向上的分析能力。
(3) 更強(qiáng)的適用性
相比于其他數(shù)據(jù)分析技術(shù),知識(shí)圖譜在多領(lǐng)域都具有更強(qiáng)的適用性。目前知識(shí)圖譜技術(shù)在醫(yī)療、金融、教育及物聯(lián)網(wǎng)等多種行業(yè)中都得到了廣泛應(yīng)用并取得了較好效果,究其原因是各領(lǐng)域基礎(chǔ)設(shè)施均能普遍抽象為系統(tǒng)中的三元組,配合獨(dú)有的分析及展現(xiàn)方式,使其具備極佳的易用性及適用性,另外在提供基礎(chǔ)關(guān)系服務(wù)的同時(shí)還能進(jìn)一步提升數(shù)據(jù)分析和挖掘的效率與價(jià)值,為用戶提供清晰便捷的展現(xiàn)方案。
(4) 更便捷的可視化與交互模式
知識(shí)圖譜在數(shù)據(jù)的存儲(chǔ)和管理方面具有一定創(chuàng)新性,數(shù)據(jù)一般以有向圖形式用專有的圖數(shù)據(jù)庫存儲(chǔ),這種方式使圖數(shù)據(jù)庫在數(shù)據(jù)存儲(chǔ)和圖遍歷能力上極具優(yōu)勢(shì),可以快速檢索和查閱知識(shí)圖譜中的實(shí)體間關(guān)系,從而更好地支撐可視化和交互技術(shù),以更直觀、易懂且智能的方式呈現(xiàn)給用戶。一般知識(shí)圖譜會(huì)提供多種形式的可視化與交互方式,如圖形界面、查詢接口、API等,從而滿足不同用戶的使用需求。
隨著各大企業(yè)信息系統(tǒng)系統(tǒng)規(guī)模逐步擴(kuò)大,其運(yùn)行環(huán)境也越來越復(fù)雜,涉及的不同技術(shù)及平臺(tái)種類也在不斷增加,這增加了運(yùn)維工作的難度。而當(dāng)設(shè)備或某業(yè)務(wù)出現(xiàn)故障時(shí),如何快速定位故障并提供相應(yīng)故障鏈,明確故障影響范圍,是當(dāng)前亟需解決的痛點(diǎn)問題。
在設(shè)備故障層面,需在定位故障的同時(shí),快速確定故障影響的范圍,明確連帶遭受影響的相關(guān)設(shè)備;在業(yè)務(wù)故障層面,需在修復(fù)故障的同時(shí),明確本次故障涉及的全部硬件設(shè)備及系統(tǒng)。當(dāng)前相關(guān)運(yùn)維工具能夠較好地實(shí)現(xiàn)對(duì)單一設(shè)備或業(yè)務(wù)的故障診斷,但缺乏故障影響范圍分析及聯(lián)動(dòng)計(jì)算能力。故需提出一種覆蓋全面、易于理解的運(yùn)維方法,解決上述問題。
信息網(wǎng)絡(luò)由網(wǎng)絡(luò)設(shè)備、計(jì)算設(shè)備以及將之串聯(lián)起來的傳輸網(wǎng)絡(luò)等信息化基礎(chǔ)設(shè)施組成。在知識(shí)圖譜的框架下各類設(shè)備以及網(wǎng)段等可以構(gòu)成圖譜中的實(shí)體,而這些實(shí)體之間基于物理、邏輯的連接可以視為圖譜之中的關(guān)系。因此,信息網(wǎng)絡(luò)中各類物理設(shè)備和邏輯網(wǎng)段便可以基于連接關(guān)系構(gòu)成運(yùn)維圖譜。
基于以上架構(gòu),多層級(jí)運(yùn)維知識(shí)圖譜應(yīng)運(yùn)而生,其抽象OSI模型中的關(guān)鍵層級(jí)即覆蓋設(shè)備層、物理層、轉(zhuǎn)發(fā)層、路由層及應(yīng)用層,多角度覆蓋網(wǎng)絡(luò)系統(tǒng)實(shí)體,同時(shí)在各類運(yùn)維監(jiān)控系統(tǒng)的數(shù)據(jù)加持下可以動(dòng)態(tài)地呈現(xiàn)該實(shí)體和關(guān)系的變化狀況,客觀反應(yīng)當(dāng)前實(shí)體運(yùn)行狀況以及連接關(guān)系。其各層級(jí)主要設(shè)計(jì)內(nèi)容如下。
(1) 設(shè)備層
設(shè)備層是整個(gè)運(yùn)維知識(shí)圖譜的最底層,該層的視角主要聚焦在單臺(tái)的物理設(shè)備上。在該層里,每個(gè)物理設(shè)備可分解為本體實(shí)體和多個(gè)組件實(shí)體。其中,本體實(shí)體為設(shè)備物理層面的本體,組件實(shí)體則指代設(shè)備運(yùn)行所依賴的各個(gè)組件、模塊的實(shí)體。而組件實(shí)體也被分為兩類:一類包括該設(shè)備物理組件,如端口、CPU、內(nèi)存、風(fēng)扇、電源等;另一類為表征設(shè)備正常運(yùn)行的邏輯功能實(shí)體,如溫度、轉(zhuǎn)發(fā)表、路由表、進(jìn)程表等。設(shè)備層示例如圖1所示。

圖1 運(yùn)維知識(shí)圖譜設(shè)備層示例
(2) 物理層
在物理層中,存在兩種類型的實(shí)體:第一種是設(shè)備實(shí)體,設(shè)備的實(shí)體屬性來源于設(shè)備層的信息;第二種是鏈路實(shí)體,鏈路為連接各設(shè)備實(shí)體的網(wǎng)絡(luò)線路實(shí)體,其物理表現(xiàn)形式可以為光纖、網(wǎng)線、同軸電纜,也可以是無線通道。設(shè)備實(shí)體和鏈路實(shí)體之間通過自動(dòng)發(fā)現(xiàn)技術(shù)自動(dòng)構(gòu)建動(dòng)態(tài)的拓?fù)溥B接,進(jìn)而展現(xiàn)當(dāng)前網(wǎng)絡(luò)整體的實(shí)時(shí)物理層連接狀態(tài),并展現(xiàn)整體網(wǎng)絡(luò)物理層運(yùn)行態(tài)勢(shì),并在出現(xiàn)異常的連接或鏈接斷開后能夠快速感知。物理層示例如圖2所示。

圖2 運(yùn)維知識(shí)圖譜物理層示例
(3) 轉(zhuǎn)發(fā)層
轉(zhuǎn)發(fā)層對(duì)應(yīng)網(wǎng)絡(luò)的數(shù)據(jù)鏈路層。網(wǎng)絡(luò)內(nèi)配置了多少個(gè)二層VLAN域,便有多少個(gè)相互獨(dú)立的轉(zhuǎn)發(fā)層,每個(gè)獨(dú)立的二層廣播域?qū)?yīng)一個(gè)獨(dú)立的轉(zhuǎn)發(fā)層。從整體來看,轉(zhuǎn)發(fā)層是一個(gè)由轉(zhuǎn)發(fā)設(shè)備和端設(shè)備構(gòu)成的樹狀網(wǎng)絡(luò)。轉(zhuǎn)發(fā)層主要面對(duì)的是抽象化的物理設(shè)備,所展示的也主要是單一轉(zhuǎn)發(fā)域內(nèi)的連接關(guān)系。轉(zhuǎn)發(fā)層示例如圖3所示。
(4) 路由層
該層級(jí)對(duì)應(yīng)網(wǎng)絡(luò)的路由層,該層級(jí)將每個(gè)轉(zhuǎn)發(fā)層的轉(zhuǎn)發(fā)域上卷為一個(gè)網(wǎng)段實(shí)體。若干網(wǎng)段實(shí)體由路由設(shè)備連接,共同構(gòu)成一張路由網(wǎng)絡(luò)。從某一個(gè)網(wǎng)段出發(fā),到其他任意網(wǎng)段,都會(huì)建立一條由中間若干臺(tái)路由設(shè)備串聯(lián)起來的路由路徑,即路由層展現(xiàn)的是端到端的有方向的路徑。該層級(jí)主要對(duì)網(wǎng)段之間的路由異常及路由狀態(tài)進(jìn)行檢測(cè)。路由層示例如圖4所示。

圖4 運(yùn)維知識(shí)圖譜路由層示例
(5) 應(yīng)用層
該層級(jí)對(duì)應(yīng)網(wǎng)絡(luò)的應(yīng)用層,主要結(jié)合以上層級(jí)的綜合信息,依托每臺(tái)設(shè)備標(biāo)記的IP地址,將服務(wù)器等應(yīng)用實(shí)體進(jìn)行統(tǒng)一納管,構(gòu)建應(yīng)用層級(jí)的知識(shí)圖譜架構(gòu)。由于每臺(tái)服務(wù)器都有IP地址作為身份標(biāo)識(shí),轉(zhuǎn)發(fā)層域內(nèi)管理以及跨網(wǎng)段管理更加便捷。應(yīng)用層示例如圖5所示。

圖5 運(yùn)維知識(shí)圖譜應(yīng)用層示例
多層級(jí)運(yùn)維知識(shí)圖譜可面向?qū)嶋H運(yùn)維場(chǎng)景,針對(duì)性進(jìn)行問題溯源提示。結(jié)合以下示例可對(duì)其工作模式進(jìn)行呈現(xiàn)。
在某業(yè)務(wù)系統(tǒng)中,由“交換機(jī)1”作為核心連接著業(yè)務(wù)、管理和終端三個(gè)二層區(qū)域,其中每個(gè)區(qū)域都有一臺(tái)交換設(shè)備作為匯聚交換機(jī)同時(shí)承擔(dān)網(wǎng)關(guān)職責(zé),各區(qū)域均布屬帶外管理。該系統(tǒng)在業(yè)務(wù)區(qū)部署了探測(cè)設(shè)備,在管理區(qū)域部署了應(yīng)用服務(wù)器和存儲(chǔ)服務(wù)器,并在終端區(qū)部署了終端進(jìn)行訪問。場(chǎng)景中,探測(cè)設(shè)備需要向應(yīng)用服務(wù)器傳遞探測(cè)信息,終端具有訪問應(yīng)用服務(wù)器需求,同時(shí)應(yīng)用服務(wù)器會(huì)與同網(wǎng)段的存儲(chǔ)服務(wù)器進(jìn)行交互。其架構(gòu)示例如圖6所示。

圖6 某業(yè)務(wù)系統(tǒng)架構(gòu)示例
此時(shí)業(yè)務(wù)部門反應(yīng)某應(yīng)用訪問異常,可觀察多層級(jí)知識(shí)圖譜對(duì)于這一問題所做出的連鎖反應(yīng)。
針對(duì)應(yīng)用層,以IP地址作為標(biāo)記探測(cè)出在“交換機(jī)3”與應(yīng)用服務(wù)器出現(xiàn)故障;下探至物理層,“交換機(jī)3”、應(yīng)用服務(wù)器與二者中間鏈路均為不健康的狀態(tài),提示其部分參數(shù)出現(xiàn)異常;轉(zhuǎn)發(fā)層也可觀測(cè)到應(yīng)用服務(wù)器斷開連接;再次下探至設(shè)備層,觀測(cè)到交換機(jī)某網(wǎng)絡(luò)端口異常,查看其下聯(lián)參數(shù)時(shí)端口狀態(tài)為DOWN狀態(tài),最終判斷該故障為應(yīng)用服務(wù)器端口中斷。運(yùn)維知識(shí)圖譜分析邏輯如圖7所示。

圖7 運(yùn)維知識(shí)圖譜分析邏輯
多層級(jí)運(yùn)維知識(shí)圖譜可從多角度剖析實(shí)際運(yùn)維問題,輔助運(yùn)維人員將各類運(yùn)維數(shù)據(jù)進(jìn)行有機(jī)串聯(lián),同時(shí)通過時(shí)序數(shù)據(jù)存儲(chǔ),使運(yùn)維人員可以回溯故障時(shí)段的網(wǎng)絡(luò)運(yùn)行狀態(tài),為運(yùn)維事件處置與運(yùn)維經(jīng)驗(yàn)積累打下基礎(chǔ)。
運(yùn)維知識(shí)圖譜是一種新型的知識(shí)表示和管理方法,其憑借強(qiáng)大的知識(shí)抽取與融合能力,以及便捷的用戶交互模式,在運(yùn)維領(lǐng)域得到了廣泛關(guān)注。與此同時(shí),運(yùn)維知識(shí)圖譜仍存在數(shù)據(jù)來源不充分、知識(shí)表達(dá)方式有限等問題。相信在未來應(yīng)用場(chǎng)景持續(xù)擴(kuò)展、數(shù)據(jù)質(zhì)量不斷提高的大背景下,運(yùn)維知識(shí)圖譜將進(jìn)一步迭代優(yōu)化,并取得更好的應(yīng)用效果。