


摘? 要:針對高校IT運維中出現的效率低下和服務不佳問題,文章研究設計了基于知識圖譜的IT運維總體架構。通過分析運維對象、運維服務流程、運維數據、采集分析處理、運維管理等模塊,構建了IT運維問答知識圖譜,實現了運維場景和孤立知識點的業務應用關聯,基于Neo4j和Python技術開發了IT運維問答系統,解決了運維效率低下和服務質量不佳的問題。
關鍵詞:知識圖譜;IT運維;問答系統
中圖分類號:TP391? 文獻標識碼:A? 文章編號:2096-4706(2023)07-0001-06
Abstract: Aiming at the problems of inefficiency and poor service in IT operation and maintenance in colleges and universities, this paper studies and designs the overall architecture of IT operation and maintenance based on knowledge graph. Through analyzing the operation and maintenance objects, operation and maintenance service processes, operation and maintenance data, collection, analysis and processing, operation and maintenance management and other modules, the IT operation and maintenance Q&A knowledge graph is constructed, and the business application association between operation and maintenance scenarios and isolated knowledge points is realized. The IT operation and maintenance Q&A system is developed based on Neo4j and Python technology, which solves the problems of low operation and maintenance efficiency and poor service quality.
Keywords: knowledge graph; IT operation and maintenance; Q&A system
0? 引? 言
國家教育信息化的深入實施,加速了高校智慧校園建設的步伐[1]。以筆者所在校為例,目前該校已實現宿舍區、教學辦公區及室外活動區網絡全覆蓋,身份認證實現一體化;學校教學、科研、管理和服務的系統建設及數據資源完成整合和集成,構建了統一的門戶和校級大數據;學校業務移動化建設已完成各項業務及流程向手機端的遷移,基于大數據的學生、教師畫像及分析決策逐步完成。隨之產生的問題是學校IT運維工作量加大,學校網絡設施、大數據、PC和移動門戶、網站群、網辦大廳業務系統,辦事辦公流程等軟硬件維護、系統維護、網站維護、數據維護、流程維護在面向3萬學生、2 000教工的服務中愈顯不足,服務方式落后和服務時間的過長導致師生不滿意度逐步上升,學校需要投入更多的人力來應對全校師生提出的各類維護需求及服務。受于事業單位人事制度的限制,學校存在IT運維服務擴大和IT人員編制緊張的矛盾,雖然通過人員兼職和學生助學的解決部分問題,但由于人員流動及數據隱私等情況,仍需探尋更佳的IT運維方案。
知識圖譜作為人工智能的重要基石,一直是學術界和工業界的熱點,廣泛應用于電商、醫療、金融等領域[2,3]。本文嘗試將知識圖譜引入IT運維領域,將其作為核心探索IT運維總體架構的構建,在此基礎上,探討IT運維知識圖譜的構建?;谥R圖譜的IT運維體系,能將各孤立知識點通過業務環節串聯后形成一個業務知識鏈條,為各類系統運維人員提供解決方案參考,也會提升運維效率及用戶滿意度[4]。同時,本文構建的IT運維知識圖譜作為一種基礎數據服務,為學校上層智能應用提供數據支撐,也為后續建設強大的智能運維體系提供支撐。
考慮到學校師生員工提出的很多問題及服務需求具有重復性,大部分可直接回復或一鍵式解決[5-8]。作為IT運維知識圖譜的應用實例,本文基于Python+neo4j搭建了問答系統,作為人工客服的有益補充,能減緩一線運維人員的工作強度和壓力,提高運維效率和質量。
1? IT運維總體架構
1.1? IT運維概念
IT運維管理,是指IT部門采用相關的方法、技術、手段、流程、制度和文檔等,對IT軟硬運行環境、IT業務系統和IT運維人員進行的綜合管理[9,10]。
IT運維對象包括硬件設備、服務應用、業務系統、網絡、機房動力設施、布線和運維對象采集的數據和各類日志等;運維管理涉及網絡拓撲、設備、應用服務、數據存儲、業務系統、目錄內容、資源資產、信息安全、IT服務、流程等。
1.2? IT運維平臺架構設計
IT運維平臺總體架構采用分層設計,自上而下分別是統一運維門戶、IT運維管理層、知識圖譜方法和算法層、數據層、運維對象及數據采集層,如圖1所示。
1.2.1? 統一運維門戶
統一運維門戶是系統功能實現、人機交互的窗口,可通過大屏、3D、PC、手機等方式展現;展示內容包含業務、應用、網絡、流量、巡檢報告、實時監控等。
1.2.2? IT運維管理層
運維管理層實現了平臺所有的業務管理功能,負責處理運維門戶提出的所有服務請求,這一層中的配置部分包含了模塊配置、流程引擎、分派規則管理、工作時間管理、報表設置、輸出表單、集成接口和數據管理等功能,滿足運維業務各種流程的管理應用和環境應用配置。
1.2.3? 算法能力層
算法能力層是所有運維業務管理功能實現的算法支撐,是根據系統邏輯需要,基于知識圖譜方法和數據層實現的實體三元組抽取、推理過程?;舅惴ㄓ校夯谝巹t詞典和統計機器學校的實體抽??;基于馬爾可夫邏輯網和深層隱含的關系抽??;基于規則與啟發式算法的屬性抽??;基于語義相似度和鏈接預測的文本相似度計算;基于傳統概率模型和機器學習的實體對齊算法;基于語法語義抽取、聚類和模式匹配與分布相似度的知識加工方法;基于邏輯和圖的知識推理方法等。
1.2.4? 數據層
數據層是整個運維管理的基礎支撐平臺,包含結構化數據和非(半)結構化數據。結構化數據有基礎配置數據、工單數據、CMDB數據、信息資產數據、拓撲數據、實時運行和歷史數據、流程數據、環境和告警數據、業務和性能數據、案例庫等;非(半)結構化數據有自助方法、實施細則、故障分析報告、故障處置預案、異常處置手冊、運行管理規定、事件恢復方案、問題解決方案、操作手冊與說明書、制度與規程等。
非(半)結構化數據經過實體三元組抽取,與結構化數據(整合第三方數據庫)進行實體對齊,再經過本體構建和質量評估,以Neo4j圖數據庫存儲系列運維知識圖譜:概念圖譜、設備實體圖譜、業務邏輯圖譜、案例圖譜、應用圖譜、解決方案圖譜、組織架構圖譜等。
1.2.5? 運維對象及數據采集層
運維對象及數據采集層實現數據采集的全過程控制和采集數據的加工處理。在這一層,可采用K-means等聚類算法實現對監控項峰值的分類,建立預警等級劃分;采用網絡發現算法實現網絡拓撲圖;采用Nagios等開源監控系統,實現網絡服務、主機可用資源和運行狀態、故障、日志、主機冗余等監控功能;通過數據挖掘等數學方法,生成最佳預警方案;分析設備監控信息,生成設備性能報表;采用均方差模型,進行資源統計分析;通過聚類分析等算法,發現設備間影響依賴關系,挖掘最佳故障解決方案。
2? IT運維知識圖譜構建
知識圖譜構建是IT智能化運維的基礎,也是核心問題之一。IT運維知識圖譜屬于領域知識圖譜,可遵循通用知識圖譜構建流程與框架,采取自頂向下的構建模式。首先,基于經過整合和底層采集的數據設計IT運維知識圖譜本體,將結構化和非(半)結構化的知識通過一定的框架聯系起來;然后通過信息抽取和融合技術,將實體和運維關系從原始數據中分離出來,按本體框架連接成知識圖的表示形式;最后運用知識推理技術,現有知識圖譜不斷產生新的知識,為預測和推斷服務提供支持。
2.1? 知識圖譜定義
知識圖譜本質上是一種大型、結構化的語義知識庫,以符號形式描述客觀世界的概念實體事件及其之間的關系[11]。通俗講:知識圖譜是由實體、關系和屬性組成的一種數據結構。
2.2? 知識圖譜構建
2.2.1? IT運維本體
IT運維本體包括實體類型、實體的屬性類型及實體間的關系類型,即表示圖結構的抽象概念結構類。IT運維知識圖譜本體覆蓋“用戶—網絡—硬件—數據—軟件—服務進程”“問題—分類—工單—故障—變更—配置—知識”“用戶—IT設施—場所”“設備—設備—軟件—數據庫—組件—知識”等連接、安裝、推送、包含、訪問、并列、因果、偶然的復雜、多元和多路徑交互關系。
2.2.2? IT運維實體構建
IT運維知識圖譜知識實體類型主要有:網管軟件、數據庫、中間件、統一身份認證、應用軟件、業務系統、公共平臺、網絡安全設備、機房、IT場所、網絡、預警、告警、巡檢、問題、操作、故障、工單、知識、配置、資源、腳本、數據采集、監控、網絡服務、事件、變更、任務、基礎設施、分類、狀態等。
為便于知識的統一表達理解和外部數據的融合消歧,不同類型實體的屬性描述須遵從相關約束。IT運維知識圖譜實體屬性主要有:名稱、別名、編號、版本、節點、秒請求、秒處理、并發會話、連接、緩存命中率、可用性、慢查詢、阻塞、死鎖、響應請求、隊列、收包、發包、最大值、打開文件、Follow、Znode、Watch、密碼、角色、組、權限、部門、IP、MAC、CPU核、位置、人員、操作、部門、地址、服務、CPU、內存、使用率、方向、丟包率、級別、進度、記錄、下載、操作、動作、事件、申報、程度、姓名、手機、電話、郵件、活動、方法、知識、滿意度、建議、通知、流程、備注、故障、詳情、任務、型號、規格、原則、推送、頻繁度、重要性、權值、匹配度、分數、日期、推薦、標題、附件、路徑、數量、評論、收錄、關鍵字、事務、日志、操作、報警、預警、申請、描述、操作系統、存儲、網絡、磁盤、流量、效率、通知、閾值、故障、合同、網址、廠商、組件、產品、狀態、模塊、時間、形式、方案、內容、審核、機房、預警、告警、巡檢、問題、操作、工單、知識、配置、資源、腳本、協議、事件、變更、設備、類型、狀態、分析、報表、報告、自助方法、手冊、制度規程、案例、說明、腳本、軟件、教程等數據定義。
2.2.3? IT運維知識圖譜實體關系構建
實體類型定義將描述運維實體特征的相關信息形成孤立的知識節點,但這些節點間無語義關系,無法進行語義搜索及語義路徑推理分析。本文通過分析、提取IT運維管理體系、運維技術架構、運維服務流程及運維文檔中的線索邏輯關系,構建了IT運維知識圖譜實體關系集合。
IT運維知識圖譜的實體關系覆蓋了“網絡—硬件—數據—軟件—組件—服務進程”“用戶—問題—分類—工單—故障—變更—配置—知識”及“用戶—IT設施—場所”之間的連接、訪問、安裝、推送、執行、組成、創建及描述等多路徑交互關系。比如:運維架構相關的:網絡—(構成、包含)—設備、設備—(連接)—設備、設備—(安裝)—數據庫、軟件、IT設施—(位于)—場所、用戶—(使用)—IT設施、設備、設備—(推送)—知識、軟件—(執行)—服務進程、軟件—(訪問)—數據庫—(包含)—組件、IT組件—(連接)—IT組件、服務器—(連接)—網絡設備、服務器—(組成)—處理器,內存,硬盤,進程,服務,網卡、網絡設備—(組成)—接口、CPU、內存、電源、風扇、溫度、應用、中間件、數據庫—(使用)—主機系統、IT服務(OA、網辦大廳、網站群、統一身份認證、WELINK)—(使用)—IT組件(交換機、服務器、數據庫、中間件、存儲、應用系統);運維服務相關的:問題—(屬于)—分類、問題—(創建)—工單、工單—(描述)—故障、故障—(涉及)變更、變更—(實施)配置、問題—(查詢)—知識、故障—(相關)—軟件、硬件、故障—(提出)—問題—(申請)—變更、問題—(升級)—故障、事件—(并列、因果、偶然)—事件、方案、案例—(存儲)—知識、IT服務(OA、網辦大廳、網站群、統一身份認證、WELINK)—(涉及)—機構、人員、角色;網絡拓撲相關的:網絡拓撲—(包含)—服務器、網絡設備—(運行)—應用系統、業務系統—(包含)—監控—(目標)—終端、端口、鏈路、訪問流量、上網行為等。
2.3? 知識融合、加工及更新
在知識和數據正式進入知識圖譜前,為避免知識重復和名稱歧義,需要對所有知識數據進行去重、消歧、梳理及審核等加工處理,最終才能為運維所用。以后隨著業務需求和系統功能的變化,知識圖譜的知識數據也要相應進行調整和更新。
3? 應用實例
3.1? IT運維問答知識圖譜構建
由于在高校運維和項目實施中積累了大量的知識、經驗、方案、流程、模板、詳細設計、操作手冊等資料,本文對這些積累在項目及技術顧問等個人手中的資料文檔進行整理、規范及知識提取后構建了IT運維問答知識圖譜。
基于學校具體業務需求和實際業務問題問答運維的需要,本文構建的問答知識圖譜包含7個實體類型,6個關系類型和8個主屬性,如圖2示。運行語句:“MATCH (m)-[r]-(n) return m,r,n”后,問答知識圖譜如圖3所示。
運行語句:“MATCH (m:Keywords)<- [r:key_words]-(n:Maintenance) where m.name ='OA移動' return distinct n.name, n.desc, n.instructions, n.department,n.telephone, n.cause, n.area, n.correlation”,得到關于移動辦公設置的相關描述內容,如圖4所示。
3.2? IT運維問答實現
本文基于3.1構建的問答知識圖譜,采用Python+neo4j,開發了IT運維問答系統,實現了學校師生經常咨詢的關于校園網、統一門戶登錄、網站建設、PC應用門戶、移動應用門戶、網辦大廳等一類常用業務如何設置、使用及辦理的問答。
3.2.1? 問答流程
知識圖譜問答方法可采用基于規則模板的方法和基于深度學習的方法,本文綜合兩種方法,對問答系統進行了設計,流程如圖5所示。
在問答流程中,首先建立本體庫和用戶詞典,用戶發出提問后,問答系統對問句分詞、向量化后與用戶詞典、本體庫進行匹配,將問句中直接匹配識別出或運用語義相似度算法識別出的實體類型和用戶關鍵詞進行提取,之后對問題進行分類。本文建立了8種問句類型,通過提取問句中的疑問詞與用戶疑問詞分類詞典匹配后實現分類。問答系統基于分類后提取的實體類別和實體進行解析后生成本體三元組,據此構建Cyper語句進行描述,然后發送Cyper語句到neo4j圖數據庫查詢。然后將查詢返回數據與系統匹配提取的答案模板進行整合,將最終解答回復給用戶。
3.2.2? 問答系統實現
本文基于3.1建立的問答知識圖譜,采用上述問答流程和方法,開發了問答系統,界面如圖6所示。高校師生只需在界面下方文本框中輸入自己需要解答的問題,點擊“SENT”提交后,系統立即給出答復。如系統匹配不到問題相關內容的答復,會給出友好提示,轉向人工服務。
4? 結? 論
針對高校IT運維量加大與IT運維人員編制不足的矛盾問題,本文探討了基于知識圖譜的IT運維總體架構。該架構采用分層設計,自上而下分別是統一運維門戶、IT運維管理層、知識圖譜方法和算法層、數據層、運維對象及數據采集層。在此基礎上,本文通過分析運維對象、運維服務流程、運維數據及其采集分析處理、運維管理模塊等內容,構建了IT運維知識圖譜:包含IT運維場景中涉及的軟件、硬件、服務、流程、知識等30個實體類型、140個主屬性、30個實體關系類型。知識圖譜作為架構的核心,為整個運維體系提供數據和算法支撐,推進了IT運維自動化、智能化的進程。
作為應用實例,本文結合學校具體業務,構建了IT運維問答知識圖譜,包含7個實體類型,6個關系類型和8個主屬性。在問答知識圖譜基礎上,本文采用Neo4j和Python等技術開發了問答系統,實現了師生常用業務的咨詢問答功能,是學校人工客服的有益補充。
參考文獻:
[1] 賈志偉,秦銘謙,林勤.高校信息化運維服務模式與應用實踐 [J].現代信息科技,2020,4(14):134-136.
[2] 錢雙雙.金融領域的知識圖譜構建與應用 [D].杭州:浙江工業大學,2020.
[3] 王倩玉.領域知識圖譜構建及其在財務審計的應用 [D].南京:南京審計大學,2019.
[4] 徐增林,盛泳潘,賀麗榮,等.知識圖譜技術綜述 [J].電子科技大學學報,2016,4(45):589-605.
[5] 鞏宇,李碧薇,李德華,等.基于知識圖譜的電力設備故障知識庫構建方法 [J].計算機科學與技術,2021(7):72-77.
[6] 喬振浩.基于知識圖譜的問答系統研究與應用 [D].哈爾濱:哈爾濱工業大學,2020.
[7] 張崇宇.基于知識圖譜的自動問答系統的應用研究與實現 [D].北京:北京郵電大學,2019.
[8] 王鑫雷.基于中文知識圖譜的問答系統研究 [D].大連:大連理工大學,2021.
[9] 吳慧韞.國內外高校IT運維發展狀況 [J].中國教育網絡,2015(7):34-36.
[10] 蔣正亮.高校IT運維知識庫的業務模型設計與實現 [D].廣州:暨南大學,2016.
[11] 田玲,張謹川,張晉豪,等.知識圖譜綜述—表示、構建、推理與知識超圖理論 [J].計算機應用,2021,41(8):2161-2186.
作者簡介:李建青(1972.11—),女,漢族,山西太原人,講師,碩士研究生,研究方向:人工智能。