◆楊 陽李 欣徐 敏
(1.國網陜西省電力公司信息通信公司 陜西 710048;2.國家電網公司西北分部 陜西 710048)
論信息系統健康評價模型建設研究
◆楊 陽1李 欣2徐 敏1
(1.國網陜西省電力公司信息通信公司 陜西 710048;2.國家電網公司西北分部 陜西 710048)
信息系統健康度評價是建立在科學、客觀的基礎上,通過對信息系統涉及的軟件、硬件、網絡、安全、基礎環境等諸多環節進行歸納總結,依據信息系統運行和發展規律,從整體、局部兩個方面對信息系統運維進行指導,使運維工作更加高效。通過長期工作的經驗總結出一套信息系統健康評價模型,模型可以對信息系統運行健康進行量化評估,可以直接指導下一步的運維調整和優化。
信息系統;健康評價模型;運維
隨著國家電網公司IMS(信息運維綜合監管系統)、BTIM(綜合網管系統)、APM(應用性能管理系統)等信息通信支撐系統的建成,信息系統運行、應用等數據實現了實時監測及記錄,數據呈現出“數量大、速度快、類型多、真實性”的特點,已具備數據分析、挖掘的條件,迫切需要應用大數據分析手段,加強信息系統運行分析,從復雜的系統運行數據集合中發現新的關聯規則,為信息系統運行、應用水平的提升提供可量化的數據支撐,為此提出信息系統運行性能分析和信息系統健康評價作為運維工作的重要支撐手段[1]。
為了保持系統的健康,需要定期進行全面的系統檢查,根據系統檢查報告采取相應優化措施,以保證系統達到預期的功能與性能,保證業務健康和可持續發展[2]。
我們針對國家電網公司西北分部業務系統的特點,通過建立信息系統健康評價模型來開展信息系統健康評價工作,實踐中選取比較典型的信息系統,對評價模型產生的檢驗結果進行分析,利用分析數據對模型進行修正,從而不斷完善評價模型[3]。
信息系統健康評價模型是由基礎數據、評價方法、權重選擇三方面組成的。根據現有的基礎設施、主機設備、存儲設備、操作系統、中間件、數據庫、業務系統軟件[4]設計一套評價模型,通過評價模型計算出一套信息系統健康度,是一個量化的指標,模型的建立基于以下幾個方面進行考慮[5]。
2.1 模型構建的要素
(1)硬件的健康狀態。主要評估該信息系統主機及存儲的健康狀態情況,主要包括了基礎設施、主機設備、存儲設備;
(2)系統軟件的健康狀態。主要衡量信息系統的系統軟件健康情況,主要包括了操作系統、中間件、數據庫;
(3)業務系統應用的健康狀態。主要衡量信息系統業務運營是否順暢、高效。
2.2 健康度模型評價方法
2.2.1 健康度指標選取原則
信息系統健康度指標的選擇主要遵循SMART(Specific,Measurable,Attainable,Relevant,Time bound)原則[6]。
Specific即健康評價模型中的各可評價指標必須是明確的,不籠統;
Measurable即健康評價模型中的各可評價指標必須是可以用數量來表示;
Attainable即健康評價模型中的各可評價指標必須是可以量化評估;
Relevant即健康評價模型中的各可評價指標必須與信息系統相關的,能夠給信息運維工作提供參考,有助于提升信息運維水平;
Time bound即健康評價模型中的各可評價指標必須是在特定時期內的,如果沒有時間限制,所做的評估也就沒有意義,無法給運維工作提供相關的支持。
2.2.2 健康度指標權重選擇原則
為科學評價信息系統的健康度,克服主觀賦權隨意性較大的缺陷,故采用歷史數據分析及組合賦權法[7]進行研究,組合賦權其由定量研究與定性研究方法按不同的權重組合而成,定量賦權的方法為目前使用廣泛且科學的熵值法[8],定性研究的方法為專家打分法,組合賦權法克服了傳統單一定量研究與定性研究的缺陷[9]。
2.3 健康度指標詳解
信息系統的健康度指標可以從基礎設施、主機設備、存儲設備、操作系統,中間件,數據庫,業務系統軟件的健康度七個方面來分析[10]。
2.3.1 基礎設施的健康指標
基礎設施的健康指標主要由以下方面的健康指標組成:
(1)機房溫度;
(2)機房濕度;
(3)機房電壓;
(4)機房UPS;
(5)機房安全措施,包括了防雷、屏蔽、接地、封堵、門禁、消防幾個方面。
2.3.2 主機設備的健康指標
主機設備的健康指標主要由以下方面的健康指標組成:
(1)設備外觀,包括告警指示燈狀態、線路標簽狀態、線纜標簽標識狀態;
(2)運行年限;
(3)設備無故障運行時長;
(4)家族性產品缺陷,包括產品公開隱患缺陷、公布配件壽命情況;
(5)設備冗余狀態,包括電源機集群或備機、CPU及內存冗余、磁盤raid冗余。
2.3.3 存儲設備的健康指標
存儲設備的健康指標主要由以下方面的健康指標組成:
(1)設備冗余狀態,包括了電源及供電冗余、通道冗余、控制器冗余;
(2)設備缺陷狀態,包括了日志告警事件;
(3)設備缺陷情況,包括了控制器負荷率、存儲空間使用容量;
(4)數據復制與保護,包括了磁盤raid冗余、異地數據同步及備份。
2.3.4 操作系統的健康指標
操作系統的健康指標主要由以下方面的健康指標組成:
(1)系統安全加固,包括了補丁是否最新、是否安裝防病毒軟件、是否按照安全加固基線進行加固;
(2)系統負載,包括了內存負載情況、CPU負載情況、磁盤IO負載情況;
(3)系統日志審查,系統是否開啟日志審計功能;
(4)系統運行時長,系統健康運行時長狀態評估;
(5)操作系統備份狀態,系統是否有備份。
2.3.5 中間件的健康指標
中間件的健康指標主要由以下方面的健康指標組成:
(1)中間件版本;
(2)冗余狀態;
(3)參數配置狀態,包括了內存配置狀態、中間件是否配置日志存放路徑;
(4)缺陷情況;
(5)負載情況。
2.3.6 數據庫的健康指標
數據庫的健康指標主要由以下方面的健康指標組成:
(1)數據庫版本,是否是最近穩定版;
(2)缺陷情況,是否具有家族產品缺陷;
(3)冗余情況;
(4)數據庫負載情況;
(5)數據庫備份情況。
2.3.7 業務系統軟件的健康指標
業務系統軟件的健康指標主要由以下方面的健康指標組成:
(1)缺陷情況,是否具有家族產品缺陷;
(2)歷史問題,歷史業務系統產品原因產生的故障。
2.4 模型計算公式
采用歷史數據分析及組合賦權法以及專家打分法,得出信息系統健康評價模型計算方法。
健康指數得分:
H=I*10%+S1*10%+S2*20%+O*20%+M*10%+D*20%+A*10%
其中H代表信息系統健康指數,I代表基礎設施,S1代表主機設備,S2代表存儲,O代表操作系統,M代表中間件,D代表數據庫,A代表業務系統軟件。而健康指數的各項指標都由各自的評價內容、狀態量、權重、指標閾值計算出相應的得分項。
以3個業務系統為對象進行數據采集與分析,數據采集工作以月為周期進行,數據采集如下:

表1 主要系統健康指數評分表

11月 100 100 98
由表1可以看出,在A系統、B系統、C系統中,A系統和C系統的健康指數得分數據有較明顯的變化,現在對C系統的健康指數進行逐項分解分析。

圖1 該系統健康指數柱狀圖
由圖1柱狀圖可以看到,通過健康評價模型可以及時定位業務應用系統存在的問題,在實踐中,通過系統健康指數的變化可以有效跟蹤相應問題是否得到有效解決。
通過開展信息系統健康評價體系建設,對信息系統涉及的軟件、硬件、網絡、安全、基礎環境等諸多環節進行歸納總結,然后通過信息系統健康模計算得出的數據、圖形,再依據信息系統運行和發展規律,從整體、局部各方面對信息系統運維進行指導,提高運維工作的效率。
但是信息系統評價是個動態的過程,其指標的權重會隨著不同的信息系統環境而發生變化,本文中權重的選取是由信息系統領域的專家給定的,具有一定的代表性和實際性,有助于該健康評價體系的建立和評價。
以此信息系統健康評價模型為基礎,在工作中不斷補充和完善該模型,最終達到提升信息系統的運維水平的目標,實現運維工作從主動發現到提前預防的價值體現。
[1]曹瑞昌,吳建明.信息質量及其評價指標體系[J].情報探索,2002.
[2]陳曉劍,梁梁.系統評價方法及應用【M】.合肥:中國科學技術大學出版社,1993.
[3]鄭聲俊,王國仕,董衛魏.基于運行監控技術的信息系統健康度評價體系[J].自動化應用,2015.
[4]安忠,吳洪波.管理信息系統【M】.北京:中國鐵道出版社,1998.
[5]侯炳輝,程佳惠,曹慈惠.信息系統評價體系及評價方法[J].中國管理科學,1993.
[6]柳純錄,劉明亮.信息系統項目管理師【M】.北京:清華大學出版社,2005.
[7]閔文杰,陳建明,張仲義.信息系統評價指標體系及方法的研究[J].鐵道學報,2000.
[8]胡帆,袁蓓.信息系統評價方法的研究與改進[J].科技創新與應用,2015.
[9]徐維祥,張全壽.從定性到定量信息系統項目評價方法研究[J].系統工程理論與實踐,2001.
[10]于本海.管理信息系統綜合評價指標體系及方法的研究[J].中國煤炭工業,2004.