國網陜西省電力公司信息通信公司 張忠浩 趙西林 徐 敏 尚 勇
基于用戶體驗的應用性能可視化研究
國網陜西省電力公司信息通信公司 張忠浩 趙西林 徐 敏 尚 勇
本文在詳細分析了國家電網西北分部信息系統運維現狀的基礎上,采用理論分析與實踐結合的研究方法,建設了一種新的基于用戶體驗的應用性能管理平臺。通過可視化的業務性能和網絡性能關鍵指標,并結合成熟的網管技術,對影響業務的相關性能問題進行主動預警,快速識別潛在的風險,變被動運維為主動運維,為業務流量和應用性能提供可靠、科學的數據支撐,不斷提高應用性能和用戶滿意度,提升IT系統核心價值。
用戶體驗;應用性能管理;可視化;主動運維
“關鍵復雜應用不具備高性能和高可用性將直接給業務生產力,業務收入和IT效率造成負面影響。”——Forrester
國家電網公司高度重視信息化工作,通過信息化SG186和SG-ERP工程建設,建成了完整的一體化企業級信息系統,其基礎設施、硬件設備、應用系統、平臺軟件等軟硬環境建設水平得到快速提高。因此,如何對現有的運維流程進行優化,保障關鍵業務的高可用性和高性能,推進信息通信工作向更集約、更精益、更專業方向發展,成為信息化建設中面臨的重要問題。
國家電網公司西北分部現有重要系統數十套,覆蓋了規劃、建設、檢修、運行、人力資源、財務、物資等多個業務領域;在數據集成方式上,采用數據交換平臺(DXP)、數據中心和應用集成平臺(ESB)實現業務數據的橫向縱向級聯;在應用端集成方式上,采用單點登錄集成方式,實現了應用系統界面集成;由于應用系統數量眾多,邏輯關系復雜,使得系統運維工作難度較大。
在西北分部的持續投入及發展下,西北分部的信息系統運維管理水平取得了長足的發展,但隨著業務系統的復雜度提升,在運維工具、管理體系方面還存在提升的空間,這體現在:
(1)缺乏終端用戶感知體驗的監控。目前對于終端用戶的業務訪問真實質量監控手段缺乏,由于客戶端操作系統、服務器、數據庫、中間件、網絡等引起的突發性性能下降問題無法有效監控及定位。
(2)網絡流量和應用性能監控仍需要提高。網絡流量監控雖已具備一定的能力,但是網絡流量的監控顆粒度較粗,對于基于應用的流量監控仍存在明顯的不足,缺少基于業務的網絡流量和應用性能的可視化監控。
(3)運維分工帶來信息不對稱、突發事件處置效率低。由于信息系統規模龐大、集成度高、系統之間聯系復雜,在運維管理工作時往往采取將系統按照網絡、系統、數據庫、應用進行分層管理的方式進行管理。發生問題時涉及環節眾多,各層面運維管理人員分頭查找問題原因,各自為戰,一方面需要付出較多的溝通和定位問題的時間成本,另一方面導致事件處理時間過長,影響被放大。
針對這些情況,西北分部從實際情況出發,以網絡流量作為切入點進行面向業務的網絡流量和應用性能可視化研究,通過建設信息系統應用管理平臺,對網絡流量進行可視化和精細化監控與分析,面向業務,從監控最終用戶體驗出發,解決了目前運維管理中面臨的一些實際問題,最終達到提升業務連續性管理水平,提升運維管理水平的目的。
2.1 建設目標
2.1.1 建立完整的網絡流量監控分析平臺
建立西北分部的網絡流量監控分析平臺,建設基于業務流的端到端的性能監控體系,對業務流進行多點關聯監控部署,實現完整業務流的集中監控。
2.1.2 業務性能和網絡性能預警與告警
集中展現關鍵應用或業務的SLA服務水平。定義關鍵性能指標的閥值,與當業務或網絡相關性能達到閥值時,進行主動預警,快速識別潛在的風險,變被動運維為主動運維,
2.1.3 最終用戶感受監控和優化
從兩個層面實現最終用戶感受的監控,基于網絡流量的用戶體驗和基于HTTP應用的頁面訪問用戶體驗,同時監控HTTP應用層協議其它各項指標,為應用優化提供有價值的建議和意見。
2.1.4 性能故障的快速分析與定位
快速的對故障進行分析和初步定位,定位問題是網絡問題還是服務器問題等,在問題出現時提供第一判斷,為問題分析定位指明方向,使問題分析具有清晰的界面。
2.2 實施方法
本次系統建設在前期進行充分的需求調研基礎上,在實踐的過程中對原理和方法進行研究分析與驗證,在后期進行綜合測試和優化以確保業務監控的準確性和全面性。
2.2.1 需求調研
結合現有運維管理工作經驗、工作流程及歷史問題記錄,對現有應用流量情況、網絡情況及信息系統性能管理工作具體需求進行整體調研,確定管理范圍、業務架構及系統功能架構等內容。
2.2.2 業務梳理
制定包含業務系統相關的負載均衡、服務器、中間件、數據庫等組件的完整調研模板,通過該模板為載體,與應用管理部門進行有效溝通,形成系統調研報告,為后期的部署驗證工作提供數據支撐。
2.2.3 部署驗證
根據需求調研報告及系統調研報告在監控平臺內進行軟/硬件部署、業務監控定義、視圖定義、報警定義以及報表的定制等部署工作并通過系統抓包分析、現場客戶確認、架構分析等手段驗證部署的正確性及有效性。
2.2.4 經驗總結
利用應用性能管理系統,進行持續的日常性能監控、問題發現定位、問題處理工作,形成以業務系統特性為基礎的經驗分類總結庫,根據各類型應用的獨立特點形成性能管理經驗及監控模型,以便在后期類似業務上線時采用類似模型進行監控,利用歷史運維經驗提升問題定位及處理速度。

圖1 實施方法
2.3 系統實現
2.3.1 系統設計原則
應用性能管理系統總體設計遵循以下原則:
(1)先進性:業內先進解決方案,代表未來IT與業務融合趨勢;
(2)安全性:旁路、非侵入式的監控,對現有網絡和系統“零”影響;
(3)全面性:對全網流量、所有關鍵業務進行全面精細化監控;
(4)靈活性:業務監控部署靈活,具有多種靈活的性能指標展現方式。
2.3.2 功能結構設計
根據西北分部網絡及應用性能可視化的需求,結合西北分部現有環境,采用目前成熟的交換機SPAN技術,通過端口鏡像方式,匯聚數據中心和各網絡區域關鍵監控點的流量,并實現按需分配給相應的流量監測工具,實現基于業務系統、業務流對網絡流量進行實時的各項性能指標分析,定制關鍵業務性能指標告警,并實時地將告警信息以Syslog形式發送給網管平臺。
3.1 實施環境
本次應用性能可視化系統建設主要部署信息系統響應分析組件、事務分析組件、應用系統結構分析組件以及系統展示平臺,實施環境如表1所示:

表1 應用性能管理系統環境
3.2 應用效果
經過5個多月的系統建設和不斷地分析驗證,在西北分部構建了完整的應用性能可視化監控平臺,并建立了完善的業務可視化監控流程和規范,西北分部的業務清晰度和可視度得到了全面的提升,部門間的溝通合作進一步緊密,故障處理效率得到顯著提高,運維人員的業務意識和業務管理、問題處理水平也得到一定程度的提高。
搭建了完整的應用性能可視化監控平臺:
(1)通過構建應用性能可視化監控平臺,實現了西北分部全面、可視化、精細化監控關鍵業務系統的網絡流量及應用性能;建立對關鍵業務統一的預警、告警機制;同時在業務質量的分析與統計、業務性能優化與提升、新業務的開發和測試等方面提供有力的數據支撐,對未來基于大數據的數據挖掘方面的研究也提供了基礎的、必要的條件。
(2)實現了基于用戶體驗的性能監控。
性能監控更多關注了業務的終端用戶體驗,當業務的整體服務水平開始下降時,可以及時發現、深入分析,在一定程度上提高客戶的滿意度,提升了業務的價值。
(3)關鍵業務系統的實時預警與告警。
通過對歷史問題的分析、歸納和總結,精心挑選了12個監控指標進行集中監控,從最終用戶體驗出發,實現了對業務系統、業務流關鍵點的7x24小時不間斷監控。
(4)形成了快速故障處理主動運維流程。
以“恢復生產為第一要務”為生產運營核心理念,加強業務連續性和突發事件應急處置,建立了完整的生產運營管理體系。基于網絡及應用可視化平臺,借鑒網絡運維經驗,建立了快速故障分析和定位的流程,加快了故障分析和定位的速度,減少了故障處理時間,降低了故障影響的范圍和嚴重度,提升運維管理水平,提升了客戶的滿意度。
完善的應用性能管理體系不僅需要單一業務故障點的性能監控,還需要從網絡層面全面分析應用性能,完整的性能體系的建立還需要進行很長時間的研究和實踐。雖然西北分部的網絡及應用性能管理體系還不能解決所有的性能問題,但通過整合傳統監控工具軟件和應用性能監控平臺,并在該平臺及工具的體系上建立可行的、有效的應用性能監控體系方案,加強人員的培養,提升運維能力和自動化水平,西北分部正在逐步提高應用性能管理水平,提升信息科技風險管理水平。
[1]范建華,等譯.W.Richard Stevens(美).TCP/IP Illustarated Volume1:The Protocols[M].北京:機械工業出版社,2007:227-229.
[2]宋義華,班孝明.應用性能管理分析[J].金融科技時代雜志,2014,10: 65-67.
[3]李璐.應用性能管理解決IT架構難題[J].通信世界,2012,27: 78-80.

表4 最快速度到達參數測試

表5 最穩定到達模式參數測試
通過對表4中的耗時數據和其他的數據對比,可知在相同測試條件下,最快到達模式下的耗時是最少的,符合設計要求。通過表5的耗時時間和角度誤差兩項數據共同對比,加入隨機干擾信號和不加入隨機干擾信號下,耗時時間相當,誤差也不超過0.35度,說明了在最穩定到達模式下的設計滿足預期要求。
本系統設計了一個驅動電流可調節的以MOS管為核心器件的H橋電機驅動電路,其最大的驅動電流可達到1.3A;該驅動電路在電路仿真軟件中得到了理論的設計驗證;結合單片機外圍電路,它們構成了一套完整的微電機驅動系統;實際測試表明,該系統不僅能完成各個指標要求,細致的電路板設計使得電路板穩定性良好,能夠抵制一定干擾,同時還加入了豐富的人機界面,使得該系統易于使用,增強了實用性。
參考文獻
[1]康華光.電子技術基礎(模擬部分)[M].高等教育出版社,2005.7.
[2]電子技術基礎(數字部分)[M].康華光高等教育出版社,2005.7.
[3]胡漢才.單片機原理及其接口技術[M].清華大學出版社,2011.11.
[4]劉玫,張雨萍.電機與拖動[M].機械工業出版社,2009.1.
[5]李全利.單片機原理及接口技術(第二版)[M].高等教育出版社,2009.1.
作者簡介:
劉湃(1992—),男,在讀研究生,現主要從事自動檢測與控制的研究。
陳永軍(1972—),通訊作者,男,教授,碩士生導師,現主要從事電力電子與電力傳動的教學與科研。
阮波(1990—),男,碩士研究生,現主要從事電力電子與電力傳動、電子與通信工程方面的研究。
張忠浩(1969—),男,陜西西安人,高級工程師,主要研究方向:企業信息化、電力信息化運維。