高峰 王迪 張靜
性能基線就是在可控的標準化的環境下,通過測試工具采集和人工分析后得出的有參考價值的指標數據,其主要作用包括:
為容量規劃確定系統和應用程序的標準參考數據;
為配置測試的參數和配置選項提供參考依據;
為驗收測試確定系統是否具備自己所宣稱的能力;
為性能基線的建立提供長期的數據統計來源以及比較基準。
目前,河南省電力公司的基線管理辦法是借助應用性能管理軟件,配合撥測系統,了解和掌握系統當前在運情況,然后以平均值的方式計算出系統的平均運行基線,在此基線的基礎上上浮和下調一定比例來計算基線值。依賴這種基線管理辦法,河南省電力公司為部分系統制訂了基礎的性能管理基線,基線管理工作已經取得一定成效,但由于這種基線管理辦法依賴運維人員經驗,基線的建立沒有可靠的數據及科學依據,且無法覆蓋業務系統的主要業務操作,在實際管理過程中存在以下問題:
(一)重點業務不清晰
目前的基線管理工作,是以業務為單位開展的,一個應用系統內哪些業務操作是重點操作難以進行有效區分,這就使基線的制訂工作缺乏重點,實際使用過程中哪些系統的哪些業務操作是常用且重要的功能,缺乏有效分析手段。
(二)缺乏細節的數據采集
目前正在進行的基線管理工作,利用APM工具能夠基于URL采集到不同業務系統的響應時間,但由于國網目前一些重要系統的特殊性,如營銷系統,PMS系統等系統,系統具體操作業務之間的切換是以URL參數進行傳遞,整體URL路徑不發生變化,目前無法統計具體業務操作的響應時間,無法采集并計算具體業務操作基線。
針對這些情況,河南省電力公司從實際情況出發,以信息系統運行性能指標作為切入點進行面向業務的性能基線分析處理研究,通過建設性能基線管理平臺,基于歷史數據,利用統計學原理計算科學基線,使性能基線管理活動更加深入有效,從人工統計轉變為自動化、科學化的基線管理。
(一)建設目標
通過數據采集分析、基線模型生成、重要業務梳理等一系列工作,精準掌握重要業務系統重要業務的性能基線,并根據該基線數據進行持續監控,發現、分析處理性能問題,為河南省電力公司信息系統穩定運行提供有效人員及技術支撐。
(二)實施方法
河南省電力公司通過系統的數據采集、模型生成、關鍵業務梳理、業務統計分布、基線預測等方法,為業務系統的基線管理、基線監控、基線梳理、基線生成提供了可靠技術支撐。
1.數據采集
采用嵌入式引擎的方式進行數據的采集,完成數據全量采集工作,實現業務基線數據的獲取與分析,數據分析數據精度達到URL參數級,完成業務性能數據的細節采集工作。
2. 模型生成
開展模型生成工作,以采集到的業務流量為基礎,利用統計學模型進行基線生成,使信息系統應用性能管理的基線具備科學性和有效性,模型可采用六希格瑪質量管理方法,對歷史數據99%的數據作為上下基線。
3. 關鍵業務梳理工作
開展關鍵業務梳理工作,將不同單個功能的URL進行關聯,從而使重要業務系統之間形成工作流,并對此工作流進行基線計算,從而使基線分析處理工作基于用戶實際操作行為進行,而不僅僅針對具體頁面。

4.業務統計工作
開展業務統計分布工作,按照統計學二八原則對數據進行統計,統計出一個系統內用戶訪問最多的業務,使數據基線制訂工作具有更強的針對性。
5.數據預測工作
基于基線開展數據預測工作,基于歷史數據的統計學方法預測,根據現狀預測出問未來系統的變化趨勢,從而幫助管規避部分業務問題。
(三)系統實現
1.系統架構
基線系統采用模塊化的方式設計,利用嵌入式的數據采集引擎進行代碼級運行指標數據采集,之后將采集到的代碼執行效率數據存儲至代碼執行效率數據庫內,將運行相關信息存儲到關聯分析數據庫內,系統代碼性能分析引擎則對這些采集到的數據進行處理,在代碼執行效率分析、內存分析、參數關聯分析、數據庫語句分析引擎的共同作用下,為用戶提供代碼實時監測、關聯分析報告、數據庫深度監測功能。系統的架構具體如圖1所示。
2.功能實現
基線系統通過嵌入式數據采集引擎采集來自中間件、應用服務器、數據庫上的代碼執行效率數據以及運行狀態數據,并將數據存儲數據庫內,在這里數據處理分析引擎會對獲取到的各類數據進行處理并進行關聯分析存儲,存儲的數據最終將由數據應用層展示給用戶,進行數據的各類監測、分析以及處理工作。
(1)重要業務系統運行數據采集分析
采集重要業務系統運行數據,采集的數據應重點關注不同業務系統的響應時間,同時在采集力度上能夠達到URL參數級別,以此區分重要業務系統內部重要業務操作數據,為基線的分析工作提供數據基礎。
(2)業務交易量分析
提供重要業務的操作交易量排名報表,能夠按照不同應用系統進行區分,以此幫助管理人員分析出哪些業務操作是工作中經常會用到的重要操作,并重點計算這些業務的響應基線。
(3)業務基線計算
通過對采集到的數據進行分析實現不同業務,不同細節業務以及不同時段的基線計算,基線的計算方法應依賴統計學原理,包括數據正態分布校驗,基于六希格瑪的統計學基線計算等。
(4)業務運行數據預測
提供基于歷史數據的預測活動,能夠利用統計學知識進行數據預測,實現包括ANOVO數據關聯分析以及蒙特卡洛分析在內的各種預測模型分析,預測未來系統運行情況。
(5)異常基線告警處理
能夠監控運行數據并對運行數據與基線異常時產生的差異數據進行告警處理,能夠根據告警信息判斷事件是否是故障還是普通偏出,能夠分析異常點并生成異常分析報告。
(6)數據報表與展示
提供數據報表服務,能夠對主要管理業務系統的基線和運行數據進行日常報表報告,幫助管理人員直觀的發現業務運行問題并分析數據。
(四)實施環境
本次性能基線系統建設主要部署數據采集模塊、基線分析引擎模塊、應用代碼追蹤監控模塊以及系統展示平臺,實施環境如表1所示:

通過實施應用性能基線系統,實現了系統的數據采集、模型生成、關鍵業務梳理、業務統計分布、基線預測,為業務系統的基線管理、基線監控、基線梳理、基線生成提供可靠技術支撐;引入代碼級監測與管理系統,在性能優化前后明確指出需要優化的語句以及代碼,使得優化工作更具針對性及深度,切實幫助系統提升穩定性和可用性,消除故障隱患,防止故障發生,使運維管理人員在進行系統建轉運、日常運維、日常巡檢、應用性能優化等多項工作時加深工作深度、提升工作效率、提升運維管理工作精細化程度,從而降低整體運維工作成本。
通過建設性能基線平臺,河南省電力公司實現了重要業務基線的自動化生成管理,完成了對重要業務系統進行業務流量監控、基線生成、數據預測等工作,為性能基線在業務系統運維工作中的應用作出了有益的探索。后續還將結合人工智能(AI)和機器學習(ML)技術進一步完善智能化的性能基線管理,提升對業務系統運行狀態的準確預測,保障業務系統健康、穩定的運行。
作者單位:國網河南省電力公司信息通信公司