江蘇省電力公司信息通信分公司 李 林 馮曙明 黃高攀
?
一種SAP系統狀態評價方法
江蘇省電力公司信息通信分公司李林馮曙明黃高攀
【摘要】為使對SAP系統狀態的評估更加合理,評價分析SAP系統當前性能,本文采用了一種動態權重的方法,結合加權平均算法,可以通過SAP系統的各項指標,較為合理地評估系統狀態。驗證結果表明,這種方法能夠突出具體指標對系統整體指標的影響。從而正確的評估系統當前狀態,為SAP系統運維提供決策支持。
【關鍵詞】系統評估;SAP;動態權重
在SAP系統運維工作中,往往由于對系統狀態的不正確或不及時判斷,導致可能發生系統性事故。如用戶反映通過SAP接口發送的數據,接受系統沒有接收到數據。經Basis查看發現系統接口不通了,當我們發現時,其實系統已經有很多接口錯誤信息反映了接口擁堵的情況。如果我們能夠提前主動檢測到系統存在接口擁堵的情況,那么就可以及時地發現問題,解決問題,從而避免大量的數據補救措施;再如我們發現用戶無法登陸SAP系統的情況,經過調查發現SM51的系統DIA進程都被占滿了,經basis處理掉一些不必要的進程后,才得以讓用戶重新登陸系統,同樣如果提前對系統進程空閑狀態進行合理評估,以了解整個系統當前的狀態,則可以很好的規避此類問題的發生。因此建立SAP系統的實時狀態評估尤其顯得重要。
目前我們對SAP系統狀態的評估通常采用特定指標值和權重,進行加權平均,得到SAP系統的當前狀態。但實際過程中,這種方法并不能真實反映系統的當前狀態,例如我們選取系統進程指標與系統內存指標作為例子,根據靜態權重的評估方法,當某個指標的值較大,(此處以百分制分為例,零分表示對系統危險度無貢獻,一百分表示對系統危險程度最大。)系統總體指標得分仍然不高,而實際情況是,這兩個指標中任何一個指標得分過高,都會影響到系統整體指標,因此利用這種靜態權重,顯然不適合這種場景下的SAP系統狀態評估。以下提出基于動態權重與靜態權重相結合的方法,確定指標的綜合權重。進而合理評估單個指標的偏離程度,對整體指標的影響。

這里對每個單項指標的得分,企業可以根據自身的實際情況,采用適合的算法進行運算。如企業有條件可以收集數據進行線性回歸或者非線性回歸,得到單項指標的回歸方程,或者通過專家判斷、判定表、判定矩陣等方法,獲取的評估值。在對每項指標評分時,所使用的分制必須一樣,如百分制,或者十分制。總之,

由于SAP系統的特殊性。按照靜態權重算法,不足以反映單個指標對系統整體的影響,因此引入單個指標的權重的重新分配,來加強其權重。權重的重新分配是各項指標應用于實時環境中時所表現出的對整體指標的拉升或者削弱,以客觀反映系統的當前狀態。
我們對所有指標的得分進行排序,獲取超過靜態加權均值的指標(具有一定危險性的指標)重新評估其權重,以使其權重得到加強。以下公式r為該指標的獲得提升的權重比例。

這樣系統經過動態權重重新分配后的得分為:

某公司SAP系統作為支撐其信息化的核心信息系統,其系統安全與穩定及其重要,為保持系統穩定,實時監控系統狀態,提前發現問題,解決問題,避免重大損失,運維人員利用以上方法,選取了SAP系統7項指標作為評估基礎,來對系統狀態進行實時評估。選取監控的指標包括以下幾個:
(1)監控系統的進程數,包括系統所有實例已用進程數量和總數量(SM51),指標值為“運行數/總數”。
(2)監控SAP內存使用情況,監控每臺服務器的內存使用情況(ST02),計算內存使用率,指標值為“已使用/總數”。
(3)監控SAP LOGON分組的可登陸狀態(SMLG),展示Load Distribution的相關信息包括服務響應時間、在線用戶、會話步驟信息。
(4)監視系統的鎖資源(SM12),展示系統中表鎖定的個數,以衡量系統鎖資源是否充足。
(5)監控系統的更新狀態(SM13),以反映系統當前更新進程是否出現大批量錯誤。
(6)監控TRFC狀態(sm58),以獲取當前系統RFC的性能情況,防止接口堵塞或錯誤過多,影響系統整體性能。
(7)監控系統dump數據(ST22),評估系統dump是否在合理水平,以防止出現大量的Dump信息而應用用戶使用。
以上每個指標根據其對系統整體的影響程度,對其分配了靜態權重,并且記錄了某一時刻每個指標的得分(表1)。

表1
從表1可以看出依據加權平均算法,系統得分為25分,表示系統狀態良好。而實際情況是系統的假脫機進程已經超過危險線,可能存在進程不足的情況,不能為新的用戶分配處理進程。同樣,系統響應時間指標也超標,說明系統可能存在一些資源過度使用,或者是系統通訊、IO之類的問題,此時系統已經存在安全隱患了。依據本文所描述的方法,對權限進行重新分配,得到新的權重(表2):

表2
表2中對系統響應狀態指標的權重進行了加強,依據此表得到的系統評估得分為85.94,充分反映了系統的整體狀態并不好,此時將此信息反饋到運維人員,運維人員依據與此明細表可知道具體哪個指標出了問題,可以提前對此指標進行優化處理,以防患于未然。
本研究引入對靜態權重重新分配的方法,通過綜合權重來合理評估系統各項指標對系統整體狀態的影響。通過實例驗證,說明了單個指標的偏離對系統整體指標的影響。這種偏離越嚴重,影響的權重越大。
本方法中涉及對單個指標得分的計算方法,因每個企業的管理水平及管理要求不一樣,文中未做詳細說明。另外對指標偏離度與提升權重比例之間的方程也未做詳細說明,企業可以根據實際管理需要進行方程規定。總之,對于一些綜合考慮時重要性不易凸顯的指標來說,采用權重重評估的方法,將對其產生強化效應,從而將危險表現出來,在一定程度上有利于危害提早預告,可見將指標值與均值的偏離情況考慮進權重確定中,能更準確地確定各指標的重要程度,更準確地反應系統的整體狀態。
李林(1984-),男,供職于江蘇電力信息技術有限公司,研究方向: 從事軟件開發。
作者簡介: