劉強++曾明霏++周迪貴++謝朋宇++歐陽喆++陶鎮威


摘 要 各類監控平臺輸出了大量企業級信息系統的性能監控數據,但數據凌亂復雜,不利于分析整改。本文以資產管理系統為試點,綜合對各類監控平臺的監控進行數據挖掘,找出影響資產管理系統用戶體驗的關鍵問題指標,針對性采取優化措施后效果提升較好,數據挖掘方法及優化措施推廣至人資、財務、營銷等企業級信息后也取得了良好的效果。
【關鍵詞】北塔 數據庫開發審計 用戶體驗分析平臺 用戶體驗
電力企業工作具有復雜性的特點,隨著科學技術發展及工作的實際需求的變化,電力企業工作逐漸呈現出智能化、集約型及高效性的信息化特點。通過在電力工作中普及信息化技術的實踐應用,有效解決電力企業工作體系中的瓶頸問題,提高工作效率。本文中筆者主要分析各類監控平臺的大量監控指標,找出真正影響用戶體驗的原因,從而實現系統問題的有效整改及性能提升,提升企業級信息系統的用戶體驗。
1 電網企業信息系統監控平臺建設目標
電網企業內部構建北塔、數據庫開發審計和業務系統用戶體驗分析平臺等監控平臺,監控各企業級管理信息系統的各項運行指標,便于運維人員全面了解各企業級信息系統的運行效果與用戶體驗情況,分析系統的存在問題,促進系統優化,提高用戶滿意度。
2 企業級信息系統用戶體驗問題
2016年2月至4月期間,北塔監控系統在業務高峰期間曾發生內存、CPU告警,用戶體驗各項監控數值頻繁飆高,數據庫開發審計存在大量設計不當的SQL,導致語句執行低效,資產管理信息系統共發生11起故障,特別是業務高峰時段,系統登錄、配網電子化移交、工作票、停電檢修、設備臺賬變更等模塊的性能及穩定性問題尤其突出,嚴重影響系統用戶體驗??梢姡Y產管理信息系統故障頻繁、原因復雜,臨時整改措施治標不治本,已對業務和用戶體驗造成嚴重影響。
3 信息系統用戶體驗的數據挖掘過程
我們將數據庫開發審計和用戶體驗分析平臺輸出的指標數據和監控數據反饋給廠家,但由于這兩項數據繁多、問題分散、重點不突出,難以將兩項數據結合起來分析,廠家的優化效率不高且效果不明顯,急需我們對這兩項數據進行深入的挖掘和分析,提供一份更有針對性的數據以供廠家整改優化,從而達到提高系統性能,提升用戶體驗的目的。具體數據如表1、2所示。
資產系統頻繁發生故障,主要因為服務器性能及系統穩定性不高,我們希望通過整改數據庫表及語句提升服務器性能,通過優化系統主要功能和常用功能的代碼提高系統穩定性。
3.1 大對象、臨時表分析
大對象的讀取和寫入的數據單元一般都比較大,如果大數據字段的塊太小,會導致比較多的I/O次數,對超過100MB的表分配獨立表空間或文件系統,可以提高I/O的吞吐率。
隨著資產系統的不斷使用,大量動態實體表產生,系統的性能表現越來越差,針對備份表系統管理員都會制定清理周期定期梳理表數據,只需對剔除備份表后的臨時表的建表機制進行管理和評估,同時建議其他企業級管理信息系統減少使用臨時生成物理表的方式,以減少臨時表的數據量,更好地保障數據庫性能。
3.2 全表掃描SQL、差性能動作分析
資產管理系統的數據庫屬于OLTP類型,這種類型對大表的全表掃描所耗費的I/O資源和時間會隨著數據量增加。資產管理系統數據庫內存共240G,共32314張表,我們將大小超過100MB的表認定為大表。大表掃描所耗費的I/O資源和時間與數據量之間的聯系在差性能動作的服務器耗時和網絡耗時兩個指標值中有所體現。
通過找出差性能動作中的動作名稱對應的功能點可以發現,該功能點對應的數據庫表在高耗時SQL清單中大多存在于耗時超過3秒,執行次數超過50次的SQL中,而差性能動作中服務器耗時和網絡耗時兩個指標值較高的動作,其對應的總訪問次數大多在200次以上。
3.3 高耗時SQL、不可用動作分析
數據庫若存在大量高耗時的SQL,將會影響數據庫性能,甚至導致部分功能點不可用。一般80%的性能問題是由20%的SQL語句導致的,因此實時監控在線系統中正常執行的Top SQL,將這些SQL進行不間斷的優化,可以保持應用系統數據庫的良好性能監控狀況。
通過不可用動作中的動作名稱找出其對應的功能點,再將改功能所用的語句對應到高耗時清單中的SQL語句,可以發現大多的語句耗時超過5秒,執行次數大于20次,且該功能點的不可用占比也大于3% 。
3.4 錯誤清單分析
本文研究的目的是希望能夠快速、有效提升系統用戶體驗效果,而影響用戶體驗的因素有很多,對于廠商來說,比較可控的因素是系統代碼和服務器性能方面。
由于系統的整改或新功能的增加,一些系統隱藏的BUG會浮現出來,導致用戶訪問時發生404錯誤。通過優化系統代碼修復系統BUG來降低404錯誤的發生率。500錯誤碼大部分是由于服務器性能和數據庫性能導致的,可以通過優化系統代碼結構和優化高耗時SQL來系統性能,有效提升系統用戶體驗。
經過前面的一系列分析過程,梳理出一套問題數據過濾規則,按照該規則來分析挖掘數據后,資產管理系統的問題數據量大大減少,分析后的具體變化如表3所示。
經過前面的數據挖掘分析后,我們找出影響資產等系統用戶體驗的關鍵問題指標:數量大于100MB的大對象表,臨時表,耗時超過3秒,執行次數50次以上的全表掃描,耗時超過5秒,執行次數超過20次的高耗時SQL,訪問次數超過200以上的差性能動作,不可用率大于3%以上的不可用動作,次數大于10次且錯誤碼為404、500的錯誤動作。
每月中旬,我們從數據庫審計和用戶體驗分析平臺輸出數據,按照以上規則處理后提交給廠家整改,廠家提交整改報告,月例會中審核整改結果,實現了從用戶體驗問題的發現、嚴重性分析、反饋、廠家整改到復核的全過程管控。同時將管控方法應用到營銷系統、人資系統、財務系統后,相應的數據變化如表4所示。
4 電網企業信息系統用戶體驗效果分析
資產管理信息系統施行該管控方法后,系統代碼和數據庫SQL得到極大的優化,用戶體驗分析平臺輸出的指標數據得到改善,監控數值趨于穩定,系統在性能和用戶體驗方面都有所提升,達到了提高用戶體驗的目標,推廣至及其他企業級信息系統也取得了很好的效果。突出的改善指標如下:資產系統平均頁面耗時由2.972s下降至0.828s,下降了358%;資產、營銷系統服務器CPU和內存使用率由80%以上下降50%以下;人資系統數據庫頁面加載時間由0.435s降低至0.249s,平均頁面耗時從0.435s下降至0.178s,下降了244%。提高了系統安全穩定運行率,提升了企業級信息系統的用戶體驗及客戶滿意度,提高了業務部門的工作效率。具體如表5所示。
5 結語
總而言之,現如今信息技術不斷發展與完善,新的技術手段不斷出現。本文通過有效的數據挖掘和分析,形成一套有效的企業級信息系統用戶體驗問題的管控方法,并將其應用到其他企業級信息系統,有效地提高了工作效率和用戶體驗,才能為構建和諧社會貢獻一份力量,充分發揮電力企業促進社會進步的作用。
參考文獻
[1]梁新剛,楊崢.信息系統運行方式探討[J].山西電力,2013(06):145-147.
[2]牛春霞.電力負荷管理系統運行方式優化方案探討[J].電網技術,2007(S1):67.
[3]彭澤武,李偉清,林強,劉文彬.電網企業信息系統運行方式模型研究[J].電力信息化,2013(06):23.
[4]杭聰,劉強,張蔚東,王聰.業務系統用戶體驗分析技術在電力企業級管理信息系統中的應用[J].信息化建設,2016(04):252-254.
作者單位
廣西電網有限責任公司信息中心 廣西省南寧市 530023