摘 要:針對企業信息化建設與運維工作中普遍存在的問題,展開有效的全面質量管理,通過具體有效的措施進行改進,系統的、科學的闡述并論證了信息化建設過程進行改進與優化的原則與方案,避免在信息化改造中無從下手或者濫用資源,有效發現問題、改造問題、總結問題,最終提升信息系統運行效率,不斷滿足業務需求。總體研究具有創新性和獨立性,通過以協同平臺的優化為案例,拓展信息化各業務系統改造思路,為企業信息化建設提供有效借鑒。
關鍵詞:質量管理;優化改造;協同平臺;信息系統
中圖分類號:F270.7 文獻標識碼:A 文章編號:1674-7712 (2013) 22-0000-02
本文的研究主要針對企業信息化建設到一定階段,會出現的系統性能不足、資源利用不夠合理、系統故障頻出、故障分析無從下手等典型問題進行分析與研究,結合信息化運行特點,結合多年基礎平臺運維經驗,以協同平臺系統優化與改造為示例,提出綜合有效的解決方案,從科學的質量管理方法入手,通過全面質量管理、六西格瑪、軟件工程等多方方法論進行論述,全面分析信息化基礎平臺服務器、數據庫、網絡、軟件產品、系統架構等軟硬件各方面影響因素,并在研究中反復測試并驗證,最后進行研究總結,通過研究為信息化運維提供了可靠的專業工具和軟硬件建設建議,概述了定義問題、發現問題、數據分析、有效驗證、持續改進的全部過程控制,指導了如何系統開展信息系統的優化與改造,而不是一味的追求硬件或者軟件的升級,為信息化建設與投入進行了可靠的分析與把關,為企業信息化深入應用,業務與信息化深度融合提供運維依據。本文將進行現狀與問題的描述,簡要介紹質量管理方法論,通過分析與實施部分重點描述信息系統改造過程,最后進行總體歸納。
一、信息系統現狀與存在問題
目前企業開展信息化建設,推進業務系統種類多、平臺各異、系統之間交互集成,底層以服務器、數據庫、網絡為依托平臺,運行過程從無到有,經歷建立、推進、使用、升級、遷移、改版等不同過程,針對一個系統的全生命周期管理,越來越提到議事日程上,在信息系統運行基礎上如何合理優化架構,提高系統性能,使之不斷滿足業務發展需要則需要綜合開展研究,作為系統運維部門不僅要做好其過程的控制,更需要進行技術與管理創新不斷改進綜合開展基礎平臺底層的資源優化。當前,信息系統不是處于起步階段,而是正在面臨不斷改進與完善的深入應用的時刻,需要不斷深入探討與研究。
二、信息系統質量管理方法論
在現代社會中,質量問題已經成為越來越重大的戰略問題。優質能給人們帶來方便和安樂,能給企業帶來效益和發展,最終能使社會繁榮、國富民強。加強質量管理、提高質量的意義非常重大,在企業信息化大力推進的同時,質量管理不斷開展,如知識管理、全面質量管理、六西格瑪方法等。其中六西格瑪相對客觀,以數據為依據,追求全過程管理[1],尤其在病毒控制、數據庫優化等方面越來越受到廣泛采用。不論哪種質量管控都將以其嚴謹的方法和實施步驟,以面向最終用戶建立起營運體系的管理思想。如頭腦風暴、群策群力將幫助我們找到潛在的各種因素。直方圖、排列圖、回歸分析等數學性模型將幫助進行精確分析與判定,決策樹和風險分析為最關鍵改進來進行有效把控。只有掌握了科學的管理方法才能避免一味追求硬件升級、軟件換版的錯誤認識,找到癥結才能有效控制信息化運維成本,有效改進系統性能與質量。
三、以協同平臺為例進行運行分析
進行信息化運行分析如同做項目一樣,項目的開展從問題定義開始,問題的定義階段需要小組成員共同努力,群策群力,要與客戶、領導進行充分溝通,相互積極配合,展開頭腦風暴,確保目標、范圍的準確。作為小組成員都要清楚知道具體所負的職責。問題的定義階段是初始階段,也是最關鍵的階段,定義階段進行的好壞決定后面分析、改進、控制幾個階段的進展情況,決定整個項目的成本,效率,甚至成敗[2]。
經過定義我們從關鍵的因素入手進行全面分析,通過運維數據、系統日志進行分析來確定最終的改進方案。從長期運行特點分析需要分別從服務器硬件、網絡、數據庫、系統架構、操作系統入手,針對可能發生的性能瓶頸由最為突出的因素進行著手改造。在協同平臺的分析中,我們分別采用IT運維工具對網絡流量、系統CPU、內存使用歷史數據、I/O讀寫、Oracle數據庫SQL語句的TOP10條,以及整體架構進行了全面量化的數據收集,利用數據分析并總結出架構、程序、硬件資源、軟件版本等幾大因素作為下一步的改進方案。這些是以協同平臺為例,各業務系統也是如此,離不開軟硬件基礎平臺相關資源環境,如何入手,展開分析,找出原因,怎樣改進將是最為關鍵的[3],在分析過程中我們主要將大量的連續數據利用數學工具進行分類、排列,類似于統計學方法,通過數學建模序列、正態分布、回歸分析來確定主要因素、次要因素,為改進階段明確目標和對象。
四、改進控制與實施
根據前階段以數據進行分析結果,這一階段為改進與控制階段,改進控制以由簡到難,由主到次的串行順序開展,以便降低改造成本,有效發現問題,具體改進與實施如下。
(一)硬件改進
當用戶數的增長達到相當大的規模,僅靠應用級擴展和軟件平臺級擴展已不足以充分保障系統性能和響應速度,此時可增加硬件服務器的CPU個數、系統內存或陣列中的磁盤容量,也可相應增加服務器的數量,實現大規模的系統擴容。在協同平臺改造中主要將低配置服務器應用及數據庫向高配置,尤其是UNIX穩定操作系統服務器進行遷移,提高硬件CPU、內存、IO讀取等效率[4]。
(二)網絡優化
從網絡上將服務器群所有服務器從分散的交換機進行調整,集合到相同的匯聚交換機,并且相關服務器全部更換網絡接口,確保萬兆光纖接入,提高網絡性能,滿足網絡應用。
(三)拓撲優化
關鍵核心服務器由單臺服務,擴增至少兩臺,增加備機,避免單點故障,同時投入使用F5負載均衡設備提高設備利用率,結合應用方面的集群改造,確保服務不間斷、高效運行[5],如圖1為改造前后示意圖。
架構優化后的平臺,硬件資源合理分配,提升系統安全運行質量,避免單點故障,充分滿足業務系統使用需求。與改進前架構對比更安全、更高效、更穩定。
(四)程序優化
程序優化主要從數據庫入手通過Oracle AWR工具進行系統分析,根據所提供的SQL語句進行優化,尤其通過分析還進行數據庫相關參數如SGA、processor、日志文件、數據文件、索引建立等相關調整。此外針對IBM產品進行版本升級,如WebSphere、Tivoli、LDAP等版本補丁更新及JVM堆、Web線程數等進行反復調試與驗證[6]。
五、總潔
通過改造后的協同平臺在10個月的監控中達到了無故障運行率100%,有效的提升了效率和運行質量,用戶使用早高峰延遲現象徹底解決,協同平臺的改造與優化取得了顯著的收益。但隨著用戶數量的不斷增加,各業務系統的不斷集成,功能模塊的不斷擴展和深入應用都將為系統的運行帶來變化莫測的環境,需要我們仍舊滿懷信心,鎮定從容,從底層,從最基本的運維數據與工具入手,以數據為依據,不斷分析、不斷驗證、不斷改進。此次改造主要體現在上述因素影響下,同理通過具體不同現象的采集數據會分析出其他不同的因素。協同平臺如此,ERP、PDM、MES等等不論平臺、架構、程序、應用的差異如何不同,道理是一樣的,就是數據真實、工具分析、找出正因、有效管理。通過以協同平臺為例,總結信息系統優化改造原則五大原則如下:
(1)詳細記錄運維日志,形成長期運維歷史日志。
(2)掌握全面技術,如操作系統、網絡、數據庫、軟件平臺。
(3)利用專業工具分析,如運維工具、產品控制臺建議、AWR報告等。
(4)通過科學質量管理方法,利用數據分析論證,組建專業團隊,利用類似六西格瑪管控手段。
(5)三分技術七分管理,做好人員協作與溝通,建立相關管理運維制度。
如上所述,其實最為關鍵的是需要我們實事求是的開展一切工作,根據信息系統實際發展與需求出發,我們不再像從前那樣憑白采購硬件,無故更換軟件,要通過有力的手段提升信息系統性能,節約信息化投入,合理利用信息化資源,讓企業的信息化健康成長、真正深植到企業的生產、流程、運營中,成為企業賴以生存的科學信息化系統。
參考文獻:
[1]馬林,羅國英.全面質量管理基本知識[J].北京:中國經濟出版社,2004,06.
[2]六西格碼工具箱[OL].www.6sq.net,2005,07.
[3]顧景民,郭利波,姜進成.企業信息軟件系統安全運行探討[J].山東煤炭科技,2009,03.
[4]Jan van Bon,著.章斌,譯.IT服務管理+基于ITIL的全球最佳實踐[M].北京:清華大學出版社,2006.
[5]江左文,李淑芝,左坤隆.利用J2EE開發企業平臺的結構分析[J].計算機系統應用,2001,02.
[6]IBM WebSphere Portal.技術白皮書[R].
[作者簡介]劉陽(1978-),女,遼寧人,高級工程師,研究方向:網絡信息化。