張?jiān)葡迹斡畈钒賾?zhàn)
(1.蘭州交通大學(xué)機(jī)電技術(shù)研究所, 蘭州730070 ;2.甘肅聯(lián)合大學(xué),蘭州730070)
隨著貨運(yùn)站信息化建設(shè)的不斷深入,所擁有的計(jì)算機(jī)、服務(wù)器、網(wǎng)絡(luò)設(shè)備以及應(yīng)用系統(tǒng)等IT資源越來(lái)越多,IT系統(tǒng)也越來(lái)越復(fù)雜。PC機(jī)品牌多樣、操作系統(tǒng)各不相同、分布于各個(gè)部門;服務(wù)器數(shù)量雖少但它們的品牌及操作系統(tǒng)亦不盡相同;而服務(wù)器與PC機(jī)又通過各種網(wǎng)絡(luò)設(shè)備連接在一起;同時(shí)運(yùn)行在這些異構(gòu)系統(tǒng)構(gòu)成的硬件平臺(tái)之上的應(yīng)用系統(tǒng)有貨運(yùn)信息管理系統(tǒng)(CMS)、設(shè)備監(jiān)控系統(tǒng)(EMS)、設(shè)備控制系統(tǒng)(ECS)、企業(yè)資源規(guī)劃(ERP)和客戶關(guān)系管理(CRM),這些應(yīng)用系統(tǒng)中的不同業(yè)務(wù)服務(wù)依賴于不同的PC機(jī)、服務(wù)器、網(wǎng)絡(luò)設(shè)備,與應(yīng)用系統(tǒng)相關(guān)聯(lián)的PC機(jī)、服務(wù)器、網(wǎng)絡(luò)設(shè)備的運(yùn)行狀態(tài)將直接或間接影響該系統(tǒng)業(yè)務(wù)服務(wù)的可用性,進(jìn)而會(huì)影響到貨運(yùn)站的總體收益。
鑒于以上貨運(yùn)站IT資源的特點(diǎn),不難發(fā)現(xiàn)以下幾個(gè)有待解決的問題:
(1)如何對(duì)貨運(yùn)站的這些IT資源進(jìn)行全面而有效地管理,使管理者對(duì)企業(yè)的IT資源有個(gè)宏觀的把握。
(2)如何對(duì)這些IT資源進(jìn)行動(dòng)態(tài)管理,使管理人員及時(shí)地掌握資源的使用情況、運(yùn)行狀況,從而進(jìn)行整體、科學(xué)的規(guī)劃。
(3)如何使業(yè)務(wù)服務(wù)、管理流程與資源使用相關(guān)聯(lián),使得業(yè)務(wù)服務(wù)的故障與中斷可以做到有因可查、有根可究,方便IT運(yùn)維管理人員及時(shí)解決問題、排除故障,從而得以高效利用這些IT資源。
對(duì)于貨運(yùn)站來(lái)說(shuō),貨物處理的快速性、及時(shí)性將影響其業(yè)務(wù)水平,因此建立貨運(yùn)站IT服務(wù)管理系統(tǒng)來(lái)解決上述幾個(gè)有待解決的問題,從而提高貨運(yùn)站的業(yè)務(wù)水平十分必要。
ITSM(Information Technology Service Management,IT服務(wù)管理)是一套幫助企業(yè)對(duì)IT系統(tǒng)的規(guī)劃、研發(fā)、實(shí)施和運(yùn)營(yíng)進(jìn)行有效管理的高質(zhì)量方法。IT服務(wù)管理基本原理如圖1。
IT服務(wù)管理系統(tǒng)是集IT設(shè)備狀態(tài)監(jiān)控、系統(tǒng)平臺(tái)監(jiān)控和關(guān)鍵應(yīng)用運(yùn)行監(jiān)控于一體,結(jié)合IT服務(wù)管理庫(kù),兼顧基礎(chǔ)環(huán)境管理,全面實(shí)現(xiàn)企業(yè)級(jí)IT服務(wù)監(jiān)、管、控三維一體的綜合管理平臺(tái)[1]。
目前IT服務(wù)管理系統(tǒng)主要應(yīng)用于政府、電信行業(yè)和金融行業(yè),中小企業(yè)尚未廣泛應(yīng)用。文章探討貨運(yùn)站IT 服務(wù)管理系統(tǒng)的系統(tǒng)架構(gòu)、功能模塊以及關(guān)鍵技術(shù)。

圖1 IT服務(wù)管理基本原理圖
依據(jù)某貨運(yùn)站的網(wǎng)絡(luò)拓?fù)鋱D和分層架構(gòu)思想可得貨運(yùn)站IT服務(wù)管理系統(tǒng)的整體框架,如圖2。

(1)被監(jiān)控對(duì)象層:位于底層,它包括網(wǎng)絡(luò)拓?fù)鋱D中所有的硬件設(shè)備,以及企業(yè)所有的應(yīng)用系統(tǒng),如服務(wù)器、網(wǎng)絡(luò)設(shè)備、現(xiàn)場(chǎng)設(shè)備、ECS等。
(2)數(shù)據(jù)采集層:用于采集被監(jiān)控資源各項(xiàng)指標(biāo)的數(shù)據(jù),并將采集的初始數(shù)據(jù)存放在配置數(shù)據(jù)庫(kù)和性能數(shù)據(jù)庫(kù)。
(3)數(shù)據(jù)集成與處理層:將采集的初始數(shù)據(jù)標(biāo)準(zhǔn)化后存入數(shù)據(jù)庫(kù)中,以供系統(tǒng)的調(diào)用。
(4)業(yè)務(wù)邏輯處理層:依據(jù)ITIL(IT基礎(chǔ)信息架構(gòu)庫(kù))和ITSM,進(jìn)行系統(tǒng)的業(yè)務(wù)邏輯處理。
(5)系統(tǒng)展現(xiàn)層:采用圖形化的方法展現(xiàn)采集的監(jiān)控?cái)?shù)據(jù)以及業(yè)務(wù)邏輯處理后的報(bào)警等;與用戶互動(dòng),響應(yīng)用戶的操作和設(shè)定;集成第3方監(jiān)控產(chǎn)品等。
(1)基礎(chǔ)架構(gòu)管理:對(duì)各種IT資源進(jìn)行管理,實(shí)現(xiàn)添加、刪除、修改和查詢。并對(duì)其基本信息進(jìn)行維護(hù)。
(2)過程管理模塊:該模塊又包括配置管理、問題管理、變更管理、幫助平臺(tái)管理、知識(shí)庫(kù)管理、事件/故障管理、性能/預(yù)測(cè)管理以及輸出管理8個(gè)子模塊。
配置管理:實(shí)現(xiàn)各種IT資源配置的自動(dòng)獲取,以及手動(dòng)添加、刪除、修改和查詢。
問題管理:?jiǎn)栴}管理是指負(fù)責(zé)解決IT服務(wù)運(yùn)營(yíng)過程中遇到的所有問題的流程。問題管理的主要活動(dòng)實(shí)質(zhì)上就是分析以被列出問題的事件的根本原因,找出解決方案,把事件的影響最小化,并通過找到已發(fā)生事件或潛在事故的根本原因來(lái)減少事件的數(shù)量或消除事件的再次發(fā)生。
變更管理:變更管理是要確保在IT服務(wù)變動(dòng)的過程中能夠有標(biāo)準(zhǔn)的方法,有效監(jiān)控這些變動(dòng),降低或消除因?yàn)樽儎?dòng)所造成的問題。它的目的并不是控制和限制變更的發(fā)生,而是對(duì)業(yè)務(wù)中斷進(jìn)行有效管理,確保變更有序進(jìn)行。
幫助平臺(tái)管理:IT資源管理人員信息的公布,以及處理故障能力的評(píng)價(jià),便于在出故障時(shí)第1時(shí)間找到處理故障的合適人選。
知識(shí)庫(kù)管理:對(duì)故障管理、問題管理進(jìn)行記錄和積累,通過對(duì)以往故障、問題處理過程和結(jié)果專門的整理和審核,總結(jié)出解決一批故障的方案存入知識(shí)庫(kù),以便解決新故障、新問題。
事件/故障管理:事件管理指的是突發(fā)事件/故障管理,處理IT的危機(jī)并要從中恢復(fù)運(yùn)轉(zhuǎn)。即在出現(xiàn)事件/故障的時(shí)候,能夠盡可能地恢復(fù)服務(wù)的正常運(yùn)作,避免業(yè)務(wù)中斷,以確保最佳的服務(wù)可用性級(jí)別。
性能/預(yù)測(cè)管理:設(shè)置IT資源性能報(bào)警的各個(gè)級(jí)別的閾值,根據(jù)不同的閾值生成不同的可用性報(bào)告。
輸出管理:根據(jù)系統(tǒng)登錄人員的不同及其關(guān)注信息的不同,生成不同的首頁(yè)。
(3)數(shù)據(jù)集成模塊:將采集的初始數(shù)據(jù)按照統(tǒng)一的格式標(biāo)準(zhǔn)化后存入數(shù)據(jù)庫(kù)中,以供核心程序的調(diào)用。
(4)數(shù)據(jù)采集:采集被監(jiān)控資源各項(xiàng)指標(biāo)的數(shù)據(jù)。
使用Agent分布式方法去采集配置和性能信息。Agent的研究起源于人工智能領(lǐng)域,它是一個(gè)具有自適應(yīng)性和智能性的軟件實(shí)體,能代表用戶或其它程序,以主動(dòng)服務(wù)的方式完成一項(xiàng)工作。這里所使用的Agent是一個(gè)用C語(yǔ)言設(shè)計(jì),一個(gè)基于CIP協(xié)議、TCP/IP協(xié)議方法和Socket類的一個(gè)主動(dòng)獲取現(xiàn)場(chǎng)設(shè)備及終端的信息的小型程序,它包括Server Agent 和 Client Agent。其中發(fā)送的數(shù)據(jù)在應(yīng)用層采用CIP協(xié)議格式,在傳輸層依據(jù)TCP協(xié)議封裝,在網(wǎng)絡(luò)層依據(jù)IP協(xié)議封裝。大多數(shù)平臺(tái)和系統(tǒng)都支持C程序運(yùn)行,這就保證了Agent的跨平臺(tái)性。在每個(gè)IT資源上都安裝一個(gè)簡(jiǎn)單的Client Agent,并讓它自主運(yùn)作,它可以實(shí)時(shí)跟蹤所需信息的更改,并通過與Server Agent會(huì)話及時(shí)把變化后的信息傳輸?shù)綌?shù)據(jù)采集中心服務(wù)器。采用Agent的分布式數(shù)據(jù)采集方法符合貨運(yùn)站現(xiàn)場(chǎng)采用以太網(wǎng)的數(shù)據(jù)采集的實(shí)際需求。
過程管理模塊和基礎(chǔ)架構(gòu)管理模塊中各個(gè)子模塊的管理流程需依據(jù)ITIL(IT基礎(chǔ)架構(gòu)知識(shí)庫(kù))來(lái)實(shí)現(xiàn),下面以故障管理為例來(lái)說(shuō)明。
所謂故障是任何已經(jīng)引起或可能引起服務(wù)中斷和服務(wù)質(zhì)量下降的故障。故障管理的目的就是在出現(xiàn)故障的時(shí)候,工作人員能夠盡快地恢復(fù)服務(wù)的正常運(yùn)行,避免業(yè)務(wù)中斷,以確保最佳的服務(wù)可用性級(jí)別。故障管理與其余各個(gè)模塊之間的關(guān)系較為緊密,如圖3。故障處理流程如圖4。
故障管理流程重點(diǎn)如下。
(1)故障歸類

圖4 故障處理流程
一般來(lái)說(shuō),當(dāng)出現(xiàn)故障時(shí),首先在運(yùn)行維護(hù)平臺(tái)記錄與故障相關(guān)的提交人的信息,如姓名、工作地點(diǎn)和聯(lián)系電話、故障癥狀描述、相關(guān)的配置項(xiàng)等,而有關(guān)故障信息的詳細(xì)記錄是由處理人員完成的。但故障處理人員在記錄相關(guān)信息和確認(rèn)故障后,接下來(lái)要做的并不是立即解決故障,而應(yīng)是根據(jù)已有的知識(shí)和經(jīng)驗(yàn)對(duì)故障進(jìn)行大致的劃分,以便采取相應(yīng)的措施先對(duì)故障進(jìn)行“歸類”,然后再進(jìn)行初步處理。這里采取的措施和行動(dòng)不以根本上解決故障為目標(biāo),主要目的是確保業(yè)務(wù)的持續(xù)運(yùn)作。如果不能較快找到根本性解決方案,支持人員就要盡快找到臨時(shí)性解決方法。
(2)區(qū)分故障優(yōu)先級(jí)
在對(duì)故障進(jìn)行歸類后,如果沒有成功地將故障與知名錯(cuò)誤進(jìn)行匹配,下一步就是確定故障的優(yōu)先級(jí)。
當(dāng)支持人員必須同時(shí)處理數(shù)個(gè)故障,但受時(shí)間、資源和人力等的限制無(wú)法實(shí)現(xiàn)時(shí),就要排定故障處理的先后次序,即確定每個(gè)故障的優(yōu)先級(jí)。
確定故障處理優(yōu)先級(jí)及相應(yīng)所需的資源需要綜合考慮故障對(duì)業(yè)務(wù)的影響情況、恢復(fù)服務(wù)對(duì)業(yè)務(wù)的緊迫性、故障的大小、范圍和復(fù)雜程度以及當(dāng)前可供選擇的資源。綜合考慮所有情況,可以用一個(gè)公式來(lái)計(jì)算:優(yōu)先級(jí)=影響度×緊迫性。其中,影響度是衡量故障影響業(yè)務(wù)大小程度的指標(biāo),通常相當(dāng)于故障影響服務(wù)質(zhì)量的程度。緊迫性是評(píng)價(jià)故障和問題危機(jī)程度的指標(biāo),是根據(jù)客戶的業(yè)務(wù)需求和故障或問題的影響制定的;而優(yōu)先級(jí)是根據(jù)影響程度和緊急程度而制定的故障和問題的處理順序。
為達(dá)到實(shí)時(shí)管理與人性化管理的目標(biāo),同時(shí)借鑒機(jī)場(chǎng)EMS設(shè)備監(jiān)控系統(tǒng)設(shè)備圖形化監(jiān)控系統(tǒng)的成功經(jīng)驗(yàn),構(gòu)建一個(gè)統(tǒng)一的人性化的圖形展現(xiàn)平臺(tái),支撐統(tǒng)一的應(yīng)用于展現(xiàn)界面、綜合的實(shí)時(shí)監(jiān)管、工單與維護(hù)作業(yè)以及統(tǒng)計(jì)分析。圖5為主機(jī)監(jiān)控界面。

圖5 主機(jī)監(jiān)控界面
貨運(yùn)站IT服務(wù)管理系統(tǒng)可以從根本上解決IT資源的管理問題,提高IT資源的利用率,使得貨運(yùn)站的吞吐量得以提高,貨物得以快速進(jìn)出站,具有實(shí)際應(yīng)用價(jià)值。
[1] 蔡雯瑛,鄭駿. 基于SNMP的IT服務(wù)管理系統(tǒng)的架構(gòu)設(shè)計(jì)[J] .計(jì)算機(jī)應(yīng)用與軟件,2007(5):178-180.
[2] 李佳. IT管理系統(tǒng)中采集管理子系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D] .北京:北京郵電大學(xué),2006.
[3] 冉崇善,趙萍. 基于ITlL的企業(yè)IT資源服務(wù)系統(tǒng)設(shè)計(jì).信息與管理工程版[J] . 武漢理工大學(xué)學(xué)報(bào),2006,28(5):80-83.
[4] 趙銘,方翎,王俏文,羅光磊.電力企業(yè)IT服務(wù)管理實(shí)踐[J] . 電力信息化,2007,5(9):34-37.
[5] 袁紅軍,肖漢. 基于ITIL的虛擬參考咨詢服務(wù)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)探究[J] . 計(jì)算機(jī)系統(tǒng)應(yīng)用,2007(12):7-10.
[6] 胡波,詹瑾. 淺析IT服務(wù)管理系統(tǒng)的構(gòu)建[J] . 廣東技術(shù)師范學(xué)院學(xué)報(bào),2007(10):12-13.
[7] 肖君. 基于ITIL的教育資源庫(kù)服務(wù)質(zhì)量管理系統(tǒng)的設(shè)計(jì)和應(yīng)用[J] . 教育傳播與技術(shù),2007(3):46-49.理