管理實(shí)踐的目的是確保服務(wù)達(dá)到商定的績(jī)效,以成本效益的方式滿(mǎn)足當(dāng)前和未來(lái)的需求。
服務(wù)性能關(guān)聯(lián)兩個(gè)方面:服務(wù)行為的數(shù)量和所需的時(shí)間。
服務(wù)能力是指配置項(xiàng)或服務(wù)所能夠提供的最大產(chǎn)量。
管理實(shí)踐涉及到對(duì)服務(wù)本身及其所依賴(lài)的資源,如基礎(chǔ)架構(gòu)、應(yīng)用程序、第三方服務(wù),以及人員能力等方面的分析、建模、需求預(yù)測(cè)、資源規(guī)劃,以及事件處理等。
如果說(shuō)前面的業(yè)務(wù)分析是保障服務(wù)質(zhì)量的前提,那么能力和性能管理則起到了承前啟后的作用,它能夠?yàn)楹竺骜R上要提到的變更管理實(shí)踐提供參考與依據(jù)。
為了實(shí)現(xiàn)目標(biāo)與成本的平衡,也就是俗稱(chēng)的“花得值”,我們應(yīng)當(dāng)主要著眼于:提供方能夠在恰當(dāng)?shù)臅r(shí)間,提供恰當(dāng)?shù)姆?wù)水平。
具體而言,它涉及到如下管理實(shí)踐:
通過(guò)適當(dāng)?shù)慕#瑢?duì)現(xiàn)有的流程予以掌控,進(jìn)而精準(zhǔn)地錨定業(yè)務(wù)性能的預(yù)期、并做好前期的規(guī)劃。
充分了解當(dāng)前服務(wù)的交付能力、以及整體的技術(shù)走勢(shì)。根據(jù)現(xiàn)有的SLA 和OLA,建立各項(xiàng)服務(wù)的現(xiàn)狀基線(xiàn)、與閥值警報(bào)機(jī)制,進(jìn)而為可能出現(xiàn)的性能問(wèn)題,提供可參考的診斷依據(jù)。
通過(guò)監(jiān)控、記錄、分析、報(bào)告各類(lèi)資源的使用情況,發(fā)現(xiàn)配給的不足、找到不同應(yīng)用場(chǎng)景下的臨界點(diǎn)、以及可能出現(xiàn)的資源閑置狀況,進(jìn)而在成本最優(yōu)的前提下,實(shí)現(xiàn)供求的平衡。
與此同時(shí),能力與性能管理也能夠?yàn)槠髽I(yè)帶來(lái)一定的為前瞻性,通過(guò)監(jiān)視當(dāng)前服務(wù)中的所有組件,評(píng)審各項(xiàng)運(yùn)能指標(biāo),以確保出現(xiàn)服務(wù)質(zhì)量拐點(diǎn),但尚未構(gòu)成嚴(yán)重故障或中斷時(shí),就能夠被及時(shí)地發(fā)現(xiàn)并予以解決。
由于我們企業(yè)的IT 服務(wù)架構(gòu)具有地理上分布較廣的特點(diǎn),因此我們?cè)?jīng)碰到過(guò):局部調(diào)整對(duì)于整體服務(wù)性能產(chǎn)生影響的問(wèn)題。
當(dāng)時(shí),我們有一個(gè)云計(jì)費(fèi)模塊,持續(xù)判斷并記錄著,那些由各個(gè)用戶(hù)所觸發(fā)的、滿(mǎn)足計(jì)費(fèi)條件的打印與復(fù)印作業(yè)。
然而,在某一次局部升級(jí)調(diào)整之后,它出乎意料地影響到了全球各地辦公站點(diǎn)的打印與復(fù)印服務(wù)的輸出性能與速度。由于我們?nèi)狈?duì)打印速度的監(jiān)控,因此直至造成了一定規(guī)模的影響后,才發(fā)現(xiàn)并予以糾正。
另外,為了避免出現(xiàn)以往對(duì)于物理資源,所采取的死板預(yù)分配以及對(duì)網(wǎng)絡(luò)帶寬的被動(dòng)管理模式,我們?cè)谠品?wù)的“彈性伸縮”特點(diǎn)上“做足功課”。通過(guò)與云服務(wù)商的協(xié)作,我們對(duì)現(xiàn)有的云服務(wù)資源,實(shí)施了全面的端到端式的狀態(tài)監(jiān)控。有了第一手的數(shù)據(jù)指標(biāo),我們就能夠及時(shí)地了解業(yè)務(wù)方的需求、實(shí)際的消費(fèi)狀況以及當(dāng)前的安全態(tài)勢(shì)。
籍此,我們能夠在兼顧成本績(jī)效的前提下,動(dòng)態(tài)調(diào)整容量,實(shí)時(shí)改進(jìn)運(yùn)能,進(jìn)而修正監(jiān)控基線(xiàn),從而形成了正反饋。