趙又霖 鄧仲華 黎春蘭
(武漢大學信息管理學院 湖北武漢 430072)
云服務是云計算技術將其自身展現給用戶的具體實現形式,也是其自身價值得以實現的方式。對云服務提供商而言,他們以不同的云服務內容和形式相互競爭,Google、Amazon、IBM、Sun、Microsoft、HP 和 Salesforce 等這些大型的IT廠商均推出不同的云服務,如應用程序服務、存儲服務、架構服務和計算服務等。對用戶而言,眾多的云服務可以滿足用戶隨時隨地按需使用的需求,但用戶在訪問云服務的過程中會受到各種因素的制約,如一定費用的支付和預算的局限。因此,從云服務提供商角度來看,可以依據云 SLA(Service Level Agreements,服務等級協議)來優化使用其基礎設施以提供用戶所需要的云服務。從用戶角度來看,可以依據云SLA來確保自己能夠享受到云服務提供商所承受的服務質量和服務等級,進而平衡成本的支出與所獲得服務質量的水平,選擇性價比較高的云服務。
TMF GB917定義的SLA為:SLA是服務提供商(Service Provider,SP)和用戶之間正式簽訂的一個協定,是存在于雙方之間的一個合約。它是一個正式的、經服務提供商和用戶協商的合約,包括雙方對服務內容、優先權、責任和義務以及費用和賠償問題的共識,同時包括對服務質量等級的規定。在現有云環境下,SLA能較穩定地支持對服務的正常運營,因此是信息服務雙方不可或缺的 一 項 協 議。 云 環 境 下 的 信 息 服 務 等 級 協 議(Information Service Level Agreement, ISLA) 是提供商關于如何實現提供給客戶的信息服務的承諾、保證客戶獲得預定義的信息服務質量的協議。
隨著市場競爭的加劇,電信服務、網絡服務和云服務的提供商均面臨著提高自身競爭優勢和滿足用戶性能需求的雙重壓力。他們一方面致力于減少服務的成本,另一方面又必須努力改進云服務質量,從而使自己的服務/產品有別于其他的競爭者。由于網絡服務提供商(Internet Service Provider, ISP)、 通 信 服 務 提 供 商 (Transmission Service Provider,TSP)、 云服務提供商 (Cloud Service Provider, CSP)、 信 息 資 源 服 務 提 供 商 (Information Resource Service Provider, IRSP)及終端用戶(User)這些參與方、其角色具有多重性、用戶需求具有多樣化,使得成本和QoS之間的平衡尤為復雜和困難;同一個服務提供商,它的角色既可以是服務的提供方,也可以是服務的接收方。這種多重角色形成了一條復雜的關系鏈,如云服務提供商對于網絡服務提供商是接受網絡服務的客戶(但不是終端客戶),他們之間的服務等級協議是WSLA;對于信息資源服務提供商來說,云服務提供商是信息服務平臺的提供者,因而他們之間的服務等級協議是ISLA(見圖 1)。

圖1 信息服務的業務關系模型
SLA的應用經歷了從電信到IP網絡服務,在兩者的基礎上,SLA又被引入到云服務領域。因此,可以將SLA的發展歸結為三個階段,即電信服務階段、網絡服務階段和云服務階段。
(1)電信管理論壇TMF將SLA應用于電信服務領域。TMF、ITU、IETF等部門分別制定各種SLA和QoS的標準與規范,如有關服務質量的術語定義、確定和應用QoS參數的框架和方法、SLA的框架、SLA的管理手冊等,有利于統一規范SLA的應用,保證用戶和提供商對SLA和QoS術語的統一理解。
(2)在網絡服務領域,各種在Web和Grid服務中簽訂的SLA逐漸形成,如HP的WSMF(Web Services Management Framework)、IBM 的 WSLA (Web Service Level Agreement)、WSPL、WS-agreement及其基于WS-Policy的方法等。這些在Web服務領域中用以保證Web服務質量的協議,通過提供各種IT服務水平的參數、衡量實際服務水平與預先協定的偏差和失誤、監測和管理Web服務的執行,從而確保Web服務的網絡性能和質量得到應有的保證。
(3)云服務領域,各云服務提供商制定各自的云SLA以保證云服務的質量。如Microsoft Azure云平臺服務制定 SLAs, 從 Storage、Compute、SQL、AppFabric 和 CDN等方面來明確服務雙方的職責與義務;Amazon S3存儲服務制定Amazon S3 SLA,從功能、可靠性和價格等方面來明確其存儲服務;Google Apps制定Google Apps SLA,明確Apps產品提供的服務等級及違規情況。各種云SLA的實施使得云SLA成為目前云服務提供商們保證QoS的重要手段。
云計算的本質是將資源虛擬化存儲于云端,以互聯網傳播的方式為用戶提供服務。因此,我們認為能通過網絡實現的信息服務是實現云服務的前提條件之一。云SLA是對服務提供商所提供云服務的服務質量和服務等級進行闡述和明確的法律文本。就云SLA而言,服務提供商或用戶都會考慮與某項云服務相關的要素,如服務對象等級、雙方職責、服務維護、數據存儲位置、業務連續性或災難恢復能力、系統冗余等,因此需要在SLA文本中明確或者滿足以下幾點需求:
(1)對服務加以清晰的描述,以便用戶能夠容易地理解和完成對服務的操作。
(2)說明服務提供商所提供服務的服務等級。
(3)定義對服務參數進行監控的具體方式以及監控報告的格式。
(4)說明服務提供商不能提供服務時所需要承擔的責任。
(5)說明計費等具體的業務參數等。
在關于云SLA的相關文本中,服務提供商和用戶需要分別把各自的責、權、利闡述清楚,需要就雙方均認可的服務提供商所提供服務的類型、所提供服務的等級參數、用戶所需付費情況、關于所提供服務的相關保證措施以及關于服務提供商與用戶違反文本中相關條款的懲罰措施等具體的文本條文明確下來。由于云計算在線服務模式的特殊性,對于云服務提供商可能出現的服務中斷和不適時、數據損壞、用戶隱私泄露等情況,要在云SLA文本中明確云服務提供商的責任以及一旦出現上述情況服務提供商所需承擔的責任等。
為了服務質量水平以SLA預先定義的性能等級進行交付使用,需要對SLA中所有服務過程加以管理,即SLA 管理 (Service Level Agreement Management,SLAM)。TMF提出SLA生命周期管理和SLA參數框架兩種SLAM管理工具。其中,SLA參數框架是對獨立參數進行分類的有用工具。
云SLA定義了雙方或者多方關于服務質量、優先權和職責等期望。傳統的SLA是服務提供商和企業用戶所簽訂的合同(見圖2)。SP必須積極地管理所提供服務的質量以獲得競爭優勢。此外,其所提供的服務越是依賴于多個合作者,管理這些服務的云SLA在SP維持眾多合作關系或用戶關系中越具有重要的作用(見圖3)。因此,云SLA及其管理在SP的用戶關系管理(CRM)和供應關系管理(SRM)中起著重要作用,它對SP、用戶和供應商均有著重要的價值。

圖2 SP的CRM關系

圖3 SP的SRM關系
TMF在eTOM視圖中定義了SLA的生命周期過程,云服務提供商同樣需要eTOM商務過程框架來規范、集成并自動化云服務的商務運營過程,能高效地與其它實體或參與方開展商務,使通過網絡實現的云服務能更多地關注客戶、關注服務質量,實現其資源節約、資源共享、安全保障等基本特征。根據業務或參與方的性質,云SLA的類型包括云服務提供商內部的SLA、云服務提供商-客戶的SLA、云服務提供商-供應商的SLA(見圖4)。
目前云服務提供商向用戶提供的云服務一般包括四種:基礎設施即服務IaaS、軟件即服務SaaS、平臺即服務PaaS以及存儲即服務。以上四種服務,在其服務等級協議的管理過程中都應該遵循SLA生命周期中各個階段的管理。

圖4 云SLA的生命周期
云SLA的開發主要是支持服務計劃及其活動,如預測市場的趨勢、定義和構建可用的服務產品目錄等活動。SP將其服務以不同的形式提供給云用戶,服務產品是用其功能和特征加以描述的。在此階段,首先,SP可以采用用戶需求調查系統、用戶評價系統、服務交互或監測程序等應用程序加以輔助支持,以做出服務開發階段的一系列決策:如提供服務的類型、服務的水平、服務的質量等級,衡量每項服務水平及質量的參數、參數值的確定等。其次,由于市場需求、競爭壓力、服務性能的變動預示著SP開發新服務及其新的SLA模板(見圖5)。總之,此階段的主要任務是:
(1)識別云用戶需求。用戶需求是開發新云SLA的主要依據。SP在將當前服務交付給用戶使用時,需要不斷地搜集用戶在使用服務過程中所反饋的信息,從而分析用戶的使用偏好、識別用戶需求。此階段中SP主要收集用戶三個方面的需求:SLA中不存在的服務、SLA中沒有定義的服務、超出當前SLA參數的定義。
(2)識別并描述與用戶需求相稱的服務特征(如服務水平、服務參數及參數值)。在服務的描述過程中,不僅要描述與服務相關的SLA參數,還要描述該SLA參數值是否可以由用戶自己選擇指定、某參數值是否依賴于已選擇的某些參數。
(3)識別并描述網絡、通信和云計算的性能。如現有網絡和信息資源供給的技術所能提供的服務水平、質量等級等,有助于SP較好地認清當前的技術水平;同時需要將性能以可量化、可計算的參數及參數值的形式將其描述出來,以供用戶選擇和評價。
(4)準備標準的SLA模板。新服務的描述及其SLA模板是本階段的結束標志及檢驗準則,為后階段與用戶的協商奠定基礎。

圖5 云SLA開發階段的任務 與工作流程
本階段結束的標志是獲得服務的SLA模板。在SLA管理的過程中還應該對SLA模板的生命周期加以管理,使SLA模板盡可能地適應環境的變化。SLA模板的生命周期包括初始模板的生成、用戶的反映/回饋、分析用戶需求、改進模板和生成最終模板等。SLA模板是一個公用的服務模板,用戶可以根據自身的個性化需求,在云SLA的協商階段,與SP進行談判、協商,從而形成適合自身需求的云SLA。
在此階段,云服務提供中心 (Cloud Service Provider Center,CSPC)持續不斷地收集來自不同用戶的請求,檢查當前目錄中是否有與用戶需求相匹配或相近的服務,估計新服務潛在的用戶量、預期利潤和潛在的市場需求等,并將用戶需求連同新服務的潛在市場價值及所估算的生命周期發送給云服務計劃和開發中心(Cloud Service Planning and Development,CSP&D)。 CSP&D 將用戶需求劃分為業務需求和技術需求,咨詢云服務質量管理中心(Cloud Service Quality Management, CSQM) 當前網絡、通信和云資源質量的情況,然后衡量提供新服務的可選架構,確定開發新服務所需的潛在技術或技術的優先級,并將技術需求發送給技術計劃和開發中心(Technology Planning and Development,TP&D)。 TP&D根據收到的技術需求,比較當前技術的性能和可靠性能力,分析其技術實現的可能性、更新或改進技術所需成本、實現新服務的時間跨度。如果TP&D認為支持服務可用性或QoS的某項技術尚未成熟,應給出使用其他特定技術的具體建議。TP&D將估計出來的成本和時間值返回給云服務計劃和開 發 中 心 (Cloud Service Planning and Development,CSP&D)。CSP&D依據所有返回的成本和時間等信息,評估服務和技術的可行性,如果可行,則生成服務描述文檔和SLA模板,并將其發送給相關中心。如CSPC負責服務
的供給,服務配置中心根據與用戶簽訂的SLA配置云服務,CSQM負責檢測服務質量的執行情況等。
經過云SLA開發階段,成型的服務及其描述文檔和SLA模板即可發布。SLA的協商階段始于用戶與提供商雙方對云服務的特征、功能、價格及雙方的職責等信息經過多次協商、談判后,簽訂包含一個或多個需要安裝和使用服務實例的合同。因此,協商階段包含的活動主要有協商服務的選項、服務參數的QoS水平、SLA模板中服務參數值,并要詳細說明SLA合同的責任和義務(見圖6)。總之,此階段的主要任務是:
(1)為特定的服務實例選擇合適的SLA參數值。用戶協商主要是圍繞服務的實例、質量水平以及用于衡量質量水平的參數值等內容展開的。
(2)確定簽訂SLA的用戶成本,即確定用戶購買服務的價格。
(3)確定發生SLA違規的SP成本,或當實現的服務水平超出SLA規定時SP所獲得的獎勵。
(4)定義與服務相關的使用報告。這與SLA參數的性質有關。
此階段結束的標志是用戶簽訂SLA合同。CSPC接受來自用戶對云服務合同信息的咨詢,將用戶信息發送給訂單處理中心(Order Handling,OH),然后其將訂單細節提交給云服務配置和激活中心 (Cloud Service Configuration&Activation,CSC&A)。CSC&A檢查訂單中各服務要素的可用性及可行性,如果涉及到外部提供商的服務要素,則咨詢采購中心(Buying)。此外,CSC&A還需請求資源提供中心(Resource Provisioning,RP)檢查支持該服務實例的能力及資源的可用性,并將核查的結果返回給OH,由OH來確定產品的可用性,并將結果返回給CSPC。CSPC向用戶提供SLA模版,針對SLA的細節向用戶提出報價,與用戶談判、協商,最后簽訂合同。合同中應包含經過雙方同意的QoS和SLA參數。

圖6 云SLA協商階段的任務與工作流程
云用戶的請求在協商階段轉化為用戶訂單與SLA合同,而SLA合同在實現階段被轉化為可運行的實例。因此實現階段即SLA實例化的過程,也是激活服務、對服務及服務實例進行配置、安裝、啟用的過程(見圖7)。云SLA實現階段的主要任務包括三個方面:
(1)配置和提供支付服務的資源。SP將提供給個體服務的實例化資源分配到生命周期的不同階段;
(2)配置滿足SLA的特定服務實例;
(3)激活云服務,將服務交付給用戶使用,
此階段結束的標志是產生實例化的、經過測試的、可接受的服務。CSC&A配置訂單中所請求的服務實例,并將請求發送至恰當的部門。CSC&A執行對服務實例的測試,以檢驗其關鍵質量指標(Key Quality Indicator,KQI)是否達到SLA的標準,并在管理服務目錄中更新服務實例及其KQIs。此外,CSC&A還需通知CSQM初始化監測新服務實例。一切準備就緒后,CSC&A通知服務OH,由OH負責通知用戶及其他部門。

圖7 云SLA實現階段的任務與工作流程
云SLA執行階段即執行SLA合同中的各項規定,它涵蓋了SLA服務的所有操作。此階段主要的任務包括:
(1)正常執行和監測服務。其中正常執行的情況包括一切正常、無差錯的執行以及出現中斷但在SLA范圍之內的執行。SP自身執行的服務與供應商/合作者執行的外部服務都需要進行全程監測。監測的目的,一方面是監測服務的性能數據,保證對服務的評價做到有據可依,有助于預測長期的服務能力;另一方面是保證服務的可用性及可靠性。
(2)即時報告服務執行的情況。報告記錄的是服務執行和監測的情況,報告的時間和頻率依服務的類型和特征而定。
(3)SLA違規的即時處理。SLA違規即服務的非正常執行。倘若SP首先發現服務中斷,SP則會采取一系列的措施,確保中斷的時間盡量不違反SLA的規定。因此,此處的SLA違規是指用戶首先發現的服務中斷,并且中斷的時間超出了SLA的規定,從而造成SLA違規。
執行階段結束的標志是用戶使用了云服務,但執行的過程卻存在正常執行和SLA違規的情況。正常執行是指執行的服務在SLA規定的范圍內,或一切正常運行,或是曾出現過服務中斷,但中斷時間沒超出SLA規定的范圍。SLA違規的情況是指用戶發現服務沒有達到SLA規定的質量等級,并向SP提出相應的賠償。
云服務在執行過程中,總是會出現超出或達不到SLA中明確規定的參數及參數值。換言之,在執行SLA的過程中會出現違反SLA規定的情況。而發現SLA違規的情況至少有兩種,一種是SP首先發現違規,并采取相應的補救措施;另一種是用戶首先發現違規,并向SP報告服務非正常執行的情況。
云SLA評估階段的任務一方面是評估單個云用戶的SLA與交付給云用戶QoS的情況;另一方面是評估某一時期SP所有業務的整體質量水平,包括整體的質量目標、業務目標以及風險管理的過程,即SP內部業務評估的一部分。
4.5.1 單個云用戶的階段性評估
(1)SP實際交付給用戶的QoS情況。QoS的評價存在不同視角:用戶QoS需求、SP提供的QoS、SP實際交付、提供給用戶的QoS以及用戶所感知到的QoS。因此,在評估云SLA的階段,必須要根據云服務在執行過程中所獲得的監測數據為QoS的執行情況提供有力的證據,從而作為評價服務及其質量的依據。
(2)用戶對服務質量的滿意度。影響用戶滿意度的因素主要有兩方面,一方面是SP實際交付給用戶的QoS情況,另一方面是用戶對QoS的期望。
(3)改進用戶滿意度的潛力。SP根據用戶的滿意度以及自身提供QoS的能力來確定自身提高QoS的潛力及改善用戶滿意度的潛力,從而保持用戶的忠誠度。
(4)用戶需求的改變。評估用戶需求與發現用戶需求的變化,進而分析其變化的因素及趨勢,有利于SP改進服務及其SLA、開發新服務及新SLA、吸引用戶和保持用戶的忠誠度。
4.5.2 SP內部整體業務的質量水平評估
(1)向所有用戶交付服務質量的整體情況。云服務的整體質量情況是SP服務實力的真實體現。因此,評估整體服務質量的情況也是SP衡量自身服務實力的依據。
(2)重新調整服務目標,使得服務實力與服務目標相匹配。
(3)重新調整服務運營。目標調整后,服務的執行和運營也需要同步協調。
(4)識別服務支持的問題。服務的執行和運營離不開支持性、輔助性的活動,如戰略計劃、風險管理、績效管理、資金財產管理和人力支援管理等。
(5)創建不同SLA的服務水平。云服務提供商可以根據用戶群的不同需求,創建SLA的不同服務等級。
云SLA評估的啟動方式有三種,第一種是階段性的評估,即根據SLA的規定,定期評估服務執行是否滿足SLA的情況。第二是用戶要求的重新評估,當用戶對SP發送過來的評估報告存在質疑時,向SP提出重新評估或復查等需求。第三是用戶退出服務時的評估,此時評估用戶退出服務的相關影響因素。
云SLA撤銷階段指的是SP因自身的問題,使得服務暫時撤銷,其主要是解決與終止服務相關的用戶端設備和線路問題。此階段與云SLA相關的問題包括:
(1)規定設備或線路的拆除或搬遷的責任。
(2)承諾拆除或搬遷設備或線路的時間。
(3)規定SP有權使用用戶的設備。設備或線路在拆除、搬遷的過程中,涉及到對用戶設備的測試、拆除或搬遷,因此,SLA中應規定SP何時有權使用或有權訪問用戶的設備,以協助服務的關閉活動,減少關閉服務的時間。
總之,由于SP自身原因導致服務被關閉,對用戶的行為產生的影響,用戶對此應具有知情權。SP均應在SLA中明確規定并勇于承擔其中的責任,從而提高用戶的滿意度和忠誠度。
云SLA的管理是對云服務過程中涉及的SLA加以規劃,使其服務質量與預先定義的性能相一致。云SLA的管理有利于高效地管理資源和服務,確保實現不同等級的服務質量。云SLA管理是SP從技術角度來衡量性能的一種方法。它通過量化性能指標獲得和保留用戶,監管性能和服務的實施,提供性能報告,并以懲罰的方式履行協議、管理供應鏈關系,有助于SP滿足用戶的需求、與用戶保持良好的長期合作關系。本文對云SLA的生命周期管理加以分析,是為了展示基礎設施即服務IaaS、軟件即服務SaaS、平臺即服務PaaS以及存儲即服務這些云服務在實現過程中得以保證其服務質量的管理方式。從云SLA的生命周期管理角度分析各類服務要滿足的基本管理模式僅僅是SLAM的一種工具,SLA參數框架的管理同樣也是SLAM的一項重要工具,這將在后續的研究中加以詳細闡述。
[1]鄧仲華,喻越.云環境下的信息服務等級協議研究[J].圖書與情報,2009,(4):57-60.
[2]McConnell J, Siegel E.Practice Service Level Management:Delivering High-Quality Web Based Services[M].Cisco Press, 2004.
[3]Nicolas C, Pankaj K,Bryan M,et al.Web Service Management Framework-Overview Version 2.0[R].Hewlett-
[4]Ludwig H, Keller A, Dan A, et al.Web Service Level Agreement(WSLA) Language Specification, Version 1.0[S].International Business Machines Corporation(IBM),2003.
[5]Anderson A.An Introduction to the Web Service Policy Language[J].IEEE Computer Society,2004:189-192.
[6]Audrieux A, Czajkowski K, Dan A, et al.Web Service Agreement Spcification (WS-agreement) [S].Grid Resource Allocation Agreement Protocol (GRAAP)WG,2007.
[7]Vedamuthu A S, Orchard D,Hirsch F, et all.Web Services Policy Framwork (WS-Policy),Version 1.5 [S].World Wide Web Consortium,2007.
[8]鄧仲華等.SLA研究及其在信息服務中的應用[A].胡昌平.信息資源研究進展[M].武漢:武漢大學出版社,2010:305-339.
[9]張健.云計算服務等級協議(SLA)研究[J].電信網技術,2012(2):7-10.
[10]TMF GB921.Business Process Framwork (eTOM) Enhanced Telecom Operations Map Concepts and Principles/Version 8.1[R].TeleManagement Forum, 2008.