蔡文偉
(肇慶學院計算機科學與軟件學院,肇慶 526021)
盡管,目前業界已經從不同視角對大數據展開了充分的研究,但是,對于如何在成本和獲利層面上,對云服務進行評估,該類研究還是少之又少,因此,本文就此方向,提出了一個量化模型,該模型在成本驅動和非線性分析(例如,存儲空間的需求波動等)的基礎上,對云服務和市面傳統高性能數據倉庫,兩種大數據存儲方式,展開了性能對比評估分析。
值得一提的是,本文是通過充分參考Skourletopou?los等人從大數據角度上實現的相關研究成果,以此為基礎,對其量化模型展開修訂,進而提出本文的相關公式模型的。
該公式模型是基于用戶租賃的云存儲服務的實際存儲能力,通過假設用戶對存儲容量的需求,因為數據的大幅度增長而發生波動的情況下,采取非線性以及非對稱的方式展開相關數據分析。在初始階段,用戶對數據倉庫還是云服務的選擇以及云存儲的最大容量,明顯對額外的成本產生影響,我們可由此,預測未來是否會產生更多的存儲空間需求??梢娫撛u估模型,對于技術層面以及非技術層面都有相當的參考意義[1]。
充分考慮到云存儲的租賃屬性,本研究提出的相關計算公式和公式模型,就充分建立在對成本和獲利的分析基礎上,通過非線性和非對稱的方法,能夠準確計算出,在存儲容量沒有充分利用的情況下,還有多少收益無法實現的。
本文假定,在對以L年為周期的預計收益和總投入成本進行充分考慮的情況下,作出了在云服務還是傳統數據倉庫之間作出選擇的。
租期結束后預計的收益,可根據以下表述和假設進行估量:
(1)云存儲是基于租賃的,按照L年為周期,每年依據用戶對于存儲空間的需求波動,按實際情況(比如,以每月10億字節為單位)收費的。
(2)存儲容量的需求波動,在L年為周期的時間段內,可以被預測,在服務質量和用戶體驗質量需被保障的情況下,該波動將直接影響到整體成本。
(3)當開發該收益模型的時候,充分考慮到云服務的可擴展性和彈性,因此,每年的存儲需求的變化所導致的成本變化,應包含,文檔(非結構化)存儲的成本變化,維修服務成本變化,按需輸入/輸出成本變化,操作(例如相應服務請求)成本變化以及服務器和技術支持成本變化。
(4)全部的網絡成本,包括了帶寬的使用成本,網絡出口成本以及數據在不同區間傳輸成本,尤其對于在云端,需始終保持在線狀態的移動服務而言,其對網絡帶寬和數據傳輸延時要求比較高,為避免延時,需滿足對超過實際帶寬的網絡需求,因此產生額外的網絡成本。
(5)當用戶從存儲區里檢索內容的速度比以往要快的時候,數據傳輸的吞吐量會加大,導致了產生額外的輸入/輸出成本投入。
(6)額外的服務器成本,包括了額外投入使用的CPU內核的成本,以及出于臨時處理事務需要而增加的內存數目[2]。
在這種情況下,針對傳統數據倉庫應用的成本分析模型,采用以下的公式進行表述,其中Smax是指存儲容量的最大值,Scurr是指近期利用的存儲容量(涉及使用情況計量以及根據使用情況的收費),由于傳統的數據倉庫在性能上不具備云計算和云服務在存儲上的彈性和可伸縮性,因此,針對傳統數據倉庫的成本分析模型,沒有檢測目前使用的存儲容量,因此只要滿足Scurr≤Smax,是不會發生成本的變化的,也就是說以L年為周期的時間段內,實際獲益總是為0,也就是B為0。值得一提的是,一旦出現了Scurr>Smax的情況,增加的存儲容量利用系統停機時間,添加到數據倉庫存儲系統中,由此引起了額外的成本,因為是非正常運作的時間的存儲容量增加,也就是說不是實際使用到的,這方面也可以計算費用。

這里:
Cs=Csmax=Cαmax+Cγmax+Cηmax+Cθmax+Cκmax+Cλmax+Cμmax+Cσmax
這里,Cs表示,每年租賃云存儲的總成本,Cα表示數據存儲成本,Cγ表示文件存儲成本,Cη表示維修服務成本,Cθ表示網絡成本,Cκ表示按需輸入/輸出成本,Cλ表示操作成本,Cμ表示服務器成本,Cσ表示技術支持成本。
而針對云存儲的成本分析和獲利模型的情況恰好相反,模型采用了以下的公式進行表述,然后關于獲利的計算過程,在下面的算法1中將詳細表述。

CD1=Cs/m*(S max-Scurr)
CDi=12*[Δi-2*(Smax-Bi-2)],i≥2 ,這里:
Cs=Cscurr=Cαcurr+Cγcurr+Cηcurr+Cθcurr+
Cκcurr)+Cλcurr+Cμcurr+Cσcurr
這里,β1是以L為周期,第2年存儲空間的需求變化率,βi是以L年為周期,第3年開始直到第L年結束,各年比前一年增長的存儲空間需求變化率;B0是以L年為周期第2年存儲空間的使用量;Bi以L年為周期第3年開始直到第L年結束,各年存儲空間的使用量。
而δ1是因租賃云存儲服務,以L為周期,第2年成本變化率;δi是以L年為周期,第3年開始,直到第L年結束,各年比前一年增長的成本變化率;Δ0
Δ0=(1+δ1%)*Scurr
Δi=(1+δi+1%)*Δi-1,i≥1
δi%=αi%+γi%+ηi%+θi%+κi%+λi%+μi%+σi%,i≥1,且:

因此:

Bi以此類推。
算法1.實現獲益模型的偽代碼:
//在預測存儲容量的需求呈直線增長的前提下,該算法計算出云服務模型的獲利情況//
1:執行函數BENEFITSCALCULATION(Smax,Scurr,i,Δ%,β%,L,Cs/m,α%,γ%,η%,θ%,κ%,λ%,μ%,σ%)
2:依次輸入(α%,γ%,η%,θ%,κ%,λ%,μ%,σ%)
Δ←α%+γ%+η%+θ%+κ%+λ%+μ%+σ%
3:返回Δ%值
4:依次輸入( Smax,Scurr,i,Δ%,β%,L,Cs/m)
5:for i=1to L執行循環//從第一年到第L年B【i】← (1+βi+1%)*Bi-1,i≥ 1//得出各年的 B 值
6:結束該循環
7:返回各年的B值
8:結束全部進程
本文提出一個全新的成本/收益分析模型,該模型在假定云存儲容量需求發生波動的情況下,對云服務與傳統數據倉庫之間,孰優孰劣,展開比較評估。從研究角度看,在租賃云存儲服務的過程中,對成本和收益的分析就采納了相對復雜的分析模型,通過添加更多的相關參數,對該模型進行表征,使得該模型具有相對強大的可擴展性,即該模型的公式是用戶可根據自身的專業水平進行自定義參數添置的。進一步說,想要充分對云服務與傳統高性能數據倉庫應用進行比較,還需應用量化工具,作為一種“概念驗證”的途徑,來真正實現分析模型的公式。從技術角度看,本文所指的云存儲是安裝在由谷歌App引擎所支持的谷歌云平臺上,該存儲應用是由Java程序語言開發出來的。
CA1=Cs*Scurr
CD1=Cs*( )
Smax-Scurr CA2=(1+δ1%)*Cs*(1+β1%)*Scurr
CD2=(1+ δ1%)*Cs*[Smax-(1+ β1%]*Scurr][4]
以下是,假設云存儲需求呈線型增長,通過兩個不同的場景,以4年為周期(L=4),對云服務和傳統數據倉庫展開的成本和獲益比較分析。下面分別給出兩個場景相應參數的值。
首先是存儲需求變化率β,在場景1,第1年到第2年為5%,第2年到第3年為15%,第3年到第4年為20%,第4年到第5年為23%;在場景2,第1年到第2年為10%,第2年到第3年為22%,第3年到第4年為35%,第4年到第5年為40%;
然后是租賃云存儲造成的額外成本增長率δ,在場景1,第1年到第2年為2%,第2年到第3年為5%,第3年到第4年為18%;在場景2,第1年到第2年為5%,第2年到第3年為10%,第3年到第4年為25%;
應用于等式(1)到(4)的變量值分別為 Smax=6/兆兆字節,Scurr=2/兆兆字節,剛開始第一個月租賃云存儲的成本為Cs/m=300美元。
然后分別進行計算,得出如表1和表2的評估結果。

表1 場景1中針對云服務的成本和獲利分析計算結果

表2 場景2中針對云服務的成本和獲利分析計算結果
對比傳統數據倉庫,重申本文第二部分公式說明處,需指出的,由于其在性能上不具備云計算和云服務在存儲上的彈性和可伸縮性,因此,針對傳統數據倉庫的成本分析模型,沒有檢測目前使用的存儲容量,因此只要滿足,是不會發生成本的變化的,也就是說以L年為周期的時間段內,實際獲益總是為0,也就是B為0。
本文圍繞云服務的租賃屬性,應用本文提出的量化公式模型,將云服務與傳統數據倉庫展開成本和獲益的分析,結果顯示,云服務給使用方帶來的持續的獲益增長,建議使用者把獲益作為存儲需求增長所產生的額外成本,從而獲得投資收益的最大化。
[1]R.Buyya,C.S.Yeo,S.Venugopal,J.Broberg,I.Brandic.Cloud Computing and Emerging IT Platforms:Vision,Hype,and Reality for Delivering Computing as the 5th Utility.Future Gener.Comput.Syst.,2009,25(6):599-616.
[2]G.Mastorakis,E.Markakis,E.Pallis,C.X.Mavromoustakis,G.Skourletopoulos.Virtual Network Functions Exploitation Through a Prototype Resource Management Framework.in 2014 IEEE 6th International Conference on Telecommunications and Multimedia(TEMU),Heraklion,Crete,Greece,2014:24-28.
[3]P.Neves,J.Bernardino.Big Data Issues.in Proceedings of the 19th International Database Engineering&Applications Symposium,2015:200-201.
[4]G.Skourletopoulos,C.X.Mavromoustakis,G.Mastorakis,J.M.Batalla,C.Dobre,S.Panagiotakis,E.Pallis.Towards Mobile Cloud Computing in 5G Mobile Networks:Applications,Big Data Services and Future Opportunities.in Advances in Mobile Cloud Computing and Big Data in the 5G Era,1st ed.,vol.22,Switzerland:Springer International Publishing AG,2017.
[5]G.Skourletopoulos,C.X.Mavromoustakis,G.Mastorakis,J.M.Batalla,C.Dobre,S.Panagiotakis,E.Pallis.Big Data and Cloud Computing:A Survey of the State-of-the-Art and Research Challenges.in Advances in Mobile Cloud Computing and Big Data in the 5G Era,1st ed.,vol.22,Switzerland:Springer International Publishing AG,2017.