郭星明,祝俞剛,陳開軍,何 勇
(1.浙江大學(xué) 杭州 310029;2.浙江經(jīng)濟(jì)職業(yè)技術(shù)學(xué)院 杭州310018)
云計(jì)算概念的提出和發(fā)展取決于兩個(gè)顯著的特征,一是海量數(shù)據(jù)存儲的增長[1],二是挖掘分析需求的增長[2],與此相伴隨,電子商務(wù)從原來的展覽式、訂單流,逐漸向智能化、決策化方向發(fā)展,企業(yè)大量的商務(wù)數(shù)據(jù)需要進(jìn)行挖掘、分析和整理,從中發(fā)現(xiàn)有價(jià)值的信息,于是形成電子商務(wù)新的重要分支——商務(wù)智能系統(tǒng) (business intelligence system,BIS)。商務(wù)智能系統(tǒng)是指利用已有的數(shù)據(jù)資源做出更好的經(jīng)營決策,包括數(shù)據(jù)訪問、數(shù)據(jù)和業(yè)務(wù)分析以及尋求發(fā)現(xiàn)新的商機(jī)[3]。在云計(jì)算和SaaS(software as a service)環(huán)境下,由于商務(wù)智能面向所有的用戶需求并提供即時(shí)在線服務(wù),其數(shù)據(jù)及各類軟件服務(wù)全部在云端構(gòu)建,因此它具有云計(jì)算的特征,同時(shí)商務(wù)智能是依賴于原始的海量數(shù)據(jù)提供智慧服務(wù),又具有管理的本質(zhì)特征。由于各個(gè)領(lǐng)域管理活動的多樣性、動態(tài)性、非結(jié)構(gòu)性和不確定性,管理活動需要進(jìn)行本體解析與構(gòu)造,形成需求制導(dǎo)、粒度恰當(dāng)、動態(tài)重組、在線調(diào)用的管理信息本體中間件[4,5]。
商務(wù)智能本體云架構(gòu)運(yùn)用云計(jì)算技術(shù),在云端進(jìn)行管理信息本體需求及其中間件的設(shè)計(jì)與部署,使用戶能夠高效率地共享利用商務(wù)智能本體云資源,顯著降低使用成本,提高開發(fā)速度。
商務(wù)智能系統(tǒng)雛形是基于事務(wù)的管理信息系統(tǒng),后來出現(xiàn)了高級管理信息系統(tǒng),在分析和處理綜合性與復(fù)雜性問題的能力上有了進(jìn)一步的提高。在管理信息系統(tǒng)(MIS)的基礎(chǔ)上,又出現(xiàn)了決策支持系統(tǒng),最終演變成商務(wù)智能系統(tǒng)。因此,商務(wù)智能系統(tǒng)是依賴于原始海量業(yè)務(wù)數(shù)據(jù)的,并對這些數(shù)據(jù)進(jìn)行存儲及加工處理的,可以為決策者提供智能服務(wù)的管理信息系統(tǒng)。它的核心仍然是數(shù)據(jù)倉庫系統(tǒng),需要先收集大量的數(shù)據(jù)并對其整理形成可供使用的數(shù)據(jù),然后把這些經(jīng)過預(yù)處理的數(shù)據(jù)進(jìn)行加工轉(zhuǎn)化成信息,形成的最終智慧產(chǎn)品用于指導(dǎo)商務(wù)實(shí)踐[3]。IBM公司曾經(jīng)提出過一個(gè)體系結(jié)構(gòu)[6],主要有下面的幾個(gè)組成部分:外部數(shù)據(jù)源、數(shù)據(jù)倉庫建模和構(gòu)造工具、數(shù)據(jù)管理、訪問工具、決策支持工具、商務(wù)智能應(yīng)用、元數(shù)據(jù)管理,相互間通過體系內(nèi)的協(xié)作可以提供數(shù)據(jù)分析與管理、知識發(fā)現(xiàn)等功能。
眾所周知,全球經(jīng)濟(jì)一體化格局下,商務(wù)智能系統(tǒng)越來越需要面向全球范圍和全域視野的用戶經(jīng)營管理與輔助決策需求,隨之而來,系統(tǒng)建設(shè)的硬件、網(wǎng)絡(luò)資源耗費(fèi)急劇增長,軟件架構(gòu)日益龐大,以知識與方法為核心的智庫趨于復(fù)雜。因此,云計(jì)算技術(shù)將系統(tǒng)的軟硬件資源全部構(gòu)建于云端,使客戶端實(shí)現(xiàn)“瘦身”,是新一代商務(wù)智能發(fā)展的重要出路。
定義1:商務(wù)云詞匯U,是商務(wù)智能所涉及領(lǐng)域的本體知識及需求描述的集合,也稱業(yè)務(wù)。
定義2:云表T,是二維關(guān)系表的集合,簡稱表。
定義3:云演算P,是針對云表T的謂詞演算邏輯的集合,也稱功能。
定義4:商務(wù)智能本體云,三元組S={U,T,P}是一個(gè)構(gòu)建于云端的特殊商務(wù)智能系統(tǒng),稱作商務(wù)智能本體云,它由商務(wù)云詞匯U、云表T及云演算P構(gòu)成。
有別于一般的商務(wù)智能系統(tǒng),上述定義實(shí)現(xiàn)了商務(wù)管理業(yè)務(wù)與功能的分離,使得多樣化、動態(tài)、非結(jié)構(gòu)性和不確定的商務(wù)智能管理需求可以轉(zhuǎn)化為靈活的、可在線遠(yuǎn)程終端維護(hù)的、結(jié)構(gòu)化的和明確的描述。
三元組S中,云表T是商務(wù)智能海量數(shù)據(jù)信息的載體,它的值域構(gòu)成無限循環(huán)集合,為了有效平衡服務(wù)器載荷,云表T按照Google提出的BigTable技術(shù)進(jìn)行構(gòu)建[7]。
商務(wù)云詞匯U是商務(wù)智能領(lǐng)域業(yè)務(wù)特征的直接體現(xiàn),它的值域構(gòu)成無限不循環(huán)集合,大量不確定的、經(jīng)常變化的、模糊的甚至帶有個(gè)性化的需求描述可借助本體云平臺提供的制導(dǎo)棒進(jìn)行定義與描述,本體云會在用戶提交后自動調(diào)用相關(guān)構(gòu)件進(jìn)行必要的處理。
云演算P通過對云表T的靜態(tài)描述(定義)和動態(tài)處理(執(zhí)行)實(shí)現(xiàn)商務(wù)智能領(lǐng)域的本體需求,根據(jù)二元關(guān)系的定義,它是一個(gè)基于二元關(guān)系操作的有限集合,商務(wù)智能任何綜合性和復(fù)雜性較高的問題都可以通過云演算序列加以處理和解決。
商務(wù)智能本體云是構(gòu)建在云端的,它符合一般云計(jì)算的基本特征,由底層基礎(chǔ)設(shè)計(jì)、中間件平臺和前臺軟件調(diào)用幾個(gè)層次組成,體現(xiàn)了基礎(chǔ)設(shè)計(jì)即服務(wù)(IaaS)、平臺即服務(wù)(PaaS)及軟件即服務(wù)(SaaS)的思想。其總體架構(gòu)見圖1。

商務(wù)智能本體云要實(shí)現(xiàn)商業(yè)用途,需要云端的部署環(huán)境和落地應(yīng)用的途徑,在海量集群服務(wù)器、高速網(wǎng)絡(luò)寬帶及數(shù)據(jù)庫的支撐下,本體云可以實(shí)現(xiàn)高效地運(yùn)轉(zhuǎn),從而為全球的終端用戶提供全方位的商務(wù)智能服務(wù)。
在商務(wù)智能本體云中,云表T是經(jīng)過抽象的關(guān)于表的集合,在任何一個(gè)數(shù)據(jù)庫環(huán)境里,云表按照BigTable框架進(jìn)行多層次布局,其架構(gòu)見圖2。
從圖2可見,環(huán)境字典相當(dāng)于BigTable框架中的chubby,它存儲著整個(gè)主數(shù)據(jù)資源的位置信息,業(yè)務(wù)元數(shù)據(jù)字典相當(dāng)于root table,是商務(wù)智能本體云的第一個(gè)表,存儲著所有表格元數(shù)據(jù)文件及其數(shù)據(jù)文件的位置信息,且不會被分割,表格元數(shù)據(jù)字典及其云演算元數(shù)據(jù)字典相當(dāng)于metadata table,存儲著眾多數(shù)據(jù)文件的位置信息、格式信息及邏輯加工信息,而數(shù)據(jù)文件就相當(dāng)于BigTable框架中的user table。當(dāng)讀取數(shù)據(jù)時(shí),需先從業(yè)務(wù)元數(shù)據(jù)字典中讀取表格元數(shù)據(jù)字典的位置信息,然后逐層往下讀取,直至找到所需數(shù)據(jù)為止。實(shí)際使用中,為了平衡服務(wù)器的資源負(fù)荷,還會進(jìn)行臨時(shí)表的連接和回收。
云演算P將各個(gè)領(lǐng)域的商務(wù)智能處理邏輯歸納為有限的、可趨向飽和的功能集合,包括表的創(chuàng)建、描述、錄入、打印、賦值、求和、排序、增刪等,見表1。
從表1可見,其云演算命令與管理信息需求的描述能夠一一對應(yīng),存在著直接的映射關(guān)系,在實(shí)際使用中,可以像自然語言一樣,與云表T、云詞匯U相匹配,反復(fù)使用,并被系統(tǒng)調(diào)用執(zhí)行,這樣就達(dá)到了用戶需求驅(qū)動機(jī)制下的軟件重用和復(fù)用。

表1 云演算命令集一覽
云演算命令中,創(chuàng)建維護(hù)(即表的描述)命令(|M…;)是一個(gè)特殊的命令,它可以將領(lǐng)域的詞匯加載到抽象的表上,形成符合商務(wù)智能需求的信息載體。比如,可以將2行2列的表,命名為“產(chǎn)品價(jià)格表”,2列的列名分別為“產(chǎn)品名稱”、“產(chǎn)品價(jià)格”,諸如此類,還可以實(shí)現(xiàn)描述的逆運(yùn)算,即將“產(chǎn)品價(jià)格表”逆描述為2行2列的表,其分別有第 1列、第2列、第1行、第2行。這種演算的過程,可以將用戶的商務(wù)智能需求映射地轉(zhuǎn)化為對表的行列的操作,具有極大的可操作性。

定義5:商務(wù)智能狀態(tài)云,設(shè)有商務(wù)智能本體云S={U,T,P},稱 R={U,T}奐S 為 S 的狀態(tài)云。
R是S在運(yùn)行過程中每一個(gè)斷面的表示,除初始狀態(tài)云Rs外,它一般是云演算P作用的結(jié)果。
定理1:商務(wù)智能本體云運(yùn)行的過程,是一個(gè)由可重復(fù)的云演算序列 P1,P2,P3,…,Pt∈P,作用于初始狀態(tài)云 Rs的過程,即用戶需求結(jié)果狀態(tài)云Re=P1·P2·P3·…·Pt·Rs。
證明:(用歸納法證明)
當(dāng) t=1 時(shí),P1∈P 為錄入云演算,可以實(shí)現(xiàn) Re=P1·Rs;設(shè)t時(shí)已成立Re=P1·P2·P3·…·Pt·Rs;
則當(dāng) t=t+1,Pt+1∈P 為錄入云演算,使得 Re=P1·P2·P3·…·Pt·Pt+1·Rs||。
這是一個(gè)很重要的定理,從狀態(tài)云來看,商務(wù)智能本體需求總是從一個(gè)起始的狀態(tài)云Rs,按照用戶的需求,經(jīng)有限步驟演算,實(shí)現(xiàn)了狀態(tài)Rs向滿足用戶需求的狀態(tài)云Re的轉(zhuǎn)移。
云詞匯是一系列具有明確領(lǐng)域,業(yè)務(wù)、任務(wù)或數(shù)據(jù)的描述,它是自然語言或書面語言、字母數(shù)據(jù)的集合,表2列出了一些代表的云詞匯。

表2 云詞匯集一覽
上述云詞匯可通過云演算描述云表及其商務(wù)智能處理過程,有的可用于表述表的名稱,有的可用于描述表的欄目,有的可用于描述表的加工。商務(wù)智能本體云按需求制導(dǎo)原則響應(yīng)用戶的需求,用戶動態(tài)、多變、模糊和不確定的商務(wù)智能需求需要在線得到響應(yīng),因此云表不僅要能夠動態(tài)地建立指針鏈,還應(yīng)為用戶提供靈活的、可逐步逼近的、結(jié)構(gòu)化的定義窗口,圖3是基于BigTable技術(shù)的商務(wù)智能本體云云表存儲結(jié)構(gòu),其中的各類云詞匯是可以由用戶在線定義的。

商務(wù)智能本體中間件平臺已按本體云的架構(gòu)進(jìn)行了實(shí)證設(shè)計(jì)研究,如圖4所示,總控模塊構(gòu)架為用戶提供服務(wù)接口,它的主要功能有:


·業(yè)務(wù)與表格的登錄設(shè)計(jì);
·代碼維護(hù);
·系統(tǒng)容災(zāi)處理;
·日志查詢;
·權(quán)限設(shè)置;
·封面設(shè)計(jì);
·打印機(jī)設(shè)置。
其中業(yè)務(wù)與表格的登錄設(shè)計(jì)能夠根據(jù)用戶需求的描述進(jìn)行處理,用戶一旦按元數(shù)據(jù)所標(biāo)引完成描述,那么,就不再需要額外的系統(tǒng)開發(fā)工作,面向最終用戶的中間件系統(tǒng)已自然而然地轉(zhuǎn)換成一個(gè)領(lǐng)域的商務(wù)智能系統(tǒng),實(shí)現(xiàn)了用戶的全部需求。
除此以外,總控模塊還具有在線調(diào)用表格設(shè)計(jì)、錄入與檢索、表格收發(fā)、代碼維護(hù)、計(jì)算與校驗(yàn)和打印輸出等其他重要的功能模塊向用戶提供商務(wù)智能服務(wù)。
一般認(rèn)為,云計(jì)算可提供一種標(biāo)準(zhǔn)的、簡化的、集中式的按需使用平臺,具有自助服務(wù)、快速反應(yīng)、彈性和可伸縮等特點(diǎn)。真正的云計(jì)算平臺應(yīng)該能實(shí)現(xiàn)以下5個(gè)特性[8]:
·以用戶為中心;
·以任務(wù)為中心;
·易于訪問;
·智能;
·可編程。
一個(gè)可在線調(diào)用和動態(tài)重組的商務(wù)智能本體中間件需求標(biāo)引實(shí)例如圖5所示。
因此,上述商務(wù)智能本體中間件平臺將為商務(wù)智能本體云提供全方位的Web服務(wù),其中業(yè)務(wù)登錄、表格設(shè)計(jì)、打印、計(jì)算等模塊中均設(shè)置了相應(yīng)的自助服務(wù)標(biāo)引,用戶可以將自己的需求按標(biāo)引所示逐個(gè)地輸入,一般對經(jīng)常變更的需求部分進(jìn)行標(biāo)引項(xiàng)設(shè)置。如果設(shè)置的靜態(tài)標(biāo)引項(xiàng)值太多,可以考慮設(shè)置較佳的缺省值,即所謂“高參數(shù)高缺省”。
已經(jīng)定義完畢的需求保存在各個(gè)元數(shù)據(jù)文件中,本體云運(yùn)行時(shí)系統(tǒng)按任務(wù)實(shí)施在線調(diào)用,并進(jìn)行動態(tài)組裝,完成用戶的需求。由于用戶定義的需求是動態(tài)、可變化的,因此,系統(tǒng)將逐步地逼近最佳狀態(tài)。
商務(wù)智能本體云架構(gòu)設(shè)計(jì)從商務(wù)智能本體特征出發(fā),結(jié)合云計(jì)算的最新技術(shù),對云端的設(shè)計(jì)與部署進(jìn)行了探索,現(xiàn)已使用 VC++(API)、ASP.NET(C#)分別完成了支持HTTP和FTP協(xié)議條件的實(shí)證研究,具有靈活、簡便、通用的特點(diǎn),系統(tǒng)開發(fā)的效率高、見效快、成本低,取得了很好的效果。之后將通過云租用加強(qiáng)商務(wù)智能本體云商業(yè)化運(yùn)行的研究。
1 劉樹超.云計(jì)算的研究與探討.煤炭技術(shù),2010,29(9):224~225
2 趙華茗.搭建基于云計(jì)算的開源海量數(shù)據(jù)挖掘平臺.現(xiàn)代圖書情報(bào)技術(shù),2010(10):76~81
3 穆向陽,繆寧,陳明等.云計(jì)算環(huán)境下BI對企業(yè)核心競爭力的影響.情報(bào)雜志,2010,29(6):50~53,43
4 郭星明,郭天晨,張三元.管理信息本體需求中間件平臺模型.浙江大學(xué)學(xué)報(bào)(工學(xué)版),2008,42(8):1 286~1 293
5 郭星明,郭天晨,張三元.基于管理信息本體和需求功能構(gòu)件的中間件平臺.浙江大學(xué)學(xué)報(bào) (工學(xué)版),2009,43 (5):844~848,951
6 陸泉,譚永麗,陳靜.商務(wù)智能.武漢:武漢大學(xué)出版社,2006
7 Chang F,Dean J,Ghemawat S,et al.BigTable:a distributed storage system forstructured data.ACM Transactions on Computer Systems,2008,26(2):1~26
8 Miller M著,姜進(jìn)磊等譯.云計(jì)算.北京:機(jī)械工業(yè)出版社,2009