郭艾華
(淮安信息職業(yè)技術(shù)學(xué)院,江蘇 淮安 223001)
基于云計算環(huán)境下的數(shù)據(jù)挖掘服務(wù)模式分析
郭艾華
(淮安信息職業(yè)技術(shù)學(xué)院,江蘇 淮安 223001)
隨著網(wǎng)絡(luò)的不斷發(fā)展,網(wǎng)絡(luò)中充斥著各種龐大的數(shù)據(jù)信息是常見的問題。如何在龐大的數(shù)據(jù)信息中挖掘有價值的信息是很多領(lǐng)域需要解決的問題。文章主要研究的是云計算背景下的數(shù)據(jù)挖掘服務(wù)模式,對其服務(wù)模式的結(jié)構(gòu)類型、建模流程和服務(wù)體系都進行分析,探討出完整的云計算背景下的數(shù)據(jù)挖掘服務(wù)模式。
云計算;數(shù)據(jù)挖掘;服務(wù)模式;分析
隨著網(wǎng)絡(luò)的不斷發(fā)展,云計算已經(jīng)成為熱點研究之一,隨著云計算的逐漸深入,基于云計算的背景下數(shù)據(jù)挖掘的服務(wù)模式應(yīng)運而生。數(shù)據(jù)挖掘服務(wù)模式具有儲存大規(guī)模數(shù)據(jù)的能力,是一種具備動態(tài)伸縮性的結(jié)構(gòu),能夠根據(jù)具體的資源需求來提供相應(yīng)的服務(wù)。這些特點都為數(shù)據(jù)挖掘服務(wù)模式商業(yè)化提供了可能性。
數(shù)據(jù)挖掘的服務(wù)模式的服務(wù)結(jié)構(gòu)包括了行為與功能的集合。它所涵蓋的服務(wù)內(nèi)容非常廣泛,既包括了選擇數(shù)據(jù)、預(yù)處理數(shù)據(jù)、分析、集成、挖掘數(shù)據(jù)等,也包括了挖掘的結(jié)果顯示以及評價等內(nèi)容。服務(wù)模式的服務(wù)結(jié)構(gòu)最基本的設(shè)施服務(wù)是以數(shù)據(jù)中心服務(wù)為基礎(chǔ),幫助客戶在資源發(fā)掘中挖掘出有價值的信息資源,并且客戶可以對其進行遠程訪問。數(shù)據(jù)挖掘服務(wù)模式下的服務(wù)結(jié)構(gòu)非常復(fù)雜,但是其功能齊全、內(nèi)容廣泛,能夠適應(yīng)于各種領(lǐng)域當中。雖然目前的數(shù)據(jù)挖掘服務(wù)模式在云計算技術(shù)下存在著一些缺陷,但是只要可以優(yōu)化系統(tǒng)的身份管理,就能為數(shù)據(jù)挖掘服務(wù)模式提供更大程度上的安全保護。
云計算背景下的數(shù)據(jù)挖掘服務(wù)模式的建模流程以圖標的形式展現(xiàn),如表1所示。
2.1 定義服務(wù)
定義服務(wù)是通過對問題域中的數(shù)據(jù)挖掘服務(wù)相關(guān)的信息收集,把問題域中的問題通過服務(wù)核心功能的定義、服務(wù)和數(shù)據(jù)的產(chǎn)出來解決問題。定義服務(wù)可以通過搜索信息的基本定義、概念等來搜索出相應(yīng)的數(shù)據(jù)、資料。可以利用定義服務(wù)來獲取相關(guān)的數(shù)據(jù)挖掘業(yè)務(wù)的服務(wù)描述,讓更多的候選服務(wù)可以在數(shù)據(jù)挖掘服務(wù)下展現(xiàn)出來,形成服務(wù)系統(tǒng)的服務(wù)目錄,讓使用者更快捷地找到自己需要的服務(wù)。
2.2 綁定服務(wù)和數(shù)據(jù)
數(shù)據(jù)挖掘服務(wù)主要是由數(shù)據(jù)和功能共同構(gòu)成的。基于服務(wù)的基本定義,可以適當?shù)亟⑵痍P(guān)聯(lián)數(shù)據(jù)以及候選服務(wù)兩者之間的有效聯(lián)系,如此就可以實現(xiàn)綁定服務(wù)和數(shù)據(jù)的目標。但是在實際的操作過程中也提供服務(wù)行為需要的信息,根據(jù)所需的數(shù)據(jù)和服務(wù)調(diào)用規(guī)定服務(wù)的相關(guān)信息,從而獲取關(guān)聯(lián)數(shù)據(jù)以及候選服務(wù)之間的關(guān)聯(lián)信息服務(wù)。綁定服務(wù)和數(shù)據(jù)也是數(shù)據(jù)挖掘服務(wù)模式的建模流程之一。
2.3 構(gòu)建服務(wù)組件
構(gòu)建服務(wù)組件是在進行了相應(yīng)的服務(wù)綁定和數(shù)據(jù)工作之后,將綁定的數(shù)據(jù)與元數(shù)據(jù)描述的服務(wù)方法進行有機地整合,然后進行封裝打包服務(wù),讓定義服務(wù)成為一個獨立的組件。通過對調(diào)用服務(wù)接口的統(tǒng)一定義,可以得到最完整的獨立服務(wù)組件。其他的服務(wù)組件構(gòu)建步驟也和定義服務(wù)組件一樣,需要將服務(wù)綁定的數(shù)據(jù)與服務(wù)進行有機地整合,如此才能構(gòu)建出更多的獨立服務(wù)組件,讓數(shù)據(jù)挖掘服務(wù)模式更加健全。

表1 數(shù)據(jù)挖掘服務(wù)模式的建模流程
3.1 基礎(chǔ)設(shè)施層
基礎(chǔ)設(shè)施層的主要作用是為數(shù)據(jù)挖掘服務(wù)提供需要的儲存和計算資源,其工作原理是利用其終端的接口把網(wǎng)絡(luò)和各種物理資源相連接起來,達到共享互聯(lián)網(wǎng)資源的目標,同時基礎(chǔ)設(shè)施層也給數(shù)據(jù)挖掘服務(wù)的虛擬化過程提供接口,實現(xiàn)資源對接和共享。
3.2 虛擬化層
虛擬化層主要是將云計算背景下的各種分布式資源采取虛擬化的工具進行匯聚,并且把這些虛擬化的資源進行封裝,讓其更具透明統(tǒng)一化。封裝后的相關(guān)資源也可以應(yīng)用于平臺層的開發(fā)利用。虛擬化層在數(shù)據(jù)封裝工作中起到了關(guān)鍵性的作用,通過虛擬化層對有用信息的封裝,可以實現(xiàn)資源的共享以及合理調(diào)配,使得資源能夠透明地顯示在服務(wù)模式中,讓使用服務(wù)模式的人員能夠感受到便利。
3.3 平臺層
平臺層是云計算背景下數(shù)據(jù)挖掘服務(wù)的核心服務(wù)層。它是各個數(shù)據(jù)及功能運轉(zhuǎn)的核心,其最主要的功能是服務(wù)目錄的管理以及組合各項功能,對服務(wù)的各項任務(wù)功能進行描述,管理相應(yīng)的數(shù)據(jù)功能,同時它也有調(diào)度計算資源的功能。集多種功能于一身的平臺層,是數(shù)據(jù)挖掘服務(wù)模式的重要核心,缺少了平臺層,數(shù)據(jù)挖掘服務(wù)模式就不可能建設(shè)出來。
3.4 應(yīng)用層
應(yīng)用層是由終端層和接口層共同組成的,是服務(wù)的最終體現(xiàn)。接口層主要負責(zé)為用戶提供服務(wù)登記、管理、處理等相關(guān)請求,然后根據(jù)請求顯示出結(jié)果,并對請求結(jié)果進行相應(yīng)的評價。終端層則是根據(jù)不同的用戶訪問以及不同的訪問介質(zhì)提供不一樣的訪問接入,然后利用計算機、移動端等實現(xiàn)用戶對數(shù)據(jù)挖掘服務(wù)的使用和訪問功能。
4.1 分析階段
分析階段是對數(shù)據(jù)挖掘服務(wù)模式建設(shè)需要的服務(wù)功能、數(shù)據(jù)、應(yīng)用等進行深入的分析。根據(jù)數(shù)據(jù)挖掘服務(wù)的需求來識別和發(fā)現(xiàn)相應(yīng)的服務(wù),并且對相應(yīng)的服務(wù)進行定義。建立數(shù)據(jù)挖掘服務(wù)模式首先要經(jīng)過分析階段,只有深入分析市場的需要以及服務(wù)模式的構(gòu)建形式,才能建設(shè)出能順應(yīng)大數(shù)據(jù)發(fā)展的數(shù)據(jù)挖掘模式,給更多的用戶便捷的享受,實現(xiàn)網(wǎng)絡(luò)資源的共享,滿足不同的使用者的需求。
4.2 設(shè)計階段
設(shè)計階段包括了對服務(wù)方式的設(shè)計、數(shù)據(jù)處理的設(shè)計、服務(wù)相關(guān)說明書的設(shè)計等內(nèi)容。一個數(shù)據(jù)挖掘服務(wù)模式的優(yōu)劣幾乎可以用其設(shè)計來決斷出來。如果設(shè)計得不好,那么就會影響到數(shù)據(jù)挖掘服務(wù)模式的運行效果,也會損害到提供商與消費者之間的利益,更重要的是不能把數(shù)據(jù)挖掘服務(wù)模式的特點等充分說明,影響數(shù)據(jù)挖掘服務(wù)模式在各個領(lǐng)域的應(yīng)用。
4.3 開發(fā)階段
開發(fā)階段主要是把分析的結(jié)果和設(shè)計好的相關(guān)服務(wù)內(nèi)容、方法、服務(wù)功能等實施到具體的操作中,讓設(shè)計得以表現(xiàn)出來。同時還要根據(jù)設(shè)計的服務(wù)功能在規(guī)定的服務(wù)定義區(qū)間內(nèi)進行集合。在開發(fā)階段可以利用服務(wù)接口來實現(xiàn)功能調(diào)用與溝通的目的,只有通過高效的開發(fā),并且不斷開發(fā)出適合使用者的功能,完善數(shù)據(jù)挖掘服務(wù)模式,才能推動云計算環(huán)境下的數(shù)據(jù)挖掘服務(wù)模式在各個領(lǐng)域中得到廣泛的應(yīng)用,促進經(jīng)歷的發(fā)展。
在云計算環(huán)境背景下的數(shù)據(jù)挖掘服務(wù)模式已經(jīng)成為時下的研究熱點。雖然我國對于數(shù)據(jù)挖掘服務(wù)模式研究的起步比較晚,但是也取得了一定的成績。通過研究數(shù)據(jù)挖掘服務(wù)模式的服務(wù)結(jié)構(gòu)、建模流程和體系結(jié)構(gòu)來解決數(shù)據(jù)挖掘服務(wù)模式研究中的缺陷問題,讓數(shù)據(jù)挖掘服務(wù)模式進一步廣泛地應(yīng)用到各個領(lǐng)域中,通過研究分析與改進,讓數(shù)據(jù)挖掘服務(wù)模式與時俱進,得到不斷的改進,更適用于現(xiàn)代經(jīng)濟社會發(fā)展的實踐中。
[1]丁靜,楊善林,羅賀,等. 云計算環(huán)境下的數(shù)據(jù)挖掘服務(wù)模式[J].計算機科學(xué),2012(S1):217-219.
[2]吳麗娜. 基于云計算環(huán)境下的數(shù)據(jù)挖掘服務(wù)模式[J].電子技術(shù)與軟件工程,2015(15):195.
Analysis of data mining service model under the background of cloud computing
Guo Aihua
(Huai’an College of Information Technology, Huai’an 223001, China)
With continuous development of Internet, there is a common problem that the Internet is filled with various huge data information. How to exploit valuable information in big data information is a problem that needs to be solved in many areas. Under the background of cloud computing, this paper mainly studies the data mining service model, its structure type, modeling flowchart and service system on the service mode are analyzed, to explore a complete data mining service model under the background of cloud computing.
cloud computing; data mining; service model; analysis
項目名稱:淮安運河文化數(shù)據(jù)庫建設(shè)的關(guān)鍵技術(shù)研究;項目編號:HAS2014019-3。
郭艾華(1979— ),男,安徽亳州,碩士,副教授;研究方向:軟件技術(shù)專業(yè)教學(xué),編程技術(shù),數(shù)據(jù)庫系統(tǒng)理論及工程技術(shù)。