藺 莉,魏 銳
(黃淮學院信息工程學院,河南駐馬店,463000)
云計算(Cloud Computing)是一種基于互聯網的新型超級計算方式,實現在“云”端數據計算和信息存儲,它把存儲于各分布式設備上的資源聯合起來協同工作。使得各種應用能夠根據需求獲取適當的存儲空間和各種服務。云計算的核心就是網絡上海量數據的存儲和計算。通過這種方式,共享的軟硬件資源和信息可以按需提供給計算機和其他設備。云計算服務通常提供通用的通過瀏覽器訪問的在線商業應用,軟件和數據可存儲在數據中心。因此云計算在編程模式及數據的存儲、管理等方面具有自己特有的方式。通過云服務平臺,使得人們獲取信息、溝通交流的方式更加方便、快捷。
云計算根據服務類型可以分為基礎設施即服務(IaaS),平臺即服務(PaaS)和軟件即服務(SaaS)。根據云計算服務對象可以分為公有云、私有云和混合云。
云計算的特點是具有超大規模及虛擬化,對客戶端需求低,低成本,簡單的終端和“按需提供服務”,實現輕松共享數據,安全的數據存儲,高可靠性,服務面向的廣泛性,用戶計算的分布性,用戶服務的個性化、多樣性、靈活性、獨立性、通用性與易擴展性,高度自治性等特點。用戶還可以按照自己的需求,應用高層次的編程模型,完成自己的云計算程序,并在云端運行該程序。
云計算可以分為以下四層:基礎設施層、平臺層、應用層和客戶端,其中基礎設施層又可以分為硬件平臺、虛擬和操作系統層和存儲平臺三部分,應用層分為應用軟件層與服務兩個部分,如圖1 所示:
云計算體系結構是由用戶交互界面、服務目錄,管理系統、部署工具、資源監控和測度、服務器集群組成。其工作原理是用戶由客戶端通過用戶交互界面根據所需要的服務來選擇服務目錄,通過終端向“云”提出服務請求,并驗證通過后,將由管理系統來找到可用計算資源和服務,通過部署工具根據用戶請求智能來挖掘服務云中的資源。
數據挖掘(Data Mining)是指從信息庫中存在的大量的、隨機的、有噪聲的、模糊的、不完全的實際應用數據中,采用數據挖掘技術,從信息庫中提取或“挖掘”出隱藏于大量數據之內的、事先人們不知道的、但又是潛在有用的信息和知識的過程。數據挖掘的一般目的是幫助決策者尋找數據間潛在的關聯,從大量數據中挖掘出未知的數據之間的關系模式,去發現未知的、隱藏的知識,數據挖掘所得到的知識信息具有未知性、有效性和實用性。通過挖掘出這些知識,決策者把知識運用到企業中,可以幫助決策者對預測趨勢發展做出正確的判斷,及時地調整企業發展策略,在激烈的商業競爭,立于主動地位。從知識發現的整個過程來看,數據挖掘步驟如圖1所示。

圖1 數據挖掘的過程
各步驟的具體功能如下:
(1)數據選擇:根據不同的挖掘目標,從數據庫中檢索與分析任務相關的數據,對目標數據進行處理。
(2)數據預處理:對選擇的數據進行消除噪聲和不一致數據處理。
(3)模式發現:使用智能方法從經過預處理后的數據中提取用戶可能感興趣的數據模式。

圖1 云計算的層次結構
(4)模式評估:通過特定的評估方式,根據某種興趣度度量,得到用戶真正需要的模式。
(5)知識表示:通過可視化和知識表示技術向用戶提供挖掘的知識,為用戶的決策服務。
對圖像數據信息進行挖掘,首先需要預處理圖像數據,其次要收集圖像數據庫中圖像的顏色、大小等特征信息,來構建圖像數據的特征空間,然后進行分類和預測分析、多維分析,檢索圖像數據的相似性,最后進行圖像數據的關聯挖掘。數據挖掘系統的結構如圖3所示。

圖3 數據挖掘系統的結構
通過分析數據挖掘系統的結構,來探討如何利用云平臺,在海量數字圖像數據中挖掘所需的圖像數據信息。挖掘圖像數據的信息過程如圖4所示。

圖4 圖像數據挖掘
(1)預處理
圖像數據的預處理,在對圖像數據進行挖掘之前,首先需要對圖像數據庫中的圖像數據進行處理。是把圖像數據庫中一些無用的,模糊不清的或已損壞的圖像數據信息進行檢查、清理和選擇。保證在圖像數據信息的挖掘過程中,圖像數據信息的可靠,正確。
(2)構建圖像數據的特征空間
在圖像數據特征庫中,通過收集圖像文件的名稱、格式、尺寸、圖像文件創建時間和圖像文件描述中的關鍵字、圖像的形狀、圖像的顏色和紋理等特征信息來構建圖像數據的特征空間,實現對圖像數據信息的多維分析。來挖掘圖像數據庫中的有用的圖像數據信息。
(3)圖像數據的分類和預測分析
對圖像數據分類,是根據圖像的特征來進行分類,得出知識與規則來預測未來的信息。依據這些特征進行圖像數據的有效分類,通過分類可以從中發現每類圖像數據的一般特性,有了每類圖像的特性就可以進行圖像數據的預測分析工作。
(4)多維分析圖像數據
基于圖像數據的描述子(特征描述子和布局描述子)來構建圖像數據的立方體,圖像的數據立方體包含了圖像的顏色、紋理、形狀等信息,在圖像數據信息中,通過圖像的形狀、顏色和紋理等多維的特征,綜合分析多維的各種數據信息。找出圖像數據的知識和規模,挖掘出圖像數據庫中有用的圖像數據信息來。
(5)檢索圖像數據信息的相似性
檢索圖像數據信息的相似性,通常采用基于圖像小波的特征、圖像顏色的特征、帶有區域粒度特征和圖像多特征構成的特征來進行圖像相似性檢索。通過對圖像特征、圖像數據的內容或描述進行檢索。其中,基于圖像的顏色、形狀和紋理等特征來檢索圖像數據的相似性,首先是把這些圖像特征轉化為特征向量,其次是對轉化后特征向量與圖像數據庫中已經存在的特征向量進行檢索匹配。然后根據比較結果檢索到與該圖像相似的圖像。
(6)挖掘圖像數據信息的關聯規則
對圖像數據的信息進行關聯規則的挖掘,就是在圖像信息數據庫中,按照圖像的特征,找出在不同圖像中隱含的、有價值的圖像信息的規則與模式,在圖像數據庫中挖掘出圖像數據信息之間的關聯。在挖掘中,一個事務對應一個圖像,圖像對象之間的關聯規則有圖像內容和非圖像內容特征間的關聯;與空間聯系無關的圖像內容間的關聯;與空間聯系有關的圖像內容間的關聯三種。
基于云計算的圖像數據挖掘系統利用云計算的服務模式,采用B/S結構,如圖5所示。系統由數據庫群、服務器群和4個子系統組成,系統利用PaaS服務模式向用戶提供一個編寫數據挖掘算法的平臺,通過IaaS服務模式向平臺租用服務器或數據庫,使用SaaS服務模式,為用戶提供數據挖掘服務。

圖3 基于云計算圖像數據挖掘系統框架
圖像數據挖掘是多媒體數據挖掘的一個分支,圖像數據挖掘需要綜合各類知識與技術,其挖掘的過程就是對圖像數據庫中原始的大量圖像數據進行綜合分析,挖掘出隱含的、有價值的圖像信息的規則與模式,并對其進行模式提取、知識表達和知識推理,最終得到圖像數據信息的知識與規則。實現圖像數據信息的挖掘發現。
[1]杜琳,陳云亮,朱靜.圖像數據挖掘研究綜述[J].計算機應用與軟件,2011,02:125-128
[2]孫利,陳萍,陳華麗.關聯規則挖掘在網絡教學評價中的應用[J].電腦開發與應用,2007,1:1
[3]雷亮,汪同慶,楊波.圖像關聯規則挖掘研究[J].計算機應用研究.2009 ,6:2374-2376