黃金國



摘 要: 針對單節點的圖像分類算法效率低,實時性差的難題,提出基于云計算的圖像分類算法。首先提取圖像數據庫中的圖像分類特征;然后將待分類圖像通過云計算模式與圖像庫中的特征進行匹配,并根據匹配結果將其劃分到相應的類別中;最后采用UPenn和Caltech?101數據庫測試算法的可行性。結果表明,該算法降低了圖像分類的時間復雜度,取得了不錯的圖像分類結果,且分類效率要明顯優于對比算法,具有良好的實際應用價值。
關鍵詞: 云計算; 海量圖像數據庫; 圖像分類器; 圖像特征
中圖分類號: TN911.73?34; TP181 文獻標識碼: A 文章編號: 1004?373X(2017)05?0063?03
Abstract: Since the image classification algorithm for the single node has low efficiency and poor real?time performance, an image classification algorithm based on cloud computing is proposed. With the algorithm, the classification features of the images in the image database are extracted, and then the images under classification are matched with the feature in the image library by means of the cloud computing mode and divided into the corresponding classes according to the matching results. The databases of UPenn and Caltech?101 are used to test the feasibility of the algorithm. The results show that the algorithm has reduced the time complexity of image classification, obtained a good image classification result, its classification efficiency is obviously superior to the comparing algorithm, and has a certain practical application value.
Keywords: cloud computing; massive image database; image classifier; image feature
0 引 言
隨著數字圖像處理技術的不斷成熟,每天會產生大量的圖像,如何對這些海量圖像進行準確分類,從中找到對用戶有用的圖像至關重要,而且圖像分類是圖像檢索的基礎,因此設計性能優異的圖像分類算法具有十分重要的應用價值[1?3]。
圖像分類實際是一個模式識別問題,根據相應的特征和分類器將圖像歸屬到相應的類別中,因此要獲得較高的圖像分類正確率,首先要提取能夠描述圖像類別信息的特征,當前圖像分類的特征很多,如顏色、紋理、形狀等,這些特征均有各自的優勢[4?5]。圖像分類中的第二個關鍵問題是圖像分類器的設計,目前主要基于K近鄰、貝葉斯網絡、神經網絡等。K近鄰分類的速度快[6?8],但分類精度低;貝葉斯網絡無法準確描述圖像類別與特征之間的映射關系,分類結果的可信度低;神經網絡的學習速度快,分類效果優于其他方法,但最優網絡結構如何確定目前還沒有統一理論指導,分類結果不穩定[9]。隨著圖像數據庫規模不斷增加,圖像分類速度成為分類結果優劣的一個重要評價指標,而目前主要采用單節點方式進行圖像分類,當樣本規模大時,圖像分類的速度慢、效率低,無法滿足現代圖像分類的實際應用要求[10]。
云計算技術包括分布式和網格計算優點,可以將許多節點組合在一起,產生一個功能強大的計算機系統,為了加快規模圖像的分類速度,提出云計算的圖像分類算法,結果表明,本文算法降低了圖像分類的時間復雜度,分類效率高,具有一定的優越性。
1 單節點的圖像分類原理
單節點的圖像分類算法的工作原理為:首先提取圖像數據庫中的圖像分類特征;然后將待分類圖像通過與圖像庫中的特征進行匹配,并根據匹配結果將其劃分到相應的類別中,具體如圖1所示。
2 基于云計算的圖像分類算法
2.1 提取圖像的顏色特征
2.3 云計算的圖像分類算法工作步驟
Step1:收集大量各種類型的圖像,提取每一種圖像的顏色特征,并采用式(10)進行歸一化處理,然后將特征保存到圖像數據庫中。
[x′ik=xik-minximaxxi-minxi] (10)
Step2:對待分類的圖像進行特征提取和歸一化處理。
Step3:在單點上將待分類圖像特征與圖像數據庫中的特征進行匹配,得到相應的分類結果。
Step4:將每一個單點的分類結果輸入到reducer進行融合。
Step5:根據融合結果得到最終的圖像類別。
3 仿真測試
3.1 實驗環境
在Linux平臺下,采用1個主節點和20個工作節點組成一個云計算,其中20個工作節點的配置相同,選擇文獻[10]的圖像分類算法進行對比實驗,采用正確率和分類時間對分類結果進行衡量。實驗環境的參數設置見表1。
選擇UPenn圖像庫和Caltech?101圖像庫作為仿真實驗對象,將全部圖像歸一化為256×256個像素,UPenn和Caltech?101圖像庫中的部分圖像如圖4所示。
3.2 結果與分析
采用本文的圖像分類算法和對比算法對UPenn圖像庫和Caltech?101圖像庫進行仿真測試,統計它們的分類結果,得到分類正確率和分類時間如圖5和圖6所示,對圖5和圖6的實驗結果進行分析,可以得到如下結論:
(1) 本文算法的平均分類正確率要高于對比算法,這是因為本文算法引入了最小二乘支持向量機建立圖像分類器,可以更好地反映圖像類別與特征之間的聯系,得到十分理想的圖像分類結果。
(2) 與對比的圖像分類算法相比,本文算法的平均分類時間相對更少,大幅度加快了圖像的分類速度,這主要是因為本文采用Map/Reduce工作模式,使各個節點可以并行運行圖像分類算法,降低了圖像分類的計算時間復雜度,應用范圍更廣。
4 結 語
當前圖像庫具有海量等特點,而單一節點的性能提高有限,導致圖像分類速度慢,為了加快圖像的分類速度,提出了云計算的圖像分類算法。該算法首先設計單個節點的圖像分類算法;然后將圖像分類任務劃分為多個子任務,每一個子任務在單節點并行執行圖像分類,減少圖像分類時間;再將全部單節點的圖像分類結果進行融合,在UPenn圖像庫和Caltech?101圖像庫上的實驗結果表明,本文算法不僅獲得了理想的圖像分類結果,分類的效率也明顯得到改善,而且可以滿足圖像的在線、實時性要求,具有廣泛的應用前景。
參考文獻
[1] LU D, WENG Q. A survey of image classification methods and techniques for improving classification performance [J]. International journal of remote sensing, 2007, 28(5): 823?870.
[2] 邢曉芬,徐向民,黃曉泓,等.基于內容的醫學圖像分類研究[J].科學技術與工程,2007,7(1):85?90.
[3] 董立巖,苑森森,劉光遠,等.基于貝葉斯分類器的圖像分類[J].吉林大學學報(理學版),2007,45(2):249?253.
[4] 韓冰,楊辰,高新波.融合顯著信息的LDA極光圖像分類[J].軟件學報,2013,24(11):2758?2766.
[5] 劉越,彭宏京,錢素靜,等.基于核拉普拉斯稀疏編碼模型的圖像分類[J].模式識別與人工智能,2014,27(10):915?920.
[6] 余萍,趙繼生.基于線性疊加特征和CNNS的圖像分類方法[J].微電子學與計算機,2015,32(10):36?40.
[7] 朱志賓,丁世飛.基于TWSVM的圖像分類[J].南京師大學報(自然科學版),2014,37(3):8?14.
[8] 劉尚旺,李名,胡劍蘭,等.基于視覺顯著性檢測的圖像分類方法[J].計算機應用,2015,35(9):2629?2635.
[9] 祝軍,趙杰煜,董振宇.融合顯著信息的層次特征學習圖像分類[J].計算機研究與發展,2014,51(9):1919?1928.
[10] 倪鵬,黃蔚,呂巍,等.基于Zernike矩特征的FCM?RBF神經網絡圖像分類器[J].吉林大學學報(理學版),2014,52(6):1284?1288.