數字圖書館圖像資源檢索框架的構建與實現——基于非下采樣的Contourlet變換+徐彤陽+任浩然+張國標



[摘要]圖像檢索為數字圖書館的發展提供了技術支持,圖書館應重視數字化發展以提升服務質量。本文提出一種數字圖書館圖像資源檢索框架,并對系統的實現過程做了詳細的分析。同時,在提取圖像特征時提出了一種基于非下采樣的con.toudet變換圖像檢索算法(NSCT),能夠在大量圖像數據中挖掘有效的特征信息。該算法首先對圖像進行多尺度、多方向分解,然后計算低頻和高頻中不同方向的子帶系數的標準差和均值作為圖像的紋理特征。實驗結果顯示,本文提出的圖像檢索框架具有可行性,能夠為用戶提供更優質的搜索服務,并且與同類特征提取算法進行比較,該算法具有良好的檢索性能和較高的查準率、查全率。
[關鍵詞]數字圖書館;圖像檢索;框架構建;非下采樣conlourIet
DOI:10.3969/j.issn.1008—0821.2017.06.009
[中圖分類號]C250.76 [文獻標識碼]A [文章編號]1008—0821(2017)06—0055—06
隨著計算機技術、網絡技術及多媒體技術的快速發展,人們進入了“讀圖時代”,大量圖像源源不斷的產生,而且圖像本身具有生動性、直觀性和易懂性的特點,滿足了人們對信息的需求,成為信息處理領域中的主要處理對象。盡管數字圖書館圖像采集技術以及存儲技術也在不斷地進步,但如何從大量的圖像數據中分析出有價值的內容并對這些海量的圖像進行有效的組織,使用戶能快速、準確地找到他們感興趣的信息,成為研究者們研究的熱點之一。同時,在大數據時代,用戶的信息素養越來越高,對信息的質量要求也不斷提高,也對圖書館產生了更新、更高的要求。而圖像檢索技術的發展,能夠更好地滿足用戶對圖像檢索匹配的精準度要求,改善用戶在圖像檢索過程中的信息檢索體驗。總之,對圖像檢索領域的深入研究將決定大數據時代數字圖書館能否抓住機遇提升自己的發展水平。
近年來,對圖像檢索需求和檢索行為等方面的研究已經取得了豐富的成果,但在如何提高用戶圖像檢索效率的問題上并沒有統一合理的解決措施,而圖像檢索技術恰恰能夠彌補這一缺失,現階段的圖像檢索技術主要分為基于文本的圖像檢索和基于內容的圖像檢索兩大類。傳統的基于文本的圖像檢索系統是先對圖片信息用關鍵字進行描述和注釋,該技術雖然已經在數字圖書館圖像檢索領域中有了比較成熟的研究經驗,但依靠手工標注會浪費大量的精力并且人為的主觀性理解不能充分表達圖片的內涵,使得圖像檢索的結果并不盡如人意。圖像文本包含更多的內容,這些豐富的信息需要使用一定的方法和技術進行挖據,采用內容的檢索方法不僅可以對圖像信息進行客觀合理的描述,而且采用相似性度量的手段有效地提高了檢索效率,滿足了信息時代發展的需求,于是基于內容的圖像檢索(CBIR)成為數字圖書館研究的主要方向。
本文通過構建一種基于內容的數字圖書館圖像資源檢索框架,并利用非下采樣的Contourlet變換方法對圖像資源進行特征提取,提高了圖像檢索精準度,有效地實現了數字圖像資源檢索方案,為數字圖書館圖像資源的搜索提供了參考價值。
1基于內容的圖像檢索研究現狀
CBIR結合人工智能、認知心理學、面向數據庫等方面的學科知識,利用計算機視覺等方面的理論對圖像進行自動檢索,它不再依賴人工注釋,具有節省人力、客觀、可建立復雜描述和應用前景廣闊等諸多優點,因而該技術被廣泛研究。現階段CBIR主要從以下兩個方面進行研究:
1)圖像特征提取。圖像特征提取就是通過映射或變換將高維信息轉換成計算機識別的底層特征的過程,常用的特征包括顏色特征、形狀特征、紋理特征等,這些特征要盡可能維數小、獨立性好才能對圖像的描述具有更好的相似性。
2)相似匹配和圖像特征索引。提取圖像特征后,如何采用合理的方法對特征集進行匹配和索引以提高圖像檢索的精度成為該階段的主要研究方向,圖像匹配和索引大致分為3類技術:相似性測量、聚類分析、相關反饋技術。主要框架概念圖如圖1所示。
1.1特征提取
特征是圖像的一種固有屬性。在CBIR檢索模型中,對特征向量的提取是實現圖像檢索的關鍵步驟之一,也是數字圖書館圖像檢索領域研究的重點和難點。特征提取的內容主要有基于低層的特征提取和基于高層語義的特征提取兩個方面。盡管高層語義特征能夠更好地反映圖像特征。目前也出現了有關高層語義特征提取的相關研究,但圖像低層特征與高層語義特征之間存在著巨大的“鴻溝”,如何從低層特征中提取語義信息并將它們融合在一起仍然處于瓶頸期,所以近幾年對圖像特征提取的研究主要還是從顏色、形狀、紋理等低層特征來進行的。
顏色作為圖像內容的底層特征之一,在圖像檢索領域的研究中得到廣泛應用。顏色特征易于從圖像中提取,它對圖像的變化依賴性較小,可以有效地減少旋轉、尺度不一所帶來的干擾。除了采用顏色直方圖對顏色特征進行提取以外,還可以采用顏色聚合向量、顏色協方差和顏色矩等方式提取。
形狀特征是圖像的另一個重要特征,包括了部分圖像語義信息,形狀特征的優點是可以通過算法提取將圖像低層特征和高層特征很好地融合在一起,這樣就可以得到圖像中的檢索目標。但形狀特征受圖像的平移、縮放、旋轉等變換的影響,有一定的局限性。有關形狀特征的圖像檢索,可以通過基于邊界特征的或基于區域特征這兩種方法來提取。
紋理是絕大多數物體表面的固有屬性,不同物體表面的組織結構之間的排列規則不相同,人們通過感官視覺可以輕易地分辨不同的紋理。紋理特征能夠反映像素在領域空間的灰度分布規律,是對像素在局部區域之間關系的一種度量。針對紋理特征的提取算法已經有了很多研究成果,目前紋理分析的方法基本分為統計法、結構法、模型法和空間/頻率域聯合分析法這4類方法。
1.2特征的索引與匹配
對數字圖書館圖像資源特征提取后,如何將圖像數據集進行索引和匹配成為主要的問題,如何解決語義鴻溝問題是這一過程的主要研究難點。相似性度量是圖像特征匹配非常重要的組成部分,其承擔著判斷圖像是否相關的重要作用,常用的相似性度量算法有曼哈頓距離、夾角余弦、蘭式距離、歐式距離和編輯距離等。每一種相似性度量算法都有其優點也有其應用的局限,對于不同的應用和不同的圖像特征,在設計圖像檢索系統時,相似性度量算法的選擇和設計是不可忽視的一步。同時,單一地通過一種相似度測量方法難以產生健壯的、符合人類感知的圖像序列,來解決這一問題,研究人員還需要從圖像聚類、分類和相關反饋技術進行改進。
聚類和分類適用于處理大規模、非結構化的圖像數據。Murthy在對圖像檢索時提出了K-means聚類并結合分層的方法,首先根據圖像顏色特征將其分為不同類別,再利用K-Means算法進行進一步的聚類,分層聚類能夠有效忒搞檢索速度,K-Means算法通過對向量與其聚類中心之間的距離進行評價,高校準確地獲得聚類結果。張永庫等人在利用改進顏色聚合向量提取圖像顏色特征的基礎上,找到服務條件的特征向量作為初始聚類中心,利用分散度與貢獻度進行聚類并建立特征索引庫,提高了檢索的效率。
相關反饋為人們提供了與系統交互的機會,通過反饋檢索結果,可以不斷提高檢索效率。芮勇等人最早提出了相關反饋技術,并將其應用于基于內容的圖像檢索中。現階段有關圖像檢索的相關反饋技術研究方向為減少系統與用戶的交互次數,滿足用戶的檢索需求從而提高檢索的效率和精度。
2數字圖書館圖像資源檢索框架構建
本文構建的基于內容的數字圖書館圖像檢索框架主要由特征提取、相似匹配、反饋輸出這3個模塊組成。其中對圖像資源特征提取,建立特征數據庫是構建數字圖書館檢索系統的核心,也是本文研究的重點。具體模型框架如圖2所示。
系統首先對存儲在數字圖書館數據庫中的圖像進行自動提取特征,然后用多維的特征向量來表示,存入到圖像特征數據庫。而用戶根據自己的檢索需要,選擇一張或幾張樣本圖像,同樣用相同特征提取方法提取特征向量。最后,系統計算出特征數據庫中特征向量和提取的樣本圖像的多維特征相向量的相似距離,根據距離進行排序,再結合相應的索引信息,最終就能獲得一定程度上相似的圖像。
2.1圖像預處理
由于生成圖像數據的工具、手段以及圖像在傳輸時會引入噪聲,導致圖像質量下降。因此,為了提高圖像檢索效果,在收集圖像數據集后,不能直接作為檢索圖像,本文首先對原始圖像灰度處理,然后采用中值濾波的方法對圖像進行去噪以減少圖像檢索的干擾因素。
2.2圖像數據庫特征提取
特征提取是數字圖書館圖像檢索系統實現的重要環節,信息提取的完整性直接影響數字圖書館圖像檢索的效果,紋理特征反映圖像本質信息,是近年來較為常用的提取圖像信息的方式,本文提出了一種NSCT紋理算法提取圖像特征,并通過實驗并與同類算法比較分析,該算法具有較好的檢索效果,可以為數字圖書館圖像檢索系統的實現提供參考方案。
2.2.1 NSCT算法
NSCT算法是由Contourlet變換發展而來的,Contourlet變換的基本思想是用近似的“線段”來逼近原始圖像,相比小波采用“點”來逼近,可以利用更少的系數來近似原始圖像,因而具有良好的各異性和方向性。它很好的解決了二維或更高維奇異性,可以獲得更多的高頻中各個方向的細節信息。但是,采用Contourlet變換對圖形進行分解時,必須對圖像信號頻繁地進行采樣操作,導致分解的過程中不僅缺乏平移不變性還容易信息失真,為此Cunha等人針對Contourlet變換的一些局限性進行改進,提出非下采樣的Contourlet變換,在分解和重構過程中,取消了上、下采樣操作,具有較好的平移不變性。
NSCT由非下采樣的金字塔濾波器NSP和非下采樣的方向濾波器組NSDFB實現。如圖3所示,圖像首先經NSP分解為低通部分和帶通部分,然后帶通部分通過DFB進行多方向分解,類似的分解步驟可以對低頻子帶繼續迭代濾波,實現對信號的多尺度、多方向分析。因為多尺度分解和多方向分解是相互獨立的,所以各高頻子帶上的方向分解數都可以是2的任意正整數次冪。與Contourlet變換相比,由于剔除了下采樣環節,經NSCT分解后的圖像與原始圖像尺寸一致,在保持平移不變性的同時也保留了更多的圖像細節。
3.2結果分析
通過實驗結果看出,相比同類算法,本文提出的算法在檢索目標圖像后,返回前7、10、20、30幅圖像的平均查準率要明顯高于其它類方法,同時該算法檢索五幅圖像的平均查全率達到80%,優于Harr小波變換檢索40%和文獻[16]提出的檢索算法59%,不僅使數字圖書館圖像檢索框架得以有效實現,而且具有較高的檢索準確率。
4結語
大數據時代,圖書館新興的數據分析、知識挖掘、信息處理等服務為數字圖書館帶來了歷史性的發展機遇,圖書館通過總結數據中存在的規律,挖掘潛在價值,將促進圖書館服務水平的提升。圖像檢索技術為數字圖書館圖像采集與處理提供了新的技術支持和科技創新的平臺,能夠更好地實現圖書館的服務宗旨。本文構建了數字圖書館圖像資源檢索框架,并提出了一種基于NSCT的圖像紋理檢索算法,實驗結果顯示該算法實用便捷,具有較好的魯棒性和較高的檢索性能,對數字圖書館圖像檢索的服務模式具有一定參考價值。多種特征融合和相關反饋機制可以進一步提高圖像檢索精度,將是以后研究的重點。