湯慧 唐朝暉 彭鐵光
1.中南大學信息科學與工程學院,長沙 410083
2.湖南司法警官職業學院管理系,長沙 410131
3.湖南外貿職業學院教務處,長沙 413400
基于HSV空間顏色特征的圖像內容檢索及應用
湯慧1,2唐朝暉1彭鐵光3
1.中南大學信息科學與工程學院,長沙 410083
2.湖南司法警官職業學院管理系,長沙 410131
3.湖南外貿職業學院教務處,長沙 413400
監獄信息安全是數字化監獄的基本要求,隨著電子監獄資料庫中多元資料的日益增多,自動識別出數字監獄庫中圖像資料的內容是否涉密成為司法信息安全防范研究的焦點。顏色特征是圖像資料的最基本的視覺特征之一,在圖像內容檢索上具有舉足輕重的地位。為了實現監獄圖像資料的自動檢索與內容感知,本文提出基于HSV空間的22色非均勻顏色特征的圖像內容檢索方法。實驗結果表明,該方法與基于RGB顏色空間的顏色特征檢索算法相比,有效降低了時間和空間復雜度,圖像查全率、查準率高,實際應用效果明顯。
圖像內容檢索;顏色量化;監獄
監獄本身是一個涉密場所,在信息安全防范上不但要保證網絡運行安全,還要確保涉密信息在產生、存儲、傳遞和處理過程中的保密、完整、可用和抗抵賴。特別是對記載國家秘密信息的文字、圖像、數據等電子載體進行嚴格管理防泄密。數字監獄資料庫中內容的日益增多、類型的多元化,自動識別出圖像內容是否涉密成為司法信息安全防范研究的焦點。
圖像來源于數碼相機記錄相關文件、會議、活動等拍攝動態視頻或靜態圖像或監獄內安防設備抓拍到的圖像。圖像保存為BMP格式(24位)色彩、圖像分辨率600 dpi以上;尺寸不大于10寸。
圖像內容的檢索可從顏色特征入手。顏色特征是圖像中最基本的視覺特征,對圖像的平移、尺度、旋轉等變化不敏感,具有很強的穩定性,且計算簡單。圖像檢索含顏色直方圖[1]、顏色矩[2]、顏色集[3]、顏色分布特征[4]、中心矩法等多種表征方法。
2.1 CBIR技術
對圖像內容語義進行分析和檢索,包括圖像本身客觀屬性,如顏色、紋理、形狀等。檢索技術的應用方向多為收集圖像后進行合理加工(對比度、高度等),提取顏色特征的方法。根據顏色量化,結合相似度算法,提取基于HSV空間查準率、查全率具體的值。
2.2 顏色空間選取
RGB顏色空間有不均勻和不直觀的缺點,選擇HSV空間合適的原因,一是其三分量相對獨立,易通過設定不同權值將其轉換成一維進行測量,計算量小;二是色調分量對彩色的描述與人類視覺接近,容易區分。
2.3 HSV空間顏色量化
將三分量進行非等間隔的量化工作。理論上當V<0.152,顏色接近黑色,可忽略H的影響。當S<0.1時,顏色接近灰色圖,可忽略H的影響。即把分量H、S、V各分成9份、2份和1份,并根據色彩的不同范圍進行量化,合成為一維特征矢量公式l=HQsQv+SQv+V。其中:Qs和Qv分別是分量S、V的量化級數,當取Qs=2,Qv=1時進行細化。l取值范圍為[0,21],獲得22柄的一維直方圖。
監獄信息圖像與其他圖像在內容有明顯的行業特征,本文更多的是關心圖像中的目標的顏色特征,如監舍、勞動改造區、獄警辦公區等。如圖1中C類執勤服圖像的顏色特征集中體現在衣服和軟肩章,這些重點目標區域所特有顏色。建立基于圖像內容檢索的模型分:圖像預處理、顏色特征的提取、建數據庫與搜索引擎、人機交互界面四大部分。
3.1 監獄圖像預處理
在進行圖像分析處理前,需對圖像進行灰度化、圖像增強和降低并減少圖像的噪聲等預處理,突出有用的信息,為后續顏色特征的圖像內容檢索工作做準備。
3.2 顏色特征的提取
完成任務區域或涉密區域的選取后,保存為二級圖像,并與原始圖像建立關聯。根據上述顏色量化公式、提取算法對區域圖像進行顏色、紋理等特征提取,組建特征庫。
3.3 建庫與搜索引擎
監獄圖像數據庫由特征庫、圖像庫、實驗子庫組成。按照圖像顏色相似的原則,即圖像顏色數量相當,顏色相近;對應主要顏色面積相當;圖像內主要顏色的相似性,本文采用實驗子庫中五類主題。包括:
A類含9張監獄物理防逃鋼網墻,明顯特色特征是鋼絲呈現銀灰色;
B類含8張監舍圖,明顯特色特征是粉紅色被子,床單上有XX監獄的黑色字樣;
C類含10張執勤服圖,明顯特色特征是衣服顏色偏紫或者偏藍;軟肩章用反光線織成,在陽光下發黃;
D類含6張囚服圖,明顯特色特征是灰藍為主,上衣的前胸和后背上有白灰相間的條紋,囚褲兩側縫有藍白條;
E類含10張警車圖,明顯特色特征是整車藏藍色和白色為基本色調,輔以黃色。
算法采用衡量搜索引擎的性能的查全率(recall)和查準率(precision)作為評價標準。根據各種特征自動提取出的重點目標區域的特征數據,并建立多維索引結構。
另外,人機交互界面為操作人員提供圖像基于內容檢索的接口、參數。
驗證實驗環境是VC++6.0,用實驗子庫為操作對象。先人工篩選出43張圖像與樣圖顏色相類似的圖像,按22柄的HSV顏色直方圖圖像顏色相似進行實驗,可得A類到E類在RGB空間等間隔的查全率、查準率分別是0.778、0.75、0.7、1.0、0.9;在HSV空間非等間隔的查全率、查準率分別是0.889、0.875、0.9、1.0、1.0,不難看出新算法均高于原算法,檢索效果明顯增強。
為了實現監獄敏感圖像資料的自動檢索與內容感知,本文提出了一種新的基于HSV空間的22色非均勻顏色特征的圖像內容檢索方法。后續工作是構建圖像安全管理單元,全程實現涉密圖像的可控、在控和可審計的安全防護工作,即涉密計算機上禁止打印/屏幕拷貝圖像;禁止涉密圖像通過可編程的對象連接與嵌入接口等途徑對權限、屬性的修改;并當U盤等外設插入時自動報警,有望從信息安全防范的角度有效解決泄密問題。
[1] Swain M J, Ballard D H.Color indexing[J].International Journal of Computer Vision,1991.7 (1):11-32
[2] Pass G, Zabih R.Histogram refinement for content-based image retrieval[A].IEEE Workshop on Applications of Computer Vision[C].1996,96-102
[3] Mlsna P A, Rodriguez JJ.Efficient indexing of multi-color sets for content-based image retrieval[A].4th IEEE Southwest Symposium,2000.116-120
[4] Heckbert P.Color image quantization for frame buffer display[J].Comput Graphics,1982, 16:297-307
TP391.41
10.3969/j.issn.1001-8972.2011.12.054