王福興 伍花
【關鍵詞】內容 圖像檢索 實現
1 設計目標
這種數字圖像描述模型及處理系統,它可以在低層特征索引和語義特征標注之間建立一種統一的機制,該機制支持對特征提取結構的標準化描述,支持描述的分層結構,支持數據的透明訪問等。分為通用視覺特征及導出特征提取、特定語義特征提取、知識庫管理、查詢子系統訪問界面及統一存取子系統共5個子系統。
2 子系統功能
如圖1。
系統包括5個子系統,其功能簡述如下:
2.1 通用視覺特征及導出特征提取子系統
子系統功能主要包括:通用視覺本體的定義、以WSDL方式描述視覺特征提取接口、完成特征索引等。
子系統對圖像的屬性主要考慮以下幾方面:
(1)圖像創建信息;
(2)圖像的顏色、顏色分布、紋理、輪廓形等低層特征;
(3)布局、擺放形式等導出特征。
2.2 特定語義特征提取子系統
子系統功能主要包括:特定領域本體的定義(如以人臉資料庫為例)、以WSDL方式描述語義特征提取接口、支持自動語義標注或人工語義標注等。
子系統對圖像的語義特征主要考慮以下幾方面:表現事件或過程的描述;特定的人、地點、事件;專業術語及專業中通用的復合概念;圖像相關的主觀感受等。
2.3 知識庫管理子系統
以RDF/OWL為基礎,支持知識庫的斷言維護、實現知識庫的查詢語言功能、支持規則定義及推理機制。
知識庫中包括通用視覺特征及特定領域應用兩種類型的斷言集和規則集。
2.4 查詢子系統
在知識庫的支持下,可以完成圖像資料庫的建立和維護,并且可以實現類似QBIC或商業搜索引擎的查詢功能。
2.5 訪問界面及統一存取子系統
實現人機、機機兩種類型的訪問界面,提供系統不同層次間的統一訪問機制和接口調用。
3 開發環境
如表1。
系統支持的相關標準和協議
(1)在基礎數據格式、描述方法及存取路徑上遵循的協議,包括:RDF、OWL等相關標準。
(2)檢索上支持國際國內的有關標準和協議,包括:通用查詢標準,如:SPARQL等;低層信息檢索協議,如: WSDL等。
4 系統實現的主要功能
4.1 圖像預處理
用戶得到的圖書圖像,倘若不清晰或是有所劃痕,可以根據分數階微積分處理技術,如分數階圖像增強技術、分數階圖像修復技術對圖像進行有效處理,得到有利與系統對圖書圖像的特征提取的效果圖。
4.2 下層語義查詢
圖像的通用視覺特征分為低層特征,如顏色、灰度、紋理、形狀、空間分布等,本系統通過自動的獲取圖像低層特征或手工標注圖像低層特征,記錄這些特征并存儲起來。用戶輸入一張圖像或是手工輸入圖像低層特征,系統根據低層特征查詢包含用戶所錄低層特征的所有圖書。
4.3 上層語義查詢
圖書圖像的語義描述是提取圖書圖像的語義特征進行標注,并據此建立索引。對于圖書圖像的上層語義信息,即抽象的概念屬性,如作者、書名、出版日期、ISBN號、出版社、語種、版次、所屬分類、開本大小、字數及定價等等。用戶輸入圖書的上層語義信息,通過SPARQL語句,后臺自動查詢并給出包含用戶所錄圖書上層語義信息的圖書。顯然,這種查詢的結果過多,并不精確,所以我們需要上層語義與下層語義結合起來共同查詢。
4.4 下層語義與上層語義結合查詢
用戶以自然語言的形式,同時將圖書圖像的下層語義信息與上層語義信息輸入到檢索框中,系統后臺實現自動分層,在實現上層語義的查詢的同時,再借助下層語義來精確檢索。如用戶要找一本“圖書封面背景是藍色的C語言”,系統在查詢出C語言書的同時,再根據低層圖像特征藍色來精確查詢結果。
參考文獻
[1]王東艷.中美數字圖書館研究比較[J]. 情報資料工作,2001(6):32-36.
[2]張蓓.圖像檢索技術的發展及現狀分析[J].福建電腦,2009(004):42-42.
[3]蒲亦非,周激流.分數階微積分在現代信號分析與處理中應用的研究[D].成都: 四川大學,2006.
[4]黃曉斌.基于內容的圖像檢索技術[J]. 大學圖書館學報,1999,17(4):25-27.
[5]祁宇明,季俊忠.Internet中圖像檢索技術的研究[J].科技咨詢導報,2007(021):8-8.