當前,研究多媒體數據庫內容檢索、數據特點、數據庫系統構建等都是熱點問題,研究多媒體數據的管理和有效檢索具有重要的理論與應用價值。高性能計算機支持下的多媒體數據庫性能的迅速提升,使得內容多媒體檢索技術走向成熟,利用這門新型的數據庫技術可以有效進行內容檢索和查詢。因此,研究媒體數據庫系統中的關鍵問題,如多媒體數據庫系統的建模問題、多媒體數據庫存儲問題、多媒體數據庫組織的策略與技術問題、內容檢索的多媒體數據庫體系結構問題、內容的多媒體數據的查詢和檢索問題、內容檢索的圖像和視頻信息處理問題等方面的研究,都是目前從事多媒體數據庫與內容檢索研究者的重點研究課題。
為此,由馬修軍撰寫的《多媒體數據庫與內容檢索》(2007年7月由北京大學出版社出版)一書,對內容檢索的多媒體數據庫系統研究,具有一定的啟發、參考意義和作用。該教材綜合性地論述了多媒體信息檢索最新技術以及多媒體信息管理技術和發展趨勢。本書在系統闡述各種媒體的內容檢索技術基礎之上,通過一個統一的理論框架,探究各種媒體檢索技術的深度和廣度。在目前最新內容檢索技術背景之下,重點闡述了多媒體數據庫的關鍵技術,以便于讀者理解和掌握。多媒體數據庫建設與理論研究也是當前設計所需要的,多媒體數據庫建設、內容檢索系統和商業多媒體數據庫系統,都是當前我國重要科研課題,為圖書查詢工作帶來了極大的便利。
書中,第一,闡述了特征抽取、內容表示、索引、數據檢索、信息檢索、用戶任務、多媒體相關技術等有關概念,在此基礎上,闡述了多媒體信息管理的技術需求、多媒體信息分類、多媒體信息管理功能需求,進一步闡述了多媒體技術、數據庫管理系統、信息檢索技術、模式識別技術等相關技術問題,以及發展趨勢和未來的研究問題。第二,論述了多媒體數據類型與編碼,關于簡單文本、結構化文本、文本壓縮、數字圖像、圖形表示、圖像壓縮原理、靜態圖像壓縮標準JPEG、聲音和音頻、聲音的物理特性、聲音的數字表示、電子樂器數字接口、音頻壓縮、視頻和動畫、模擬視頻、數字視頻、視頻壓縮、其他視頻標準、多媒體表示標準、同步多媒體集成語言、MHEG標準、多媒體元數據標準、XML技術、語義Web與互操作、多媒體元數據標準化框架等。這些基本理論的闡釋有助于學生對多媒體數據庫知識體系的理解和掌握。第三,闡述了文本處理與信息檢索。具體在信息檢索模型研究方面,闡述了信息檢索模型分類、經典檢索模型和擴展經典檢索模型;在文本處理方面,闡述了文本預處理、文本特性和文本聚類;在文本索引方面,闡述了倒排文件表、后綴數組、簽名文件、相關反饋和查詢擴展等。第四,分別論述了Web信息檢索、基于內容的音頻和音像的檢索、視頻索引、檢索與結構化、多媒體數據庫、多媒體數據庫中高維特征的索引和檢索技術、多媒體通信與分布式多媒體數據庫系統、數字圖書館和多媒體信息安全等。
多媒體數據包含有文字、圖像、視頻和音頻等十分豐富的信息內容。利用多媒體數據庫可以按照內容檢索提取出特定的信息,使得人們可以很便捷地、有效地利用存儲的多媒體信息。內容檢索是一個逐步求精的過程,先要對初始化檢索進行說明,通過相似性進行匹配,選擇一個滿意的示例進行特征調整以形成新的查詢,最后逐步縮小檢索范圍,直到用戶滿意為止。多媒體數據庫數據模型的實現有賴于關系數據庫的多媒體擴展、面向對象的多媒體數據庫和超媒體數據庫三種方式。基于內容的圖像表示方面,圖像媒體相似性檢索主要通過顏色相似性、紋理相似性和形狀相似性特征進行。基于內容檢索多媒體數據庫構建,包括內容檢索多媒體數據庫的總體結構、一般媒體處理系統、面向對象多媒體數據庫存儲管理系統、媒體特征提取系統、檢索引擎、用戶查詢接口等方面的理論建構。多媒體數據庫層次結構具有:媒體支持層、存取與存儲數據模型層、概念數據模型層、多媒體用戶接口層等四個層次;基于內容檢索應用系統的體系結構建構,包括插入子系統、特征提取子系統、數據庫、查詢子系統等。圖像對象的創建內容,包括圖像區域的分割和特征提取,如顏色特征、形狀特征與紋理特征的提取。在內容檢索視頻處理技術方面做到鏡頭的切換和鏡頭內的運動;視頻處理技術包括鏡頭邊界的檢測、代表幀的選取、特征提取和視頻聚類等。總之,多媒體數據庫系統構建與內容檢索理論知識研究,有助于大學生多媒體數據庫信息的查詢。
(曾子力/碩士,海口經濟學院網絡學院講師)