李艷紅
(西安外事學院,西安,710077)
傳統的關系數據庫管理系統只支持基本的規范數據類型。隨著計算機技術的飛速發展和廣泛應用,對計算機和數據庫提出了處理和管理各種表示復雜對象的不規則數據的要求,特別是圖像、聲音、動態視頻等這樣的多媒體信息,數據類型不規則,數據的取值范圍不一致,數據的量級不相同。因此,就提出來了如何對這些多媒體信息進行表示、組織、存儲、查詢和檢索的問題,多媒體數據庫技術應運而生。
媒體(Media)是信息的載體。多媒體是指多種信息媒體,例如圖形、圖像、聲音、視頻、文本、數字、字符等等復合體或有機集成。多媒體數據庫管理系統是指把不同媒體數據進行一體化組織、存儲和管理的數據庫管理系統。由于多媒體數據庫需要同時管理規則數據(例如數字、字符等)和非規則數據(例如:圖形、圖像、聲音、視頻、文本等)。而非規則數據除了具有數據量大和處理復雜等特點外,其中的圖形和圖像等數據還具有空間特性,聲音和視頻等數據還具有時序特性。這些都給多媒體數據的處理和管理帶來了新的技術要求。
(1)多媒體數據的組織和存儲要求。由于某些多媒體數據的數據量巨大,按照傳統的方式是無法對其進行組織和存儲管理的,所以除了需要為這類數據選擇專門的邏輯組織方式和物理方式外,還需要附加一些必要的處理操作。例如:對動態視頻數據需要進行專門的壓縮和解壓縮等。
(2)多媒體數據的處理要求。對多媒體數據支持的事實表明,系統中的媒體數據類型不僅增加較多,而且復雜媒體的數據類型和數據量的比例明顯增大。對于每一種媒體數據類型來說,都要求有適合于自己的數據結構、存取方法、操作要求、基本功能和實現方法。這些都給多媒體數據的處理帶來了難度和困難,給系統的實現提出了更高的技術要求。
(3)多媒體數據的查詢要求。多媒體數據的引入使系統查詢方式呈現出多樣性。要求系統不僅要支持傳統的精確查詢方式,而且要支持非精確查詢、相似查詢、模糊查詢等。在以圖像處理為主要應用目的的信息系統(圖像數據庫)中,一般要求系統具有基于內容的檢索功能,比如按圖像的紋理特征、顏色特征、邊緣特征、形狀特征等進行查詢。
(4)其它處理和管理要求。在多媒體數據的引入過程中還會出現其它一些要求。比如動態視頻的播放可能需要幾個小時,所以就需要系統提供長事務支持功能。又比如,在復雜媒體數據描述問題時,對系統的表現形式、表現質量、系統效率等都是有一定要求的。因而對系統的有關實現技術都提出了更高的要求。
由于多媒體數據的多樣性,很難用同一的數據模型面向所有的媒體應用需求。盡管有各種各樣的多媒體數據庫出現,但目前還沒有一個得到公認的多媒體數據模型,因而也沒有一個標準的多媒體數據庫體系結構。本論文在分析目前的各種多媒體數據庫組織方式的基礎上,認為目前的多媒體數據庫組織結構主要有以下兩種實現方式。
這種組織結構的基本思想是根據多媒體數據的多樣性特點,分別為每一種媒體數據建立數據庫,分別為每一種媒體數據的數據庫建立相應的數據關系系統。其組織結構示意圖如下圖所示。

在這種結構的多媒體數據庫系統中,可以利用各種單一的媒體數據庫的技術對各個媒體的數據庫進行管理。各個單一媒體的數據庫管理系統及其數據庫雖然是相對獨立的,但它們之間是可以通過相互通信進行一定的協調和執行相應的操作。用戶既可以對單一媒體的數據庫進行訪問,也可以對多個媒體的數據庫進行訪問。但從總體上來說,同時對多個媒體的數據庫進行聯合查詢操作等是比較困難的。也就是說,這種組織結構的多媒體數據庫中的各個不同媒體數據庫之間的協調是相當有限的,用戶必須按照應用要求,通過對不同媒體的數據庫管理系統和相應的數據庫的操作和訪問實現相應的應用要求。所以用戶應用程序的設計相對要復雜一些。
這種數據結構的基本思想是,在各種不同媒體的數據庫管理系統(也即,DBMS)之上建立一個主數據庫管理系統,通過主DBMS對各個從DBMS進行管理和控制,從外部應用的角度弱化多媒體數據的多樣性,降低用戶應用程序設計的復雜性。但每一種媒體數據的數據庫仍然由各自的數據庫管理系統管理。其組織結構示意圖如下圖所示。

在這種結構的多媒體數據庫系統中,微觀上各個媒體數據庫的管理仍是由各種單一媒體的數據庫管理系統實現的⑥⑤。但在宏觀上,用戶對數據庫的訪問是由DBMS實現的,用戶對多種媒體數據的查詢結果的集成也是由主DBMS實現的。這樣用戶對多種媒體數據的綜合查詢對用戶來說是相對透明的,從而使用戶應用程序的設計相對要簡單一些。
當前的各種商用數據庫管理系統,例如Ingress,ORACLE,Sybase,DB2等都提供了對多媒體數據類型的支持,其支持方式主要是在系統中引入無結構數據類型實現對多媒體數據的存儲。但總的來說它們對多媒體應用的支持是有限的。在多媒體數據庫的研究和設計還有許多技術問題需要研究解決,這些問題主要是:①多媒體數據類型的研究;②多媒體數據庫的標準化查詢與操作語言研究;③多媒體數據庫的用戶接口技術研究;④多媒體數據庫的存取和組織技術研究;⑤多媒體數據庫的一體化管理技術研究;⑥多媒體數據庫的控制與并發機制研究等。
①基于內容的檢索。基于多媒體對象內容的檢索要求用戶必須給出選擇條件。例如用戶可能使用諸如“找出與這個圖像類似的所有圖像”和“找出至少包含三個飛機的圖像”之類的查詢來查找需要的圖像。當圖像插入到數據庫中時,DBMS必須分析它們,同時自動抽取特征,以利于基于內容的查詢,這些信息用來搜索滿足給定查詢的圖像。另一個示例是,用戶可能使用信息檢索技術和關鍵詞搜索來查找感興趣的文檔。數據庫供應商正在把這些技術結合到DBMS產品中。如果將這些特定領域的檢索和搜索技術與傳統的DBMS查詢有效的結合仍然不是很清楚。抽象數據類型和對象關系DBMS查詢處理的研究同樣只是一個開始,還有很多工作需要做。②管理大對象的倉庫。通常,DBMS的重點是包含有大量元組的表,每個元組相對較小。一旦諸如圖像、聲音片段和視頻這樣的多媒體對象存儲在數據庫中,就必須有效的處理這些非常大的對象。例如,可以將壓縮技術集成到DBMS環境中。另外,分布式DBMS必須開發一些技術以便有效的檢索這些對象。在分布式系統中,多媒體對象的檢索已經在一定范圍內被解決了,例如客戶/服務器系統,但是還存在許多難題。③視頻點播。許多公司希望提供視頻點播服務,這些服務能使用戶撥號到服務器,然后請求待定的視頻。視頻必須實時地、可靠地和便宜地分發到用戶計算機上,理想的情況是,用戶應能夠執行相類似VCR的功能,如果快進和回放。從數據庫的角度講,服務器必須與規定的實時約束進行競爭,考慮通信網絡的特征,服務器和客戶的視頻分發速率必須能夠同步。
目前,應用較多、較成熟的多媒體數據庫都是通過對關系模型數據庫的擴展來實現對多媒體數據的存儲與管理的,在未來的多媒體數據庫技術的發展中,面向對象的多媒體數據庫將以對象媒體數據模型來建構多媒體數據庫,從而真正實現多媒體數據庫。
[1]舒涵.營造海量多媒體數據的家[J].中國 計算機用戶,2003,(19)
[2]范振梅,王晨光,范振鈞.多媒體數據庫的實現[J].通化師范學院學報,2004,(04)
[3]劉天惠.Visual Basic 程序設計教程[M].北京:清華大學出版社,2006
[4]周朋紅.多媒體技術與應用[M].北京:中國水利水電出版社,2005
[5]胡松義.數據庫管理系統應用教程[M].湖南:湖南人民出版社圖書發行部,2006
[6]徐蘭芳.數據庫設計與實現[M].上海:上海交通大學出版社,2006