李磊 山東省青島第二衛(wèi)生學(xué)校,山東省 膠州市 266300
多媒體數(shù)據(jù)庫技術(shù)綜述
李磊 山東省青島第二衛(wèi)生學(xué)校,山東省 膠州市 266300
隨著多媒體技術(shù)的發(fā)展和廣泛應(yīng)用,多媒體數(shù)據(jù)越來越多地被引入到數(shù)據(jù)庫中,從而形成了多媒體數(shù)據(jù)庫。由于多媒體數(shù)據(jù)具有數(shù)據(jù)量大、內(nèi)容復(fù)雜、非結(jié)構(gòu)化的特點,如何對這些數(shù)據(jù)進行有效的管理和利用,是多媒體數(shù)據(jù)庫要解決的主要問題。本文在介紹多媒體數(shù)據(jù)給數(shù)據(jù)庫管理帶來的問題的基礎(chǔ)上,綜述了多媒體數(shù)據(jù)庫及其關(guān)鍵技術(shù)。
多媒體數(shù)據(jù);多媒體數(shù)據(jù)庫;關(guān)鍵技術(shù)
隨著多媒體技術(shù)和網(wǎng)絡(luò)技術(shù)的迅速發(fā)展以及社會信息化程度的不斷提高,承載信息的媒體也逐步表現(xiàn)出多樣化、數(shù)字化、交互化和集成性等特點,如圖形、圖像、音頻、視頻、動畫等被稱為多媒體數(shù)據(jù)的載體。
多媒體數(shù)據(jù)庫是與傳統(tǒng)數(shù)據(jù)庫不同的數(shù)據(jù)庫,它是為了實現(xiàn)對多媒體數(shù)據(jù)的存儲、檢索和管理而出現(xiàn)的一種新型的數(shù)據(jù)庫技術(shù)。在多媒體數(shù)據(jù)庫中,媒體可以進行追加和變更,并能實現(xiàn)媒體的相互轉(zhuǎn)換,用戶在對數(shù)據(jù)庫的操作中,可最大限度的忽略媒體間的差別,實現(xiàn)多媒體數(shù)據(jù)庫的媒體獨立性。
簡單的說,多媒體數(shù)據(jù)庫是按一定方式組織在一起的可以共享的相關(guān)多媒體數(shù)據(jù)的集合,簡稱MDB(Multimedia Database)。與傳統(tǒng)數(shù)據(jù)庫應(yīng)用中的主流數(shù)據(jù)庫系統(tǒng)——關(guān)系模型數(shù)據(jù)庫相比,多媒體數(shù)據(jù)庫中的數(shù)據(jù)是非格式化的、不規(guī)則的且數(shù)據(jù)量大,沒有統(tǒng)一的取值范圍,沒有相同的數(shù)量級,也沒有相似的屬性集。
在傳統(tǒng)的數(shù)據(jù)庫中引入多媒體數(shù)據(jù)并對其操作,是一個極大的挑戰(zhàn)。這不是一個只要把多媒體數(shù)據(jù)加入到數(shù)據(jù)庫中就可以完成的問題。由于多媒體數(shù)據(jù)具有不同于傳統(tǒng)數(shù)據(jù)的一些特點,這樣給數(shù)據(jù)庫的管理就帶來了許多問題,主要有以下幾個方面:
2.1 多媒體數(shù)據(jù)量大且媒體之間的差異也極大,從而影響數(shù)據(jù)庫的組織和存儲方法
一幅彩色圖像,即使在壓縮的情況下,也需要幾K甚至幾十K或幾百K字節(jié)的數(shù)據(jù)量,而字符型數(shù)值等數(shù)據(jù)可能僅有幾個字節(jié)的數(shù)據(jù)量。只有組織好多媒體數(shù)據(jù)庫中的數(shù)據(jù),選擇設(shè)計好合適的物理結(jié)構(gòu)和邏輯結(jié)構(gòu),才能保證磁盤的充分利用和應(yīng)用的快速存取。
2.2 數(shù)據(jù)非格式化
多媒體數(shù)據(jù)基本上都是二進制形式,數(shù)據(jù)本身沒有嚴格的數(shù)據(jù)結(jié)構(gòu),即為非格式化數(shù)據(jù)或非結(jié)構(gòu)化數(shù)據(jù)。必須另外加入一些描述和解釋,否則難以利用。這種描述和解釋不是數(shù)據(jù)本身,而是關(guān)于數(shù)據(jù)的數(shù)據(jù),即元數(shù)據(jù)。元數(shù)據(jù)的生成是多媒體數(shù)據(jù)庫管理中的一個重要而突出的問題。
2.3 媒體種類的增多增加了數(shù)據(jù)處理的困難。
每一種多媒體數(shù)據(jù)類型都要有自己的一組最基本的概念(操作和功能)、適當?shù)臄?shù)據(jù)結(jié)構(gòu)和存取方法、以及高性能的實現(xiàn)。但除此之外也要有一些標準的操作,包括各種多媒體數(shù)據(jù)通用的操作及多種新類型數(shù)據(jù)的集成。不同媒體類型對應(yīng)不同數(shù)據(jù)處理方法,這便要求多媒體數(shù)據(jù)庫管理系統(tǒng)能不斷擴充新的媒體類型及其相應(yīng)的操作方法。
2.4 不同的查詢機制和方法
傳統(tǒng)的數(shù)據(jù)庫查詢只處理精確概念和查詢,相對簡單且易于實現(xiàn)。但在多媒體數(shù)據(jù)庫中非精確匹配和相似性查詢將占相當大的比重。媒體的復(fù)合、分散、時序性質(zhì)及其形象化的特點,注定要使數(shù)據(jù)庫不再是只通過字符進行查詢,而必須要采用特征匹配和模糊匹配的查詢機制和方法。
多媒體數(shù)據(jù)庫具有傳統(tǒng)數(shù)據(jù)庫所不具有的特性和結(jié)構(gòu)以及要實現(xiàn)的功能要求,因此,多媒體數(shù)據(jù)庫包含了許多不同于傳統(tǒng)數(shù)據(jù)庫的新技術(shù),其中主要技術(shù)有多媒體數(shù)據(jù)建模技術(shù)、多媒體數(shù)據(jù)存儲管理技術(shù)、多媒體數(shù)據(jù)的壓縮/還原技術(shù)和多媒體數(shù)據(jù)查詢技術(shù),其關(guān)鍵內(nèi)容是多媒體數(shù)據(jù)建模技術(shù)。
3.1 數(shù)據(jù)建模
數(shù)據(jù)模型(Data Model)是數(shù)據(jù)庫管理系統(tǒng)中用于提供信息數(shù)據(jù)表示和操作手段的形式構(gòu)架,數(shù)據(jù)模型通常由數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)操作、和完整性約束三部分組成。
多媒體數(shù)據(jù)要比傳統(tǒng)數(shù)據(jù)復(fù)雜的多,因此在選擇數(shù)據(jù)模型時必須考慮這些特性。多媒體數(shù)據(jù)模型要支持非結(jié)構(gòu)化數(shù)據(jù)(如視頻、聲音)的表示及其屬性特征的描述;支持多媒體的表現(xiàn)建模,即多媒體數(shù)據(jù)模型應(yīng)能表示各種媒體對象間的語義關(guān)系、時態(tài)關(guān)系和空間關(guān)系。多媒體數(shù)據(jù)模型主要采用關(guān)系數(shù)據(jù)模型的擴充、面向?qū)ο蟮臄?shù)據(jù)模型和超媒體數(shù)據(jù)模型。
3.2 數(shù)據(jù)存儲管理技術(shù)
多媒體數(shù)據(jù)存儲管理技術(shù)是指根據(jù)多媒體數(shù)據(jù)的使用頻率和速度等要求,將數(shù)據(jù)采用分級存儲的方案。由于多媒體數(shù)據(jù)量非常龐大,考慮到系統(tǒng)的性能價格比,往往可以將少數(shù)極常用的數(shù)據(jù)存于RAM 中,常用的數(shù)據(jù)存于硬盤,而光盤和磁帶庫則作為二、三級庫。大對象一般是分頁面進行管理的。多媒體對象的存儲關(guān)鍵問題是能夠快速定位,對超媒體文檔和超媒體數(shù)據(jù)記錄進行隨機存取。目前比較流行的存取方法是B+樹和Hash方法。為滿足視頻等連續(xù)媒體的時域約束需要,還應(yīng)設(shè)法提高磁盤的讀寫速度,減少讀寫的延時及抖動。
3.3 數(shù)據(jù)的壓縮與還原技術(shù)
多媒體數(shù)據(jù)壓縮與還原技術(shù)是指數(shù)據(jù)壓縮比、壓縮/解壓縮速度以及簡捷的算法。以壓縮/解壓縮后的數(shù)據(jù)是否與壓縮前的原始數(shù)據(jù)完全一致作為標準,可以把數(shù)據(jù)壓縮方法劃分為無失真壓縮(可逆壓縮)和失真壓縮(不可逆壓縮)兩類。多媒體信息的數(shù)據(jù)量要遠遠大于傳統(tǒng)媒體,例如:一幅1024×768 ×24位色的圖像需要2.4M字節(jié)存儲,相當于一本一百萬字的小說的存儲容量。因此在計算機中,結(jié)構(gòu)化數(shù)據(jù)如文字、數(shù)值是編碼后進行存放,非結(jié)構(gòu)化數(shù)據(jù)如圖形、圖像、視頻和音頻也必須進行壓縮存儲。比如要實現(xiàn)視頻數(shù)據(jù)的管理,首先必須解決的問題就是壓縮編碼和解碼,目前MPEG、AVI、H.261以及Quick Time等壓縮標準的壓縮比例可以達到50:1~200:1。由于多媒體數(shù)據(jù)的壓縮,在對它們進行編輯時,數(shù)據(jù)的長度會引起變化,這不僅會給數(shù)據(jù)重新存入帶來問題,還會引起媒體間的不同步,故還應(yīng)采取適當?shù)姆绞剑瑢Ρ痪庉嫷拿襟w進行局部的重編碼,以保持原來的大小。
3.4 數(shù)據(jù)查詢技術(shù)
多媒體查詢技術(shù)(MSQL)是指多媒體數(shù)據(jù)庫采用結(jié)構(gòu)化查詢語言的技術(shù)。MSQL是一個功能強大的查詢語言,它有助于用戶高效操縱多媒體數(shù)據(jù)庫,實現(xiàn)數(shù)據(jù)庫與應(yīng)用程序間的相互獨立,并且對于用戶是友好的。多媒體數(shù)據(jù)庫查詢語言不僅能用關(guān)鍵字進行檢索,還可以處理基于內(nèi)容的非精確查詢或模糊查詢。
多媒體數(shù)據(jù)庫是一門非常綜合的技術(shù),它幾乎涵蓋了計算機及電子領(lǐng)域的所有學(xué)科。隨著社會信息化程度的提高和相關(guān)技術(shù)的發(fā)展,多媒體數(shù)據(jù)庫技術(shù)對社會生產(chǎn)、生活的影響也越來越大。現(xiàn)在,無論是數(shù)字圖書館、數(shù)據(jù)倉庫、數(shù)據(jù)挖掘、科學(xué)可視化、電子商務(wù)、遠程教育、醫(yī)療、媒體服務(wù)等學(xué)科都能找到多媒體數(shù)據(jù)庫直接或潛在的應(yīng)用價值。因此,無論從研究價值還是應(yīng)用前景上看,多媒體數(shù)據(jù)庫技術(shù)的研究都處于信息科學(xué)和技術(shù)發(fā)展前沿,并將在研究的挑戰(zhàn)性、活躍性及應(yīng)用的廣泛性方面起著舉足輕重的領(lǐng)導(dǎo)作用。
[1] 胡曉峰,吳玲達等.多媒體技術(shù)教程.北京:人民郵電出版社,2002
[2] 黃志軍,曾斌.多媒體數(shù)據(jù)庫技術(shù).北京:國防工業(yè)出版社,2005
[3] 鐘玉琢,沈洪等.多媒體技術(shù)及其應(yīng)用.北京:機械工業(yè)出版社,2003
[4] 段英風(fēng),楊春華.多媒體數(shù)據(jù)庫及應(yīng)用.青海氣象,2005年第2期
[5] 孫凌,高大利.有關(guān)多媒體數(shù)據(jù)庫的技術(shù)研究.福建電腦,2003年第12期
[6] 李澤建,許亮.淺析多媒體數(shù)據(jù)庫技術(shù)的發(fā)展和展望,昆明理工大學(xué)學(xué)報.2002年第2期
[7] 王桂東.多媒體數(shù)據(jù)庫技術(shù)的研究.濰坊學(xué)院學(xué)報,2002年第4期
[8] 李逸波.多媒體數(shù)據(jù)庫技術(shù).北京:機械工業(yè)出版社,2004
10.3969/j.issn.1001-8972.2011.17.038