□鄧珞華 鄧東寧 陳晟
鄧東寧,中南財經政法大學圖書館,武漢,430073;
陳晟,中石化武漢分公司信息中心,武漢,430082
視頻圖書館是國外近幾年隨著影像資料的增長和計算機影像技術的發展而出現的一個新名詞,它主要是指一些專門收集視頻資料以及相關的音頻資料并對公眾提供服務的機構,例如澳大利亞在上世紀末就建立了音樂數字圖書館和圖像數字圖書館[1],并在互聯網上免費提供使用,美國北卡萊羅納大學信息與圖書館學院也主持過“開放數字視頻圖書館”項目[2]。
上世紀末以來,影像資料的增長呈迅猛發展的勢頭。目前視頻資料的來源主要有3個:一是音像出版社制作的 VCD、DVD、CD光碟和錄音帶錄像帶,目前我國300多家音像出版社每年出版量大約2.8萬種[3]。二是廣播電視電影節目制作單位,據因特網電影數據庫統計,1991年全球生產影片5972部,2001年達到10342部。據美國加州大學伯克利分校信息管理與系統學院的“How much information”項目的統計,2003年,全球有電視臺21264個,每年播放節目3100萬小時。全球有廣播電臺47776個,每年播放節目 7000萬小時,按信息存儲量計算,大大超過了美國所有研究圖書館的館藏總量[4]。三是單位和個人制作的音像資料。隨著攝像機、具有攝像功能的手機的普及以及計算機處理圖像功能的加強,個人制作的聲像節目越來越多,在民間和網上流傳。海量的音像資料是視頻圖書館產生和發展的前提和基礎。越來越多的圖書館開展了音像資料的采集、組織、管理和服務工作,如美國國會圖書館和英國大不列顛圖書館的音視頻資料都達到數百萬件[5],我國絕大多數中等以上規模的圖書館都建立了聲像閱覽室,視頻圖書館的研究也提上了圖書館理論界的日程表。
目前國內向圖書館提供影像資料的主要是一些中間供應商,如中外合資的武漢緣來文化傳播有限責任公司,它主要提供國外影視節目制作單位(如澳大利亞的CLASSROOM VIDEO、美國的 DISCOVERY)制作的影像節目,其特點是節目制作精美,版權問題解決得徹底,中英文聲音和文字對照,尤其適合大學讀者的需要,其中很多科教節目可以直接用來作大學老師的課件。該公司目前可提供的節目達到一萬小時以上。此外,一些做傳統文字數據庫的供應商,如清華同方公司、北京超星公司等也開始涉足這個領域。
與傳統的文字資料相比,聲像資料整合了文字、圖形、影像、聲音及動畫等不同信息,具有更直觀、更生動的特點,但同時,由于聲像資料除了含有文字信息之外,更包含聲音、圖像信息,因此在著錄、保存、使用、版權與軟件硬件等許多方面比文字資料更復雜,更具特殊性,本文試圖從技術和管理兩個層面對視頻圖書館的特點進行剖析和總結。
由于視音頻數據的特殊性,它的元數據處理在功能設置、元素設置等方面具有更高的要求:1)視音頻數據為了加強其描述能力,需要更多的元素和修飾詞。例如影視節目的責任者除了有劇本原作者外,還有改編者、導演和演員、配音、燈光、道具等諸多責任者。又如錄像帶包括時長、制式、畫面縱橫比、聲道數等等紙質文獻不具備的物理特征。2)視音頻數據中的信息來源是多樣性的,如腳本、字幕、圖像和聲音,因此視音頻元數據除了包括傳統的文本元數據,還應包括視頻元數據和音頻元數據以幫助用戶高效檢索和瀏覽所需信息。3)為了滿足一些專業用戶深層次的檢索需求,視音頻數據需要從視音頻資料的片段層、鏡頭層的角度揭示更為深入的信息內容。
關于視音頻元處理的研究在國內外都引起了普遍重視。我國廣播電視部2003年出臺了《廣播電視音像資料編目規范》,北京大學信息管理系國家社科基金項目“視音頻信息元數據與檢索創新研究”課題組2004年研制成《視音頻信息元數據規范》。國外關于這方面的研究則更加深入,并形成了一系列的規范與標準,如美國國防虛擬圖書館項目形成的基于MARC的《數字動態圖像元數據指南》,美國、加拿大、英國、荷蘭、意大利、巴西、泰國等國數十個機構的100多位專家學者組成的“視頻開發計劃”視頻存取工作組研制的基于 DC的《VIDE用戶指南:面向數字視頻的DUBLIN核心應用文檔》,源自美國國會圖書館電影保存計劃的同時支持MPEG-7和DC的《MIC核心數據元素表》,美國北卡萊羅納大學信息和圖書館學院的“開放式數字視頻圖書館”項目形成的《視頻元數據和文本數據并重的開放式數字視頻圖書館元數據方案》[6]。《國外視音頻元數據研究文獻綜述》介紹了國外大量的視音頻元數據研究的機構、成果和研究文獻,這里就不一一贅敘了[2]。
視音頻數據庫檢索的最大難點在于聲音和圖像的檢索,尤其是連續圖像的檢索,這也是它與文本文件檢索的最大區別。目前直接以聲音和圖像的特征對聲像資料進行檢索,少數的還可以(如能識別少數聲音和圖像的門禁系統),海量的聲像信息檢索,技術上難度則相當大。要對海量的聲音圖像信息進行檢索,目前還只能把聲音圖像信息轉化成文字信息,再從文字的角度檢索聲音和圖像。
首先是對視音頻資料進行分類和主題標引,這就要借助適合于聲像資料管理方面的分類法和主題詞表。在原有分類法和主題法的基礎上,針對音像資料的特點,增加一些類目、主題詞、使用說明、附表等,是可以對音像資料進行分類和主題標引的,盡管仍不能充分表達音像資料的豐富內容,但能滿足大部分檢索要求。付昕、耿敏在《數字圖書館中的視頻信息檢索》一文中對這方面進行了很好的說明[7]。
音視頻數據庫檢索最難也是最迫切需要解決的是內容的檢索,相當于文本數據庫的全文檢索,即根據檢索標識,找到具有這種標識特征的音視頻資料的片段。它不同于傳統數據庫的檢索,是一種近似匹配技術。
基于內容的描述是基于內容檢索的前提。基于內容的描述方案包括自動視覺特征抽取和人工語義的特征標注。MPEG專家組制定的基于內容的多媒體描述方案MPEG-7著眼用代碼的形式表示和標識視聽內容,試圖提供一組強大的標準化工具來描述多媒體數據內容,即所謂的“多媒體數據內容描述接口”[7]。
目前國內視頻數據庫能做到內容檢索的只有武漢緣來文化傳播有限責任公司。他們采取的方法是將視頻資料的腳本中的每一段標上對應的時間段,在腳本中檢索到所需要的標識特征后,顯示出該段解說詞,進而顯示出該時間段的影視內容。這種方法比較好地解決了音視頻數據庫的內容檢索問題,同時對生產商和用戶而言都比較容易操作。
視頻圖書館的軟件技術主要包括音像數字信息處理技術,如文本、數值、圖像、聲音信息的編碼、解碼、壓縮、模擬信號與數字信號的相互轉換,還有適用于全文本、圖像以及聲音等非結構化數據庫管理系統,此外更為圖書館關心的就是視頻節目的點播技術。
目前我國圖書館提供的多媒體信息服務方式主要有兩種:一種是開辟視聽閱覽室,讀者將館藏音像資料(如錄音帶、錄像帶、光盤等)借出,借助視聽室配置的錄像機、錄音機、電腦等播放設備閱讀。一種是將各種媒體的資料信息以數字化形式整合存儲在視頻服務器中,利用視頻點播系統(VOD),通過網絡提供給讀者隨時點播。據朱咫渝、孫曉的抽樣調查,目前我國高校圖書館使用第一種方式的約占65.83%,使用VOD點播的主要是實力較強的一些重點高校圖書館[8]。
流媒體技術的關鍵在于網絡數據傳輸和客戶端播放并行。該技術的實現有幾個必備條件:一是寬帶網,這是因為音像信息比文字信息占的空間大得多,帶寬不夠會造成網絡涌堵。二是對服務器的性能和存儲空間要求較高,這類服務器是為流媒體應用量身定做的,它的價格一般比較昂貴。三是系統平臺的穩定性和支持的并發用戶數,并發用戶的數量要根據圖書館讀者的多少和使用的頻率而定。
流媒體技術是 Real NetWorks公司首先推出的。目前技術上比較成熟的應用比較廣泛的視頻點播系統有Real NetWorks公司推出的Real System Windous、微軟開發的Media Service和蘋果計算機公司推出的 Quik Time[9]。
視頻圖書館的計算機硬件要求一般高于普通數字圖書館,主要表現在三個方面:
服務器:視頻圖書館的服務器是視頻圖書館的核心硬件,其主要作用是視頻資料的存儲和發布,目前主要采用流媒體專用服務器或通用服務器兩種。專業流媒體視頻服務器是為流媒體應用量身定做的,其存儲結構和網絡結構的設計主要是針對流媒體的特點,針對不同的網絡環境的不同的用戶需求,提供不同的服務模塊。他們大都帶有大容量的磁盤陣列,支持多路CPU,擴展性能強,并帶有流媒體操作系統和應用軟件,價格比較昂貴。通用服務器通常由普通微機擔當,配備較大的存儲空間,其價格相對便宜,維護簡單,但處理能力有限,支持的并發用戶數少。
存儲器:由于視頻信息所占有的空間遠遠大于文本信息,因此視頻圖書館一般采用大容量并可擴展的磁盤陣列柜。
外圍設備:由于音視頻資料呈猛增勢頭,目前大多數計算機增設了多媒體插件和光盤,MMX技術逐步完善,出現了多媒體計算機,包括色彩豐富的視頻顯示器,處理聲音圖像的數據信號裝置、圖形緩沖區、點式設備(如鼠標器等)以及其他外圍設備。此外采集制作聲像節目的數碼相機、攝像機、編輯機等也要根據需要配備。
音像資料的數字化就是利用計算機技術把傳統的音視頻資料(如錄音帶、錄像帶)模擬信號轉換成數字信號,以方便利用和長期保存。音頻資料的數字化整理一般采用計算機的聲卡、光驅和相應的軟件來處理,視頻資料的數字化,可以視頻資料播放設備(攝像機、錄像機、影碟機等)、帶視頻捕捉卡(視頻編輯卡)或IEEE1394(俗稱“火線”)的計算機、視頻線和相應的視頻處理軟件組成一套視頻資料數字化設備。符國偉同志在《基于多媒體技術的圖書館音像資料數字化建設》中比較詳細地介紹了音頻資料和視頻資料數字化的實際操作技術,這里就不再贅述了[10]。
迄今為止,版權問題一直是我國電子文獻資源供應商面臨的最為頭疼的問題,國內電子文獻供應商中徹底解決版權問題的還只是極少數,其原因除了長期以來國家和民眾缺乏版權意識外,主要是版權交易不方便,尤其是與讀者簽約十分困難,大部分供應商都是采取與出版商簽約的方式解決版權問題,而作品的最終版權所有者是作者。
視頻圖書館的版權問題相對來講要好解決一些,因為音視頻資料的版權所有者大多是單位而不是個人,簽約相對容易一些。正因為如此,國內近年發生的電子文獻版權糾紛和訴訟很少涉及到音視頻資源供應商。但這不等于說音視頻資源供應商就沒有侵權問題,更不意味著我們可以忽視這方面的問題。
問題的主要方面依然是與個人作者的簽約。誠然,音視頻作品的版權所有者大多數是單位而非個人,但也有相當數量的作品的版權所有者是個人,如中央電視臺《百家講壇》里的節目,其主要版權所有人是主講人而非電視臺,因此供應商在與電視臺簽約的時候,應該請電視臺出示電視臺與作者簽訂的作者允許電視臺發行其作品的協議。其次,總版權屬于單位的音視頻作品中也有部分版權是屬于個人的,如電影中的演員肖像是不能隨意用來作商業宣傳的。
目前我國圖書館音視頻資源供應商中,版權問題解決得比較好的是武漢緣來文化公司,他們采取的主要方式是與澳大利亞、德國、美國等影視資源生產商直接簽約,而這些西方國家在版權方面的要求是比較嚴格規范的。
文獻資源共享是幾代圖書館人的夙愿,和所有的圖書館共享工程一樣,視頻圖書館的共建共享具有十分重要的意義。視頻圖書館的共建共享主要采取兩種方式:
一種是在全國、一個地區或一個系統建一個視頻圖書館,供全國、一個地區或一個系統內所有人享用。由于只需一套設備、一班人馬,避免了大量的重復建設,從經濟效益和使用效益上來講,這種方式是最好的,但這需要政府的決心,尤其是資金上的投入和強有力的協調。根據目前國內文獻資源的一些共建共享工程(如文化部的“全國文化共享工程”、科技部的“科技文獻共享平臺”、教育部的CALIS項目)的進展情況來看,這種可能性還是很大的。第二種方式是圖書館之間簽訂視頻資源的共享協議。這種方式看起來似乎簡單一些,實際上操作更為困難,因為它牽涉到各方眾多圖書館的利益,在視頻資源的團購、資金和人員的攤派、組織機構的設置以及其他諸多方面需要做大量的協調工作。
不過歷史潮流不可阻擋,視頻資源的共建和共享和其他文獻資源的共建共享一樣,是歷史發展的必然趨勢,在計算機技術、網絡通訊技術高度發達和文獻資源共享意識成為圖書館界共識的今天,視頻圖書館的共建和共享在不遠的將來必定會成為現實。
1 T he National Library of Austrulia-.[2004-11-20].http://www.musicaustrulia.org/index.html
2 張久珍等.國外視音頻元數據研究文獻綜述.大學圖書館學報,2005(1):22
3 馬曉明.關于高校音像資料的管理與發展趨勢探討.黑龍江科技信息,2008(4):19
4 同2:25
5 同2:25
6 姚星星等.國外視音頻數據研究綜述.數字圖書館論壇,2007(8):57
7 付昕,耿敏.數字圖書館中的視頻信息檢索.大學圖書館學報,2002(2):31
8 朱咫渝,孫曉.我國高校圖書館多媒體信息服務調查研究.四川圖書館學報,2007(5):53
9 張莉.圖書館音視頻資料的網絡應用技術.圖書館學刊,2005(2):14
10 符國偉.基于多媒體技術的圖書館音像資料數字化建設.山東圖書館季刊,2006(1):27