摘 要:視音頻資料是數(shù)字圖書館館藏文獻(xiàn)的重要組成部分,由于視音頻資料數(shù)據(jù)量大、關(guān)系復(fù)雜,如何科學(xué)、有效地進(jìn)行視音頻編目是高校數(shù)字圖書館正在探討研究的重要問題。本文通過對高校數(shù)字圖書館視音頻編目技術(shù)的分析,并對計(jì)算機(jī)視音頻編目技術(shù)進(jìn)行研究,結(jié)合高校視音頻編目技術(shù)的應(yīng)用現(xiàn)狀,并提出了行之有效的視音頻編目方案,以期為高校數(shù)字圖書館的視音頻編目提供參考。
關(guān)鍵詞:數(shù)字圖書館;視音頻編目技術(shù);高校
數(shù)字圖書館是一個(gè)國家信息基礎(chǔ)設(shè)施的核心,主要提供信息庫和資源庫。數(shù)字圖書館是運(yùn)行在互聯(lián)網(wǎng)上超大規(guī)模的、便于使用的、沒有時(shí)空限制的知識(shí)中心。中國對數(shù)字圖書館工程的規(guī)劃目標(biāo)也是如此,現(xiàn)代高新技術(shù)所支持的數(shù)字信息資源系統(tǒng)將成為下一代互聯(lián)網(wǎng)網(wǎng)上信息資源的管理模式,可從根本上改變目前網(wǎng)上信息分散、不便使用的現(xiàn)狀。數(shù)字圖書館的規(guī)劃要點(diǎn)主要有數(shù)字化資源(多媒體)、網(wǎng)絡(luò)化分布化的體系結(jié)構(gòu)、統(tǒng)一的透明的用戶接口、全球化(非單一實(shí)體)、元數(shù)據(jù)與對象管理和新的服務(wù)體系與模式等。許多中國知名的高校都建立了自己的數(shù)字圖書館,并且擁有自建視音頻數(shù)據(jù)庫,甚至還有部分高校已經(jīng)引進(jìn)媒體資產(chǎn)管理系統(tǒng),實(shí)現(xiàn)了學(xué)校原有的珍貴資料數(shù)字化存儲(chǔ)和教學(xué)應(yīng)用。
1 視音頻編目要求
采用元數(shù)據(jù)編目是數(shù)字圖書館對信息資源進(jìn)行有序化組織的主要手段。目前主要的元數(shù)據(jù)標(biāo)準(zhǔn)有描述網(wǎng)絡(luò)資源的DC、描述視覺資料的VRA、多媒體內(nèi)容描述接口MPEG-7、機(jī)讀編目格式標(biāo)準(zhǔn)MARC、國內(nèi)行業(yè)標(biāo)準(zhǔn)《廣播電視音像資料編目規(guī)范》、《CELTS-42基礎(chǔ)教育教學(xué)資源元數(shù)據(jù)規(guī)范》與《全國文化信息資源共享工程視頻資源編目規(guī)范》等。
《廣播電視音像資料編目規(guī)范》規(guī)定編目元數(shù)據(jù)體系總體上分為四個(gè)層次,即節(jié)目層、片段層、場景層、鏡頭層,每個(gè)層次包含相應(yīng)的著錄項(xiàng)目,其中節(jié)目層有15大類100個(gè)著錄項(xiàng)目,片斷層有14大類52個(gè)著錄項(xiàng)目。由于教學(xué)資源在高校數(shù)字圖書館的媒體資產(chǎn)中占有很大比例,圖書館設(shè)定編目核心元數(shù)據(jù)時(shí),在基于《廣播電視音像資料編目規(guī)范》的基礎(chǔ)上,可以結(jié)合參考《全國文化信息資源共享工程視頻資源編目規(guī)范》和教育部發(fā)布的《基礎(chǔ)教育教學(xué)資源元數(shù)據(jù)規(guī)范》。高校數(shù)字圖書館可以根據(jù)實(shí)際需求選擇合適的編目元數(shù)據(jù)及著錄項(xiàng)目,例如可以設(shè)定節(jié)目層編目著錄項(xiàng)目為39個(gè),其中10個(gè)標(biāo)有*的為必須著錄項(xiàng)目,具體如下:
(1)題名項(xiàng):*正題名、并列正題名、副題名、系列(系列題名、分集總數(shù)、分集次)
(2)主題項(xiàng):*廣電分類、*學(xué)科分類、*關(guān)鍵詞、主題詞
(3)描述項(xiàng):*內(nèi)容描述、主題人物、獲獎(jiǎng)描述、欄目描述、適用對象
(4)責(zé)任者項(xiàng):*責(zé)任者名稱、責(zé)任方式、其他信息
(5)出版者項(xiàng):出版者描述、出品者描述
(6)版權(quán)項(xiàng):版權(quán)所有者名稱
(7)語種項(xiàng):*聲道語種、字幕語種
(8)日期項(xiàng):制作完成日期、出版日期
(9)類型項(xiàng):*節(jié)目類型、節(jié)目形態(tài)
(10)格式項(xiàng):*實(shí)長、色彩、聲道格式、壓縮率、文件格式、制式
(11)標(biāo)識(shí)符項(xiàng):國際標(biāo)準(zhǔn)音像制品編碼、庫房編號
(12)覆蓋范圍項(xiàng):時(shí)間段描述、空間范圍
(13)來源項(xiàng):*資料獲取方式、資料提供者
2 高校圖書館視音頻編目技術(shù)
圖1編目流程
高校數(shù)字圖書館編目系統(tǒng)必須具有一定的靈活性和開放性,可以設(shè)計(jì)為最多4層的分層編目方式,以適應(yīng)今后業(yè)務(wù)需求的發(fā)展與變動(dòng),同時(shí)選擇XML(Extensible Markup Language)文檔作為存儲(chǔ)和交換元數(shù)據(jù)的文件格式,實(shí)現(xiàn)不同系統(tǒng)間的數(shù)據(jù)交換及資源共享。在對視音頻資料進(jìn)行流程化、層次化編目時(shí),必須從節(jié)目層開始著錄,其他三層可以根據(jù)需求靈活選擇。以浙江傳媒學(xué)院自主研發(fā)的媒體資產(chǎn)管理系統(tǒng)為例,編目系統(tǒng)首先接收視音頻數(shù)據(jù)和初始編目數(shù)據(jù)(如視音頻資料的實(shí)長、聲道格式、壓縮率等),編目人員分析接收到的相關(guān)數(shù)據(jù)并進(jìn)行級別審定,決定其編目標(biāo)引深度;其次調(diào)用相關(guān)的編目模板并進(jìn)入精編目環(huán)節(jié),參考《廣播電視資料分類法》(GY/Z 199-2004),對各個(gè)著錄項(xiàng)進(jìn)行規(guī)范著錄并對己經(jīng)完成的內(nèi)容簽章確認(rèn);最后由審編人員嚴(yán)格審核已提交的編目數(shù)據(jù),不合格的編目數(shù)據(jù)打回相應(yīng)環(huán)節(jié)修改,合格的最終編目數(shù)據(jù)寫入數(shù)據(jù)庫供用戶檢索使用。編目系統(tǒng)的編目流程如圖1:
高校數(shù)字圖書館在進(jìn)行編目時(shí)應(yīng)該充分考慮視音頻資料的節(jié)目類型、內(nèi)容價(jià)值和實(shí)際使用情況來確定編目深度,例如:教學(xué)片、影視劇、動(dòng)畫片、紀(jì)錄片、綜藝節(jié)目以及高校組織的各類比賽(如歌詠比賽、體育賽事等)能直接用于播出或使用,編目層次一般設(shè)定為一層(節(jié)目層),節(jié)目層著錄標(biāo)引要揭示節(jié)目的主題內(nèi)容、背景信息、形式特征,同時(shí)提煉具有利用與檢索價(jià)值的信息。對于某些高校圖書館,特別是藝術(shù)類高校圖書館,可以根據(jù)利用價(jià)值、經(jīng)典片段和節(jié)目表演為主體對整場劇本、綜藝節(jié)目等視音頻資料進(jìn)行切分,編目層次可以設(shè)定為二層,即節(jié)目層、片段層;高校擁有許多具有重要典藏價(jià)值的資料,例如記錄本校發(fā)展歷史或重大事件的視音頻資料,在編目時(shí)可以根據(jù)節(jié)目內(nèi)容深入到場景層或鏡頭層。
由于視音頻資料不同層次的內(nèi)容在編目中需要的專業(yè)技能差別很大,高校圖書館可以根據(jù)自己的業(yè)務(wù)能力配備不同職能的編目人員,例如畫面分析員、普通編目員、高級編目員、編目審編員。畫面分析員主要負(fù)責(zé)將待編目資料的重點(diǎn)片段層、場景層、鏡頭層標(biāo)識(shí)出來,以便確定編目深度及提供相應(yīng)編目環(huán)節(jié)使用;普通編目員主要完成一些較為簡單的元數(shù)據(jù)項(xiàng)的數(shù)據(jù)錄入,例如題名、責(zé)任者、日期等元數(shù)據(jù)項(xiàng);高級編目員主要完成已建編目條目的信息完善著錄工作,工作重點(diǎn)是內(nèi)容介紹、主題詞、關(guān)鍵詞、分類等需要一定專業(yè)知識(shí)和分析歸納能力的著錄項(xiàng)目;編目審編員及時(shí)對已完成編目數(shù)據(jù)進(jìn)行審核。通過采用流水線方式對視音頻資料進(jìn)行流程化、層次化編目,有利于實(shí)現(xiàn)數(shù)據(jù)質(zhì)量的控制和管理。
3 計(jì)算機(jī)輔助視頻編目技術(shù)
基于內(nèi)容的視頻編目技術(shù)就是有效地組織和管理視頻數(shù)據(jù),視頻編目技術(shù)的基礎(chǔ)是視頻結(jié)構(gòu)化處理。視頻結(jié)構(gòu)化是對視頻流中的連續(xù)幀序列進(jìn)行切分,原始視頻流從上往下可分為視頻、故事單元、場景、鏡頭和圖像幀,其中能夠描述鏡頭序列主要內(nèi)容的圖像幀就是關(guān)鍵幀。對于高校數(shù)字圖書館編目系統(tǒng)而言,由于大量的工作在于人工錄入,編目效率和質(zhì)量難以保證,因此引入計(jì)算機(jī)自動(dòng)輔助編目技術(shù)是一個(gè)很好的解決方案。計(jì)算機(jī)輔助視頻編目技術(shù)主要有鏡頭邊界檢測和關(guān)鍵幀提取。
3.1 鏡頭邊界檢測
鏡頭邊界的變換方式有突變(Abrupt Change)和漸變(Gradual Change)兩種形式。鏡頭的突變就是攝像機(jī)的停機(jī)或者鏡頭的切換;漸變是通過一些編輯手段使兩個(gè)鏡頭的銜接過渡得更為平緩,比如淡入、淡出、溶解、掃換等。目前主要的鏡頭邊界檢測方法有:模板匹配法、直方圖比較法、似然比較法、基于邊緣的方法、基于DCT系數(shù)和DC系數(shù)的方法等。
浙江傳媒學(xué)院MAM研發(fā)組提出了一種基于混合投影函數(shù)的快速鏡頭切換檢測方法。通過對幀間距離度量和鏡頭邊界處幀間差變化特征等方面的深入研究,并對積分投影函數(shù)和方差投影函數(shù)進(jìn)行適當(dāng)?shù)奶幚?,研發(fā)組提出了一種改進(jìn)的混合投影函數(shù),利用該混合投影函數(shù)在兩個(gè)正交方向上計(jì)算視頻幀的差分和積分投影來定義特征向量V,取視頻幀間差FFD(Frame-to-Frame Difference)的向量長度為幀間距離,從而利用幀間距離與自適應(yīng)閾值T(i)的比較來檢測鏡頭切換,實(shí)驗(yàn)結(jié)果證明了該方法的有效性。
3.2 關(guān)鍵幀提取
關(guān)鍵幀的有效性取決于如何從視頻序列中選取它們,關(guān)鍵幀提取方法主要有5種:(1)基于鏡頭的方法,即選取鏡頭的首幀、中間幀或末幀作為關(guān)鍵幀,該方法適用于內(nèi)容活動(dòng)性小的鏡頭。(2)基于相鄰幀間距離的方法,若相鄰幀的距離大于某個(gè)預(yù)先設(shè)置的閾值,則認(rèn)為產(chǎn)生新的關(guān)鍵幀,該方法計(jì)算量較小。(3)基于內(nèi)容分析的方法,即通過分析視頻內(nèi)容(顏色直方圖、運(yùn)動(dòng)信息)隨時(shí)間的變化情況來選擇所需關(guān)鍵幀的數(shù)目。該方法所提取關(guān)鍵幀之間的顏色差別較大,但是無法量化地表示運(yùn)動(dòng)信息的變化。(4)基于聚類的方法,該方法從一個(gè)初始化的聚類出發(fā),將樣本集中的每個(gè)元素分配給某個(gè)聚類,然后將各類中離聚類中心最近的幀作為關(guān)鍵幀。該方法效果較好,但是計(jì)算量較大。(5)基于運(yùn)動(dòng)分析的方法,該方法借助光流分析技術(shù)計(jì)算每幀光流,取局部最小值所對應(yīng)的幀為關(guān)鍵幀。該方法較好地反映了獲取鏡頭的主要內(nèi)容,但是計(jì)算量較大并且局部最小值也不一定準(zhǔn)確。
視音頻資料是數(shù)字圖書館館藏文獻(xiàn)的重要組成部分,由于視音頻資料數(shù)據(jù)量大、關(guān)系復(fù)雜,如何科學(xué)、有效地進(jìn)行視音頻編目是高校數(shù)字圖書館正在探討研究的重要問題。高校數(shù)字圖書館可以綜合參考《廣播電視音像資料編目規(guī)范》、《CELTS-42基礎(chǔ)教育教學(xué)資源元數(shù)據(jù)規(guī)范》等標(biāo)準(zhǔn)選擇合適的元數(shù)據(jù)元素并且制定相應(yīng)的著錄規(guī)則,采用流程化、層次化編目技術(shù)進(jìn)行四個(gè)層次的流程化編目(以節(jié)目層、片段層為主),同時(shí)引入計(jì)算機(jī)輔助視頻編目技術(shù)實(shí)現(xiàn)鏡頭分割、關(guān)鍵幀提取,從而提高視音頻資料編目、檢索和利用效率。
參考文獻(xiàn)
[1]朱渝,孫曉.高校圖書館視頻點(diǎn)播服務(wù)實(shí)證研究[J].圖書館工作與研究,2009(3):39-41
[2]嚴(yán)明,蘇新寧.數(shù)字視頻信息的元數(shù)據(jù)研究[J].情報(bào)學(xué)報(bào),2009(5):605-609
[3]GY/T202.1-2004,廣播電視音像資料編目規(guī)范[S].北京:國家廣播電影電視總局,2009.
[4]孫利濤,楊雷.視頻鏡頭分割技術(shù)綜述[J].山東輕工業(yè)學(xué)院學(xué)報(bào)(自然科學(xué)版)[J].2007(1):36-39
作者簡介
菅紅(1963-),女,漢,內(nèi)蒙陜壩人,本科,館員,主要從事采編工作。