艾文蜀
(中國電子科技集團公司第三十八研究所,合肥 230088)
隨著互聯網的快速發展,信息逐漸被網絡化、數字化。目前,媒體資料越來越多,媒體資源90 %的數據是視頻、圖片等多媒體非結構化數據,并且這些數據呈現指數級增長,在這些非結構化數據(音視頻、圖片、文檔)中,以視頻為主的聲像資料比重越來越大,已經逐步成為最重要的數字化資產。這些資料一旦缺乏科學有效的管理,必然會影響媒體資料的有效利用,同時也不利于實現數字化、信息化的檔案建設目標。
隨著我國經濟形勢、政策改革的巨大變化,近幾年檔案數字化開發利用的形式和特點也發生了較大的變化。為適應新形勢和新環境下的檔案歸檔利用工作,必須更加認真思考、探索及分析,采納相應的政策,改善數字檔案歸檔存儲利用工作,不斷提升檔案編研利用等服務。
目前,很多科研單位對數字化資產沒有進行任何規范化、流程化的管理,對媒體資源的收集、管理及利用沒有統一管理的數字系統。數字化資產管理中存在的主要問題表現在以下幾個方面。
第一,海量的音視頻及其他數字化聲像資料的數量和容量龐大,靠人工及簡單目錄化方式實行高效管理幾乎不可能,自動化管理極為困難。
第二,聲像資料處于管理失控的無序狀態,產生的數據往往會因保存不當而丟失,控制權限不合適低密級人員越級利用,從而使檔案的保密性無法得到安全保障。
第三,日常業務工作中,需要不斷查詢歷史聲像資料,應用傳統的人工方式和資料柜管理,檢索過程非常緩慢煩瑣。即使在計算機上搜索,從大量文件中查找到所需要的資料,甚至只是某個視頻鏡頭,也是一件耗時耗力的工作。對于大多數文檔、照片、視頻,只能進行簡單的題目檢索,無法進行全文檢索,獲取信息和資料速度慢,工作效率低下。
第四,有大量歷史聲像資料急需數字化搶救,保存時間過長會導致部分數據丟失,急需開展數字化采集整理工作。
第五,數字化視頻節目和素材每年不斷增加,尤其是后續高清素材越來越多,也需要新系統來存儲和管理這些高清音視頻資源。
針對聲像檔案管理混亂無序、資源無法集中存檔的局面,首先應構建檔案信息集中管理系統平臺,實現媒體檔案(將所有需要系統管理的聲像資料統稱為資源)的綜合管理。保存的目的是保存數據信息的內容、物理形式和功能,對其進行分類、歸檔、管理,即使時間流逝,技術發生變化,依然能對存檔數據進行調取,實現可檢索、可調用。
明確聲像檔案管理范圍:需要能夠支持各類聲像資料、數字資源的管理,包括各類音視頻、圖片、文檔等文件資源,并且在聲像檔案基礎上建立多組管理對象,如各類會議、各種活動、領導視察來訪、外事接待等產生的所有照片、錄像、錄音、解說詞、發言。
規范聲像檔案編目:對收集歸檔的資源對象制定相對應的著錄編目規范,可以對所有數字資源進行描述。編目的基本元數據項應包含信息本身產生的一些源數據,再進行分層編目并細化。
統籌聲像檔案組織:不同資源模式下,為不同的歸檔檔案建立相關的檔案組織和規章制度,以實現對歸檔檔案的快速定位和檢索。
統一聲像檔案管理流程:為后續工作建立并組織合理的檔案采集編目利用流程,也一并為各種檔案信息建立有利于內外部的檔案資源管理、檢索下載等流程。對自身檔案實體和檔案信息的管理、服務等各項業務工作從起始到完成,需由不同部門、不同職位,經不同環節協調及順序工作來實現完整過程。
構建聲像檔案管理模式:依據現實中檔案資源保存的場景,對各類不相同的檔案對象和檔案信息管理人員、建立人員、利用人員創建不相同的多種場景。聲像檔案不能獨立成類,應和與其內容相關的紙質文檔建立有機聯系,不僅要建立管理制度,還要制定相應細則。為了使館藏的珍貴原始聲像檔案能夠永久保存,共享服務于大眾,同時能快速檢索到自己需要的影像資源,安全便捷地進行管理存儲,實現通過網絡查閱、預覽、播放,關鍵需要解決對音視頻、照片等多媒體載體產生的媒體檔案采集收集、整理編目、信息存儲、查詢檢索和信息發布等問題?,F有的媒體檔案管理系統已成為創建數字檔案館這一過程中不可或缺的重要組成部分。
先進的媒體檔案管理系統所具備的技術亮點,是以“高管控、高質量、高可用、高效率”為原則,為用戶提供媒體檔案資產搶救、管理、利用等一系列整體的解決方案。其優勢包括先進的技術、構架和設計理念,具有良好的互聯互通性,支持多格式、泛媒體,工作流程靈活、簡潔,可以滿足不同用戶的需求。需做到設備先進、系統科學、功能實用、接口開放、維護方便。為聲像檔案的歸檔、整理、編目、檢索、瀏覽等一系列工作保駕護航,且需要滿足聲像檔案格式轉換、編目審核、安全完整和下載輸出等各功能要求,確保聲像檔案數字化工作順利開展。中國電子科技集團公司第三十八研究所經過兩年的考察時間,在多方協調促進下成功上線了聲像檔案媒體資產管理系統(以下簡稱“檔案媒資系統”),解決了當前音像資料老化和存儲、管理的一些迫切問題,以下簡單介紹該系統。
1.人性化的軟件設計
用戶功能操作界面層次分明、新穎耐看,系統界面布局合理、簡單易用;所有上傳、下載任務實時監控,使得用戶對任務狀態一目了然;圖片和視頻上傳時,后臺自動提取相關信息,如拍攝日期、拍攝像素、文件格式、拍攝人等,實現部分數據自動化處理;視頻文件系統內嵌一套傳輸服務,做到隨時隨地上傳、下載文件,并且支持斷點續傳(圖1)。

圖1 聲像檔案媒體資產管理系統上傳界面
2.功能齊全、操作簡單
多種來源的資料采集方式,與獨立軟件配合使用,可實現文件、光盤、藍光等全介質的批量上傳;自動識別該視頻資料是否有低質量文件,如果沒有則后臺自動生成低碼率文件用于瀏覽,保證了音視頻文件入庫的同時存在兩份(高低質量各一份);支持元數據信息自定義,包括分類自定義、編目體系自定義、編目數據自定義;支持多業務系統數據(實體文件及元數據)交換,方便檔案移交;高效全文檢索引擎,提供全文模糊查詢、編目查詢、主題檢索等(圖2)。

圖2 聲像檔案媒體資產管理系統檢索界面
本系統對于集中管理的檔案資源提供全文檢索、分類檢索功能,簡單直觀、高效維護。在資源管理、歸檔遷移等方面,具有國內超前的智能化技術,系統在資源調用、共享、管控等方面有很大優勢。
3.流程方便明晰,泛媒體、多格式支持
在使用過程中,整個流程一目了然,沒有繁雜的操作,網絡結構成熟。系統本身包含自己的工作流監控,并可與交互平臺的流程管理無縫集成。其工作流程可以定義系統內部工作環節與走向,配置各環節的執行參數與執行人員等。下圖以照片歸檔為例(圖3)。

圖3 聲像檔案媒體資產管理系統照片歸檔流程
基于文件方式的存儲管理模式,對存檔文件的格式沒有任何限制;支持各類視頻文件、音頻文件、文本文件(Word、Excel、TXT等)及圖片文件(JPG、GIF等);支持多格式轉碼文件;支持視頻文件高清格式。
對傳統介質,如VO錄像帶、IMAX錄像帶、DV帶等進行采集,生成數字化檔案信息,同時生成相應的初始編目信息。上傳下載模塊支持Web網頁登錄,應具備至少5個端口同時高速運作的寬帶,不限制同時瀏覽的端口數量。具備批量采集轉碼和批量編目功能,同時還可以對采集的音像素材進行簡單裁切、合成的編輯工作,以達到歸檔的要求。將文件格式轉化成AVI、MPG4、JPG等多種通用格式,用于內外檔案信息的交換。
4.成熟、完備的存儲管理
使用安全、可靠、高效的多級存儲體系,智能化地進行在線、近線、離線資料的統一管理。在設計過程中充分考慮系統的安全性,本所在提供高性能的虛擬化服務器資源的同時,也為數據備份提供了雙控制器系統和冗余電源。數據存儲的可使用有效容量大于200T,每臺核心服務器在配置的時候系統盤和數據盤也全部采用冗余配置,采用文件存儲服務器與系統服務器兩個獨立的硬件系統,文件存儲服務器具有雙備份功能,最大化保證數據不易損壞和丟失,同時源數據設備與備份存儲設備Raid級別均采用Raid 6方式。
整個系統具有完善的應急方案,對在系統安裝及運行過程中出現的故障和問題,都能及時指出排解方法和手段。在線對網絡運行情況進行記錄和監測,對于不同用戶進行權限的嚴格區分和限制。
5.穩定、安全、可靠
嚴密的用戶安全訪問機制,保證內容訪問權限;系統內置強大的工作流導航和模塊應用,支持在流程中任意環節設置操作權限,文件流轉過程中,嚴格把控利用權限,防止誤操作。嚴格的QA機制保障產品的穩定和可靠,降低維護的代價。
在應用服務器上安裝SFTP服務器是因為媒體檔案管理系統中有“超大附件”電子文件上傳功能,而所上傳的視頻文件大多是超過10 G的文件,為了優化超大附件上傳功能,故需要借用SFTP服務端。
與傳統聲像檔案素材比較,數字化聲像檔案的優點就是可以無損重復利用,鑒于計算機網絡的開放性及可擴展性,聲像檔案能夠被比較容易地再利用,真正成為用戶可以周轉流通的媒體“檔案”,而不像傳統聲像素材被沉淀在庫房、藏館內。
遵循安全性的重要原則,在網絡系統構建方面,整個系統要保證軟件不受病毒感染、黑客攻擊,具有高度的安全和保密性,系統硬件選型也以安全、穩定為主。
6.全新概念,強大的資源轉換
采用先進的、成熟的資源轉換和管理技術,從系統集成角度、設備選型、搜索技術及先進的數據計算存貯技術平臺等入手,最大化地符合聲像資料行業規范和標準,滿足與OA系統、PDM系統等的相關接口協議。從而實現聲像檔案資源共享,服務社會。
為迎接信息時代科技發展的挑戰,加快媒體檔案管理系統的建設,以適應現代信息技術發展的基本流向,本系統在其整個生命周期內可保持一定的先進性。在信息數字化、管理網絡化背景下,通過對多媒體信息資源的統籌管控,為深入挖掘聲像檔案的知識價值和利用價值、拓展聲像檔案的利用渠道提供成熟的軟硬件環境。在提高自身業務水平的過程中,應充分借助計算機網絡技術去繼續探索聲像檔案的價值,從而實現知識共享,最大限度地發揮聲像檔案的文化潛質,不斷提升檔案在科研單位中的創新能力和發展需求。