尹哲 崔偉 黃文靜 閆晶亮
摘要:隨著音視頻檔案數字資源數量的快速增長,如何科學地開展質量評價,提升數據治理效能是檔案部門面臨的挑戰之一。論文從構建目標、構建原則、構建方法、構建過程四個方面提出如何構建音視頻檔案數字資源質量評價標準,并以視頻檔案數字資源為例給出構建質量評價標準的過程,最后提出評價標準的系統性應用思路,以期為提升檔案部門數據治理能力提供幫助。
關鍵詞:音視頻檔案 數字資源 質量評價標準 層次分析法
當前,音視頻檔案數字資源數量快速增長,為提升其數據質量和治理效能,國內檔案部門進行了積極的探索實踐,并且取得了一定的成效。但其仍然面臨不少挑戰,主要體現在:一是數據質量整體不高;二是對問題數據的治理效能不明顯。建立良好的數據質量評價標準是辨別個體數據質量優劣的基礎,可以為持續改進整體數據質量提供依據,并最終為指導檔案部門提升數據治理能力、構建數據治理體系指明方向。因此,本文以音視頻檔案數字資源質量評價為研究對象,擬建立一套可量化、操作性強的質量評價標準。
(一)質量評價標準構建目標
1.突出評價的目的性。構建音視頻檔案數字資源質量評價標準的目的是全面掌握數據的質量狀況,進而發現問題并解決問題。因此,評價指標的設置必須有的放矢,能夠將評價項目與存在的質量問題聯系起來。
2.體現出評價對象的特點。音視頻檔案數字資源相較于其他類型的檔案數字資源,具有技術特性強、整編要求高、利用體驗強等特點。為此,在質量評價指標的構建中,應盡可能體現其特點,以凸顯評價標準的針對性、適用性。
3.充分借鑒信息質量評價相關成果。音視頻檔案數字資源質量評價屬于信息質量評價的范疇。在信息質量評價方面,目前國內外不同領域已進行了廣泛的研究、實踐,形成了科學的理論、方法。例如,有學者提出,可以參考ISO 8000、GB/T 36344—2018,根據檔案數據質量的概念內涵,從形式、內容和效用等三個維度梳理出檔案數據評價指標。[1]為此,在此次質量評價標準的構建中,應盡可能借鑒其他信息評價標準構建的經驗、做法,以提升評價標準構建的科學性和效率。
(二)質量評價標準構建原則
評價指標是整個評價的基礎,評價指標的設計正確與否對最終的評價結果有重要的影響,因此評價標準設計一般應遵循系統全面性、簡單科學性原則。[2]除此之外,還應遵循以下幾個原則。
1.指標應具有代表性。評價指標應具備明確的目的性而非多多益善,關鍵是指標在評價過程中所起作用的大小。評價指標需要涵蓋為達到評價目的所需的基本內容,反映出數據的總體質量情況。指標的精煉可以減少評價的時間和成本,使評價活動易于開展。
2.指標應具有可比性。指標的設定必須結合當前音視頻檔案數字資源質量的普遍水平,指標要求不宜過高,同時通過比較必須能夠體現數據質量的水平差異和區分度。
3.指標應具有可操作性。也就是說,評價者要能夠方便使用各項指標對數據質量進行客觀的衡量,快速統計、計算出相應的分數。
(三)質量評價標準構建方法
目前信息質量評價方法主要有因子分析方法、模糊綜合評價法、層次分析法、主成分分析法等。本文借鑒的層次分析法(Analytic Hierarchy Pro? cess,AHP),是對一些相對復雜、模糊的問題做出決策的簡易方法,通過將復雜決策問題的目標層層分解,利用較少的定量信息實現決策過程的數學化,尤其適合對決策結果難以直接準確計量的情形。在科學管理領域中,人們常常面對由眾多因素構成的復雜系統,這些因素之間相互關聯、制約,并且往往缺乏定量數據。在對這種問題進行處理時,層次分析法是一種簡潔而實用的建模方法。層次分析法自提出以來,已被廣泛應用于軍事、工程、教育等各個領域。[3]
(四)質量評價標準構建過程
目前國內尚沒有針對音視頻檔案數字資源質量進行評價的成型的評價標準。筆者參考了國內外對于數據質量評價的研究成果,根據音視頻檔案數字資源的特點,聚焦普遍問題,遵循評價構建原則,經過初步篩選和反復斟酌之后,建立音視頻檔案數字資源質量評價標準的二級指標結構。這個評價標準的一級指標有4個,分別是:技術要素、信息要素、實體要素和感官要素。技術要素是指通過攝錄設備采集并保存音視頻檔案數據使用的各類技術參數;信息要素是指對音視頻檔案數據進行歸檔和管理過程中通過人工著錄或技術采集方式獲得的文件目錄及元數據信息;實體要素是指對音視頻檔案數據進行收集歸檔和長期保存過程中影響數據質量的文件命名、文件格式、可用性、安全性等因素;感官要素是在音視頻檔案利用過程中影響利用者對圖像及聲音感官效果評價的相關因素。
由于音頻和視頻檔案各要素評價二級指標設置方式較為類似,而且視頻檔案基本涵蓋了音頻檔案各相關要素,受篇幅所限,本文僅以視頻檔案為例給出質量評價標準的二級層次結構,并以視頻檔案數字資源為例給出構建質量評價標準的過程。
視頻檔案數字資源質量評價層次結構如表1所示。

(一)開展問卷調查
針對所構建的指標層次結構,筆者按照9分制打分法向國家檔案局、高校、檔案館的專家發放問卷調查表,開展全面細致的調研,并征求專家對評價標準的修改意見,所有專家獨立且客觀、科學地對各個指標進行打分。
(二)建立判斷矩陣
根據專家打分值構建AHP層次分析判斷矩陣,具體如表2所示。
(三)計算指標權重
通過層次分析法得到一級指標權重結果,如表3所示。


(四)開展一致性檢驗
利用層次分析法進行權重計算時,需要進行一致性檢驗分析,用于研究評價權重計算結果的一致性檢驗結果,即計算一致性指標CR值(CR= CI/RI)。第一,先描述上述計算得到的CI值[CI=(最大特征根-n)/(n-1)];第二,結合判斷矩陣階數得到RI值;第三,計算CR值,并且進行一致性判斷。
本次針對4階判斷矩陣計算得到CI值為0.000,通過隨機一致性RI表格可以查詢得到RI值為0.89。因此計算得到CR值為0.00<0.1,意味著本次研究判斷矩陣滿足一致性檢驗,計算所得權重具有一致性。如果CR值大于0.1,則說明不具有一致性,應該對判斷矩陣進行適當調整之后再次進行分析。
(五)進一步對視頻檔案的二級指標進行權重分析
同樣通過專家打分法構建二級指標的判斷矩陣,并根據層次分析法進行權重分析。需要注意的是,由于二級指標相對一級指標的項目更多,因此在開展權重分析時更加需要關注一致性檢驗的結果。
通過層次分析法得出二級指標權重值后,可以將一級指標和二級指標的權重值相乘即得出加權計算結果,最終得出每個二級指標在所有二級指標中的權重比。
(六)建立和驗證視頻檔案數字資源質量評價細則
在運用質量評價標準開展視頻檔案數字資源質量評價實際操作時,需要明確每一項二級指標獲得對應分值的具體要求,并按照對應的評分權重給出對應的百分制分值,最后制定評價規則以明確數字資源可否得到相應分數。例如,視頻檔案質量評價二級指標“視頻幀率是否符合要求”的具體評價細則為“視頻幀率是否大于24”,按照此二級指標的權重比對應百分制分值為“4”,制定評價規則為:如被檢測的視頻檔案“幀率”滿足要求可得到相應分數,不滿足則不得分。
在按照評價細則對視頻檔案評分后,可以將視頻檔案質量劃分為“優”“良”“中”“差”4個等級。其中“優”等級得分為90~100分,“良”等級得分為75~ 89分,“中”等級得分為60~74分,“差”等級得分為0~59分。
筆者所在單位開發了音視頻檔案數字資源采集與檢查工具軟件,并根據評分標準嘗試對部分館藏音視頻數據質量進行評價。采用軟件檢測方式對音視頻檔案數字資源的技術要素、信息要素、實體要素進行評價,結合人工檢測方式對感官要素進行評價,最終得到不同維度的質量得分、質量總分和質量等級,并根據評價發現的問題對數據質量進行了優化提升,效果較為顯著。
音視頻檔案數字資源質量評價標準最大的價值就是在數據管理工作中建立質量管控的依據、手段,并可以影響數據質量的源頭治理和運行機制。
一是借助標準可以對音視頻檔案數據進行質量檢測,給出直觀的質量得分和質量等級,全面掌握被評價音視頻數據的質量現狀。這是評價標準最直接的應用場景,重點用于質量的量化評價。例如在接收音視頻檔案時,可以應用評價標準對該批次檔案進行批量質量檢測,整體量化分析出該批次檔案質量,出具分析報告,查找存在問題,從而為后續的決策和處理提供參考。
二是借助標準可以對數據發現的各類質量問題提出一般性處理對策建議,為提高質量給出參考依據。按照評價標準給出的處理建議,對數據質量進行完善,不斷提升音視頻檔案的質量。
三是可以將質量評價標準作為質量指南從源頭控制音視頻檔案數據質量。通過評價音視頻編碼格式、采樣率、目錄及元數據整編、實體格式、音畫體驗等諸多質量要素是否符合指標要求,從而倒逼音視頻檔案采集、整理、編目等環節更加規范,形成更為有效的源頭治理。
四是通過應用質量評價標準,可以建立和規范音視頻檔案數據定期檢測和管理機制。一般檔案館都有對檔案數字資源進行定期檢測的要求,以便了解現狀、發現問題、及時處理。通過應用評價標準可以進一步促進檢測內容、檢測方式、檢測頻率、檢測結果呈現、處理措施等的規范化甚至自動化、智能化。
本文基于對音視頻檔案數字資源質量的科學分析,運用層次分析法,在系統性、實用性、簡潔性的基礎上,結合問卷調查的研究方法,構建了音視頻檔案數字資源質量評價標準。應用該標準,可以對音視頻檔案數字資源質量進行科學、客觀的評估。更重要的是,通過該評價標準可以發現音視頻檔案管理的薄弱環節,為各級檔案部門有針對性地提升音視頻檔案數字資源質量提供科學依據,進而為提升檔案部門數據治理能力提供幫助。
*本文系2022年國家檔案局科技項目“人工智能技術在音視頻檔案數據治理工作中的應用研究”(項目編號:2022-X-066)研究成果之一。
注釋及參考文獻:
[1]張夏子鈺,周林興.大數據時代檔案數據質量:評估與優化[J].北京檔案,2023(5):15-18.
[2]魯德武.檔案技術裝備使用質量評價指標體系的建立[J].辦公自動化雜志,2013(7):28-30.
[3]陶丹.基于AHP分析法的創新教育質量評價標準建構[J].創新創業理論研究與實踐,2022(19):10-16.
作者單位:1.北京市檔案館
2.東港瑞云數據技術有限公司