王羿
(國家廣播電視總局監測數據處理中心,北京100866)
為規范電視劇內容管理,相關管理部門先后頒布了《電視劇審查管理規定》和《電視劇內容管理規定》等規章,并建立了電視劇許可制度。電視劇的拍攝、制作須執行備案公示,不能發行和播出沒有備案且未取得發行許可證的電視劇, 以更好地促進我國的電視劇產業健康、有序發展。為了精細化地管理備案電視劇樣片,強化電視劇重播重審能力,需要建設電視劇樣片庫系統。針對持續增加的備案電視劇樣片,建設具備長期存儲能力和數據安全防護能力的電視劇樣片庫系統,面臨以下幾個問題:(1)備案的電視劇樣片數據以DVD 光盤介質的形式報送,大量的DVD 光盤數據讀取工作費時耗力,工作效率低;(2)不斷累積的電視劇樣片數據,完整保存在集中存儲內,大量歸檔樣片的長期存儲將占用昂貴的硬盤資源;(3)備案電視劇樣片要求長期存檔,離線存檔后的樣片數據需人工轉存至集中存儲內,將降低電視劇調閱和重播重審的時效性。
為進一步加強電視劇內容管理的科學性、規范性,搭建電視劇發行許可樣片庫系統,實現對備案的電視劇發行許可樣片導入、收錄、存儲、統計、調閱等功能,其系統業務數據流程如下:
(1)收到需備案的電視劇發行許可樣片DVD 光盤后,將光盤按所對應的電視劇集數順序疊放并登記造冊;
(2)將光盤批量放入光盤庫的盤匣內,光盤庫將自動讀取盤匣內光盤數據,并自動對所讀取DVD 光盤內的電視劇信息和視頻文件進行校驗;盤面損壞或校驗失敗的光盤自動放置到退盤匣內;
(3)手動從退盤匣取出盤面損壞或校驗失敗的光盤,工作人員統計無法處理的電視劇集數并通知重新報送相關光盤;
(4)DVD 光盤數據導入完畢后,系統自動提交至管理員審核導入的電視劇信息、視頻文件的完整情況;
(5)審核通過后系統自動對視頻文件添加數字水印,完成該部備案電視劇樣片導入工作;
(6)系統自動對備案電視劇樣片的地區、劇名、題材、體裁、機構、集數、編導、演員、簡介等信息統計;
(7)通過樣片庫系統調閱電視劇信息以及視頻內容,按集精確定位回放電視劇;截取電視劇視頻片段或選擇所需劇集,以刻錄到光盤的方式進行電視劇樣片導出。
目前,對于已經獲得發行許可的電視劇樣片采用以DVD 光盤介質的格式報送備案并在電視劇樣片系統內長期存儲。通常一張DVD 光盤可以存儲兩集高清電視劇,若一部電視劇在20集左右,則需刻錄10 張DVD 光盤用于電視劇樣片報送。這就造成電視劇發行許可樣片系統錄入樣片信息的時候需要處理大量的DVD 樣片光盤。怎樣能高效、自動化地整理并讀取光盤數據,將樣片數據導入到電視劇樣片存儲是備案電視劇樣片數據導入模塊的設計目標。
傳統光盤讀取方式常采用手動將盤放入終端的集成光驅,這種方式存在以下問題:(1)終端配置的DVD 光驅多為16 倍速,理論上數據讀取數率為2400KB/s,單個光驅讀取遠慢于可達數十MB/s 的硬盤速度;(2)終端集成的光驅需要人工手動放盤、取盤,數百張光盤批量導入時需要耗費大量的人力操作光盤。(3)放盤、取盤操作需要頻繁直接接觸備案的電視劇發行許可樣片DVD 光盤,大量的人工操作不利于樣片光盤管理,同時也增加了樣片光盤丟失和數據泄露的風險。
為提高樣片導入效率,數據導入模塊設計了備案電視劇樣片DVD 自動導入的兩種工作模式:(1)批量處理:批量地對多部電視劇的上百張DVD 光盤導入;(2) 單件處理:因零星光盤損壞、單集電視劇缺失等情況對單張DVD 光盤導入。針對批量處理和單件處理的兩種不同場景,基于光盤庫設備訪問控制服務和光盤塔設備訪問控制服務實現了DVD 光盤自動讀取功能。光盤庫設備劃分為在線緩存區、光盤批量導入區、光盤提取區。批量處理的時候,將需導入的DVD 光盤疊放在光盤批量導入區的光盤匣內,機械手每次從光盤匣內批量抓取12 張DVD 光盤并放置到12 個光驅內并行讀取樣片數據。光盤庫配置藍光光驅,單個光驅的DVD 讀取速率可達24 倍速,即3600KB/s,12個光驅并行導入速度可到43200KB/s。光盤塔配置智能機械手,可以從光盤輸入倉內自動抓取一張DVD 光盤,并放置到DVD只讀光驅內讀取光盤樣片數據,當數據讀取完成,光驅自動彈出光盤,機械手從光驅托架上抓取光盤放置光盤輸出倉內。
樣片庫系統需長期存儲樣片數據,但大部分電視劇,特別是已上映多年的電視劇調閱頻率較低。如果將海量的樣片全部保存在集中存儲中,會降低集中存儲的使用效率,不利于系統的PUE 和TCO 指標優化。
表1 所示,不同的設備具有不同的數據讀寫性能、單位存儲容量成本、數據保存持久性、設備運行維護成本等特性。在保障樣片系統的數據訪問性能接近集中存儲的條件下,進一步降低系統的PUE 和TCO 指標,存儲模塊設計了一個基于在線、近線和離線的分級存儲結構并構建統一數據視圖。在線存儲中的電視劇發行許可樣片可隨時調閱,數據保存在集中存儲的硬盤內,具備實時的數據讀取能力。近線存儲結合了在線存儲與離線存儲的特點,將訪問頻率低的樣片“冷數據”用藍光光盤介質保存,需調閱時可在短時間內讀取數據。離線存儲用于長期保存樣片數據,用于樣片庫系統的數據災備和恢復,避免系統數據丟失。分級存儲融合的數據遷移策略將頻繁讀寫的“熱數據”存放于在線存儲中,而不頻繁訪問的“冷數據”存放在近線存儲和離線存儲中。

表1 集中存儲、光盤庫、磁帶庫性能對比
電視劇發行許可樣片庫管理的視頻文件實際播出狀態涉及未上映、熱播中、播放完結等,報送備案的電視劇版本也涉及多個版本,電視劇的制片者享有電視劇作品的著作權,備案的電視劇樣片一但泄露將侵犯了著作權人的多項權利并帶來嚴重的經濟損失。因此,加強系統所存儲的樣片數據安全,降低備案樣片泄露的風險尤為重要。
電視劇發行許可樣片庫的分級存儲融合實現了樣片數據在集中存儲、光盤庫和磁帶庫中的動態遷移。不同的電視劇樣片視頻文件在不同時間的訪問頻率是不一樣的,電視劇剛導入系統內時數據校驗、水印添加等操作需要頻繁讀、寫樣片數據,但是歸檔后的樣片數據訪問頻率會持續降低。針對樣片數據特點,設計了樣片數據的訪問熱度計算和數據遷移策略。
訪問熱度計算可在數據塊和文件兩種級別上計算[1],其中數據塊是樣片的基本存儲單元,而樣片數據主要為視頻文件,存儲的數據塊存在鏈式約束關系。因此,在文件級別上計算訪問熱度能更好地保留數據塊間的約束信息。


定義3:設備案的樣片文件為i(i=1,…,M),其中M 為文件總數。結合定義1 和定義2 得到樣片文件i 的訪問熱度為:f(i)=F÷(S×Ti),其中S 為文件i 的大小,單位為GB。
集中存儲采用SAN+NAS 架構,具備約500TB 的在線存儲空間。光盤庫為標準19 英寸42U 機柜的高密度設備,作為藍光近線存儲區盤匣總共有12240 個光盤槽位,每個槽位配備可用容量為100GB 的檔案藍光光盤,總的可用存儲容量為1224TB。光盤庫機頭配置了8 塊8TB 緩存硬盤能夠提供約45TB 的在線存儲緩存區用于近線存儲區和在線存儲區之間數據遷移。
分級存儲融合模塊部署了聯合文件服務同時掛載了集中存儲和光盤庫,具備目錄統一性和一致性[2],當系統訪問樣片文件,如果文件存儲在集中存儲內則直接訪問,如果存儲在光盤庫內則需要轉存至集中存儲再訪問。同時,模塊定時更新系統存儲的電視劇發行許可樣片文件的訪問熱度(見定義3),熱度高的文件I/O 操作頻繁存儲于集中存儲內,而熱度低的文件光盤庫會自動將文件遷移至藍光光盤內。分級存儲融合模塊的文件遷移過程如圖1 所示。

圖1 分級存儲電視劇樣片文件遷移序列圖
本文深入探討針對備案電視劇的發行許可樣片庫系統,結合在線存儲、近線存儲、離線存儲設計了基于訪問熱度計算的分級存儲融合的樣片數據存儲方式,以適應新時期的全國電視劇發行備案管理工作的需求。