裴智慧
隨著大數據、云計算、物聯網、區塊鏈、人工智能以及元宇宙等數字技術的發展與應用,中國電影在數字化及數字化轉型方面已經取得了有目共睹的成績。從數字化轉型到數字化戰略,正在各界形成相對普遍的共識,國家也從政策層面對數字技術給予支持并不斷規范。從2016年開始,一系列相關法律法規頒布、施行,比如《網絡安全法》(2016)、《電子商務法》(2018)、《網絡信息內容生態治理規定》(2020)、《數據安全法》(2021)和《個人信息保護法》(2021)等,這些法律法規的出臺對數據的權屬、數據隱私、數據保護和數據安全做出更為明確的規定,填補了大數據時代個人信息、網絡平臺監管、數據安全領域的空白。保護基礎信息網絡、重要信息系統和數據資源已經成為了國家關鍵信息基礎設施,數字技術的發展在帶來巨大經濟和社會效益的同時,也給信息安全和管理帶來了嚴峻的挑戰,數字技術在電影領域的應用也存在同樣的問題。
將大數據技術應用于影視產業,利用其強大的數據分析能力,可以為影視生產和銷售提供有力的數據參考。具體而言,就是通過對海量數據的分析和整理,得到觀眾對某部影視作品的具體評分以及該作品營銷業績等一系列客觀數據。這些數據對于影視制作非常重要,通過分析相同類型影視作品的數據,能夠幫助決策者更好地進行選擇、決策,從而對新作品的收視率和票房成績產生積極影響。毫無疑問,在影視產業的發展過程中,大數據正發揮著越來越關鍵的作用。
1.劇本優化。劇本創作是創意性的工作,基于數據分析的劇本優化會給自由創作架起框架,但許多有關劇本創作的理論卻以大量例證顛覆這一認知。創作劇本要遵循一定的模式,一般會以一定的篇幅控制開頭、中段和結尾的寫作節奏,甚至劇中激烈的情節點都是有相對明確的參考位置,絕非是天馬行空的游走。基于這樣的理論前設,通過收集和分析相關數據,將大數據應用于劇本創作,可讓創作方向更加明確,有效地把握觀眾對題材的興趣度,也可實現劇本內容(情節、橋段等)的評估。創作者甚至比觀眾還要了解他們自身的劇情喜好,依據這些分析結果對劇情進行優化,避免創作出現太多違背觀眾意愿的、個人化的內容,從而實現商業意義上的劇本優化,使影視作品獲得更高的市場認可度。
2.演員選擇。演員的選擇對于電影的市場表現有巨大影響,例如:從對國產高票房青春電影的數據分析中可以發現時下年輕明星強大的市場號召力,相關機構對這一類型影片觀眾群體做過數據分析:超過46%的觀眾是12至18歲的女生。這一數據足以證明,拋開劇情、檔期等因素,演員號召力所貢獻的電影票房不容小覷。因此,除了在劇本優化方面可以利用大數據外,把數據分析的方法應用于演員選擇也很重要。
3.營銷策略。通過對社交媒體上的海量用戶所產生的信息進行大數據分析,可以得到某一地域觀眾的年齡、性別、職業等各種維度的信息。依據這些信息,制片方可以向不同地域或不同觀眾群提供個性化的宣傳策略,將宣傳信息最大限度地輻射至目標觀眾,而不再是全國千篇一律的“首發視頻”。
4.票房預測。將傳統分析與大數據分析的進行比較可以發現,傳統分析關注的是整體特征,試圖挖掘的是某種現象出現的原因,并依此做出調整改進;大數據分析則更關注個體特征,其優勢在于預測未來。幾年前,有互聯網公司在此方面有過成功應用,他們根據用戶在互聯網上的搜索次數來進行電影票房預測,據驗證,此方法能提前一個月預測出電影的首周票房收入,且準確度高達94%。而現在,我們更可以通過收集微博、微信上的話題量以及各大平臺所發布的相關新聞,甚至結合文本調查對各用戶進行情感傾向分析,從而對電影票房做出更加精確的預測。
數據分析往往涉及不同信息系統中的數據融合,除了數據量增長外,數據來源的廣泛性、多樣性是以往單系統數據分析所無法企及的。數據來源的廣泛性也帶來了數據標準、含義不統一等諸多問題。為了解決上述問題,企業在開展大數據分析前應該引入數據治理體系。電影企業數據治理體系的建設需要依據現有信息化水平分階段分步驟進行,對數據治理的概念、治理要素和框架以及面臨的挑戰進行探討,提出數據治理的框架,將數據治理體系分為協同籌劃、過程實施和監控評估三大主要板塊,并對數據治理的核心功能進行描述。
1.數據收集。在網絡上以調查問卷的方式,對觀眾信息進行采集,包括觀眾年齡、所觀看的電影電視劇及其評價。這些數據比較零散,無法直接作為數據挖掘的對象,需要相應的統計分類才能做進一步分析。
2.數據挖掘分析。一是數據制表將相應數據經過合并排序制成事實表,并做出各維度表;二是處理結果可視化,把挖掘出的數據轉化為數據分布圖,方便進一步研究及模型推導;三是相關分析,對所制圖表進行相關分析,從而找出影響票房或收視率的最相關因素;四是預測未來,通過數據挖掘結果所提出的數學模型對影響票房或收視率的因素進行分析,以便于預測單日票房趨勢、單日收視率趨勢等。
3.數據整理利用。在收集數據之初會發現這些數據非常雜亂,且存在部分無用數據。為了使數據更為有效,需進行預處理操作,使其變得更有條理,需要對所收集到的數據進行制表。以電影數據為例就包括放映時間、排片占比、上座率、適應人群幾個方面。在經過制表環節后的數據,需要將其制成各種可視化的分布圖以便于進一步整理,最終實現數據服務于發布、為數據內外部提供數據應用和分析結果服務,分析出影響票房或收視率的最相關因素。
1.臟數據問題。有些影視公司為增加其影視作品的大眾關注度,不惜花費重金雇傭“網絡水軍”進行炒作。“網絡水軍”采用一些技術手段將這些影視作品的搜索熱度、討論熱度等數據不斷刷高,臟數據隨即產生,使數據質量低下,可信度不高。所以通過對數據質量的管理,識別正常數據和異常數據,制定數據質量預警閾值,對數據質量進行多維度監控,以提高其可用度和可信度。
2.行業內數據維度不一致。根據不同數據維度進行數據統計的影視作品,其數據庫無法直接進行對比,難以得出分析結果。比如,采用七大用戶的數據維度進行統計而得到的數據,和采用六大影視作品內容元素的數據維度進行統計的數據庫,從技術角度來說根本無法進行比對。因此要建立影視行業內的數據標準體系,保障影視行業內部數據使用和交換的一致性、準確性和規范性約束,其中包括基礎數據標準和指標數據標準。基礎數據標準包括對所有影視相關數據域的庫表級別的統一管理及映射,如字段屬性、長度精度、值域碼表等;建立元數據標準,從技術元數據、業務元數據和管理元數據多個維度對元數據進行管理,統一影視行業不同數據域的元數據標準。指標數據標準包括對影視行業內部的指標統計口徑的一致性約束,包括指標本身的業務含義,指標的計算規則,指標的計算維度,指標的管控規則等,達到在影視行業重要指標的統計口徑統一。
3.數據分析結果預測功能的局限性。雖然大數據的最強大功能是對未來趨勢進行預測,但基礎數據質量的高低,會導致未來的票房或收視率不一定與預測結果完全一致。數據質量越高,預測的結果就越準確。這也要求影視行業各企業加強對企業內數據管理重要性的認識。盤點數據資產,分析數據管理存在的問題,明確未來數據管理的組織、流程、制度,制訂數據管理的咨詢方案。形成影視行業企業內甚至在整個影視行業的數據標準,對重點數據域加強標準化管理,按照標準對既有數據進行數據清洗,提高數據質量,為預測結果的準確性提供強有力的底層數據支撐。
4.數據安全問題。數據已成為國家戰略資源和關鍵生產要素,數據安全關乎國家安全、商業機密及個人隱私,需要處理好數據開放利用與隱私保護之間的關系。國家相繼出臺了《數據安全法》《個人隱私保護法》等法規政策,要求在加快培育數據要素市場的同時,還要對數據進行分類分級的安全保護,實現數據安全與數據開放利用并重。在對大數據進行挖掘和指標開發過程中,開發工程師對數據擁有絕對訪問權,影視行業相關的基礎數據和重要指標處于裸露狀態。在影視行業企業內或企業間數據傳輸過程中,也存在數據泄露風險。因此通過數據管理流程、數據管理職責分工、數據管理制度、數據管理考核評價、數據授權、數據流向、數據質量、數據規范等內容來加強數據安全管理,對原始數據進行安全分類分級、不同等級的數據使用不同的加密方式和安全策略,在數據傳輸過程中的加密及集成安全也尤為重要。
黨的二十大報告中明確提出了加快建設“網絡強國”和“數字中國”的戰略目標。今年年初,國務院印發了《“十四五”數字經濟發展規劃》,該規劃明確指出數字經濟是繼農業經濟、工業經濟之后的主要經濟形態。5月,中辦、國辦印發《關于推進實施國家文化數字化戰略的意見》,從目標到重點,從路徑到步驟都做出了戰略部署,成為推動實施國家文化數字化戰略、建設國家文化大數據體系的一個框架性、指導性文件。作為電影企業,在響應政策號召,加快推進電影產業數字化轉型,推動互聯網、大數據、人工智能等同電影產業深度融合,實施“上云用數賦智”等方面要有所作為,根據企業管理要求和數據敏感性要求,在“整體統籌、循序漸進、條件具備”的演進策略中,對數據制定一套合理、科學的安全分類標準、流程和制度,最終實現“數據不動程序動”“數據可用不可見”“只分享價值不分享數據”“保留數據所有權,釋放使用權”(見《網絡安全與數據治理》2022年12月第6期第41卷《破解數據要素流動與隱私保護相沖突的局》,作者方濱興。)的安全數據模型,將數據的價值更好地為企業賦能,提高經濟質量效益和核心競爭力。