浦曉亮
【摘 要】隨著目前我國社會經濟的快速發展,人們物質生活在得到極大滿足的同時,對于精神生活的需求也愈發凸顯。基于這一現狀,近年來國內的影視市場得到了極大繁榮,尤其是受到互聯網技術的發展影響,影視作品也呈現出了許多新的特征。對此,就針對網絡視頻中的影視評論分析技術展開相關的研究工作意義重大。本文簡要介紹了影視評論的基本概念,從信息采集、數據預處理、評論分析等三個方面對網絡視頻中的影視評論分析技術展開了具體探討。
【關鍵詞】網絡視頻;影視評論;信息采集;數據處理
中圖分類號:G2 文獻標志碼:A 文章編號:1007-0125(2017)23-0067-01
隨著當前互聯網信息技術的快速發展,各種專業化的影視網站也有了長足的發展與進步,這些網站在為網民提供相關影視節目信息查詢工作的同時,也為廣大用戶提供了對影視節目進行評論的平臺。對此,有關影視節目的評論內容近年來呈現出了指數級的增長趨勢,對于影視節目的評論已經從專業的影評人員擴展到了廣大的網民群體。針對網絡環境中的影視節目評論內容進行搜集、分析,能夠對影視節目的制作、發行,以及宣傳等工作提供重要的促進、推動作用。因此,影視節目評論分析現已成為互聯網評論分析研究的一個重要領域。
一、概述
評論即為評論者針對某項話題發表帶有鮮明個人情感色彩的觀點表達,評論的構成主要包括了話題、創作者、觀點與情感等要素。評論的對象通常也就是所評論的話題,亦可將其稱作影視作品的某一項特征。以電影評論為例,其通常評論的特征主要就有電影作品當中所涉及到的各項元素以及相關的演職人員。電影構成元素則包括了劇本、臺詞、布景、攝影、音樂等內容,所牽涉到的工作人員則有編劇、演員、導演、制片人等。做出評論分析內容即為主動發現評論內所牽涉到的相關評論對象,以及評論人員做出的具有明顯傾向性與代表性的觀點表達。
二、信息采集
應用人工維護方式針對影視節目信息開展持續性的追蹤及維護工作,往往有著較大的工作量。對于目前在互聯網上已經公布出的共享性數字資源信息,針對影視節目基礎性信息內容開展自主化采集與選取,是促成影視節目庫建設的重要方式之一。
對于影視節目數據信息庫的建設,常規的做法是利用當前的互聯網視頻網站采集系統,這一系統可以促成對各主要視頻網站信息的采集和數據調取,利用技術化手段改造處理后,完成對于相關影視節目信息的搜集工作。當前的主流視頻網站采集系統所獲取的目標對象基本都是以視頻形式為主,其中重點包括視頻內容的標題、發布人員、發布時間以及相關的描述性信息等有關內容。影視節目信息系統所需采集的數據內容即相應的影視節目信息,其中主要有影視節目名稱、演員、導演、播放量、每集時間等相關信息內容。
三、數據預處理
這項技術內容主要是對所采集的影視節目信息進行統一化的標準文本處理,其整體系統設計處理最終所要達到的目標對象即簡體中文評論信息,而要實現這一目標需要把搜集到的相關評論信息進行文字形式與分詞等文本轉換處理。因為一些評論內容存在著繁簡字的映射關系,要想實現完全轉換過程較為復雜,在具體實施的過程當中,可先將繁體字處理成簡單的單個漢字予以映射,便能夠滿足要求。
在分詞處理時,則可選用ICTCLAS軟件進行處理。當前所采用的分詞系統較難達到對影視節目名稱等相關專有名詞的自動化檢出,但是分詞的精準性又會對最終的信息應用產生較大的影響。對此,可將在信息采集過程當中所搜集到的演員或是導演等相關專有名稱詞匯加入到附加詞典內,由此系統便可僅選取專有名詞作為選取特征要素,將形容詞作為情感詞,在進行影視評論信息搜集時,僅需提取相關的名詞與形容詞來展開處理。
四、評論分析
由詞匯特征出發所創建出的影視節目評論分析系統,應當要先確定評論內所包括的特征詞匯,即所評論的目標對象。因在數據預處理環節新加入了演員與導演名稱等相關專有名詞,此時再進行分詞之時,所得到的結果便可直接發現影視評論內容中的有關專業詞匯,相關的詞匯也便能夠充當評論的候選特征要素。
此外,因漢語言分詞系統在針對評論文本開展分詞處理之時,會把沒有包含在詞典內的命名實體或是詞組分隔開來,這樣以來,將會導致只依靠分詞系統所獲得的名詞無法對評論特征做出精準描述。對此,可采取基于頻繁項挖掘的特征提取手段來解決以上問題。
基于給定的窗口范圍當中和名詞共現程度超過特定閾值的字符串作為候選抽取特征,這一方法不但可以將具有頻繁性特征的評論抽取出來,而且還可以有效彌補因為分詞系統把復雜特征分隔為多項專業詞匯導致的特征抽取錯誤情形。
總而言之,在本次研究中,基于網絡視頻當中的影視評論分析技術展開了相關的探究工作,基于自動網頁抓取技術以及模板之上的信息抽取技術,建立起影視資源信息庫,同時利用網絡技術來主動抓取相關的評論內容。然后再通過之前所創建的影視專業詞匯與漢語言分詞技術,對評論內容實施分詞處理,借助于頻繁項分析方法,主動探究影視評論中的頻繁特征,作為備選標準,進一步綜合具有典型性的感情詞匯,獲取到影視作品中不同特征的情感傾向分析結果。
參考文獻:
[1]盧娟.網絡影視評論的現狀及生態構建[J].電影文學,2017,(14).
[2]張亞偉.試論新時代下影視評論的現狀與建構[J].劍南文學,2013,(10).
[3]吳飛.網絡影視評論功能研究[J].科學咨詢,2015,(41).
[4]趙悅婧.略談網絡影視評論的傳播與分化[J].中國科技投資,2017,(4).