王勇,吳勝益,趙恢華,黃偉
(江西警察學院 科技與信息安全系,江西 南昌 330103)
隨著社會經濟的快速發展,人們的時間碎片化越來越明顯,對娛樂資訊的需求越來越廣泛、精簡,視頻網站、APP愈發受大眾青睞。許多視頻網站、APP都因其資源庫品類豐富或用戶體驗良好等優勢而在同類產品中脫穎而出,彈幕作為一種新興功能,日益成為各大平臺用戶的新寵。彈幕具有很高的實時性和直觀性,為的是讓用戶能夠在對強畫面進行有針對性的發言中獲得快樂。但隨著彈幕功能的普及,彈幕也因其互動性高這一特點而反映出許多問題:暴力、低俗、謠言、三觀不正等內容充斥屏幕。這些問題不僅影響其他用戶的體驗,而且嚴重損害文明和諧的網絡氛圍。網絡用戶呈現低齡化趨勢,如不對彈幕環境進行有力的監管,將會在很大程度上影響未來網絡環境的發展。針對彈幕環境引發的一系列問題,“智監彈幕寶”APP應運而生。這款APP將作為輔助APP智能化監管彈幕內容,最大限度地保護彈幕環境,打造一個優質的彈幕環境,提升用戶的觀賞、互動體驗。獨特的監管功能可在一定程度上減少彈幕來源,及時將違法彈幕推送至公安系統,緩解監管系統的壓力。用戶可以針對違法彈幕進行舉報,實現彈幕內容綠色化,同時最大限度地保留彈幕應有的特色。
為了保證用戶信息的可信度和可追溯性,智監彈幕寶APP需要用戶實名注冊并進行手機綁定。APP功能設置主要分為以下四個欄目,功能構思框架圖如圖1所示,APP運行框架圖如圖2所示。

圖1 功能構思框架圖

圖2 智監彈幕寶APP運行框架圖
1.1.1 APP登錄
圖3中的黑白色箭頭指向本APP的圖標,首次登錄的用戶點擊圖3中的圖標,便可進入圖4軟件賬號登錄注冊界面。

圖3 智監彈幕寶APP的圖標

圖4 登錄界面
1.1.2 APP功能簡介
“智監彈幕寶”APP的首頁總共有四個模塊,分別是首頁、消息、搜索、我,如圖5所示。四個模塊分別有著不同的子功能系統,該APP通過每一個功能以及衍生出的子功能更好地服務于大眾用戶以及相關的執法部門,為建立一個健康、雙向信息傳導的視頻彈幕環境提供一劑清新劑。

圖5 首頁
如圖6所示,對首頁中四大功能(彈幕監測、彈幕推送、彈幕舉報、非法彈幕庫)中彈幕監測的相關子功能進行介紹,分為兩個子功能:彈幕預警和彈幕上報。彈幕預警即為智監彈幕寶APP對用戶手機上的各大視頻軟件(如B站、愛奇藝視頻、騰訊視頻、網絡直播平臺等)上的彈幕內容進行監測,若監測到的內容屬于違規內容(政治敏感詞、淫穢言語、攻擊中國共產黨、侮辱國家等內容),該監測機制將進行彈幕預警,隨即通過另外一個子功能——彈幕上報,將違規內容在“信息”模塊中呈現,接下來通過“彈幕推送”功能進行下一步的處理。

圖6 彈幕監測界面
例如,在B站上,某個ID為“某某華”的用戶于2020年5月18日13:01:02時在某UP主視頻中通過彈幕發送一條關于邪教的言語——“法輪大法好”。其他用戶通過智監彈幕寶APP對這一彈幕內容進行違規內容確認后即可將該彈幕內容上報至“信息”欄,進入下一步的對接公安機關網絡上的治安工作。
如圖7所示,對首頁四大功能(彈幕監測、彈幕推送、彈幕舉報、非法彈幕庫)中彈幕推送的相關子功能進行介紹,這里的“彈幕推送”實則包括兩大塊:其中一塊屬于言語健康、內容正常的彈幕言論,我們將這一塊的彈幕內容推送至各ID主發布的視頻軟件平臺,供大眾用戶相互交流。另外一塊則屬于非正常的彈幕內容(如上圖所示的“法輪大法”“淫穢言語”“敏感詞匯”),對智監彈幕寶來說,對這一塊的處理屬于創新點,我們可以將非法內容以及發送相關內容的ID信息及時推送給相關的執法部門,執法部門憑借這些信息就可以對相關人員采取相應的治安管理措施,例如:封號、傳喚,對思想偏激嚴重的人進行刑事案件的立案偵查等。

圖7 彈幕推送界面
如圖8所示,對彈幕舉報功能進行介紹。用戶在使用手機視頻軟件時如發現其中含有非法內容或是不健康的內容,可以在智監彈幕寶APP中的“彈幕舉報”上進行舉報,輸入“視頻軟件的名稱+視頻所在的房間+發送者ID號+發送時間+發送的內容”即可完成舉報,舉報后會有一個來自執法部門的處理反饋信息,這是一個極為重要的功能,有效地維護了用戶的相關權利。

圖8 彈幕舉報界面
非法彈幕庫的建立:非法彈幕庫的建立是智監彈幕寶APP的關鍵所在,采用先進的大數據進行建模,主要是使用網絡爬蟲從各大視頻應用軟件頁面中采集非法彈幕信息,對互聯網信息中的敏感字詞以及用戶發布的彈幕進行爬取。網絡輿情分析不僅需要對當下所有的網頁及其呈現的所有內容進行捕獲以保證建立的非法彈幕庫的全面性,還要保證非法彈幕庫里面內容的準確性,對所捕獲的網頁非法內容進行分析歸類,使APP工作時能夠快速準確地進行比對排除;另外,對非法彈幕庫捕獲的非法網頁鏈接進行深度爬取,從而獲得更多維的參數和網頁源文件。
非法彈幕庫的存儲:對非法彈幕庫收集到的相關信息進行分析、去重等處理,然后根據類別和屬性進行歸類,以便在使用APP時可以更好地進行識別和檢索比對。由于各大視頻(如B站、愛奇藝、騰訊視頻等)網頁結構各不相同,因此需要去除與文本無關的HTML源碼,并保留網頁標題、內容摘要、發布時間、評論等與非法彈幕相關的信息。過濾掉收集的正常網頁、內容以及收集時產生的誤差信息,留存已經納入非法彈幕庫的非法彈幕,并將其保存到HDFS分布式文件系統中,對非法彈幕進行有效的存儲。
如圖9所示,智監彈幕寶APP所有的信息反饋,主要來源于功能模塊中彈幕監測及后續公安機關對違規發送彈幕的ID實名認證人的處理信息,另外一部分信息則是手機用戶對違規彈幕舉報的反饋信息、與該款APP開發商聯系的信息(可提供對智監彈幕寶的建設性意見)。

圖9 信息界面
如圖10所示,智監彈幕寶APP自動實時推送彈幕熱點信息,用戶也可以自主搜索該時間下網絡上關于某一熱點的詳細信息、新聞的實時動態。

圖10 熱點搜索界面
在智監彈幕寶APP中還具有“我”這一欄,主要是滿足個人信息、賬號安全、設置、關于以及退出登錄等相關應用,如圖11所示。

圖11 “我”界面
智監彈幕寶APP的開發需要滿足所有系統都能下載,在開發平臺、數據處理、實驗產品設計平臺、服務器數據結構等方面都做出了相應的要求,具體內容為:
(1)開發平臺介紹。本項目采用Hybrid APP技術(混合框架的APP設計模式),主要技術為HTML5+JAVASCRIPT+MapReduce交互技術,Hybrid APP的優勢是可以實現跨平臺性,兼容PC端與移動端、Windows與Linux、安卓與IOS。
(2)數據處理:Hadoop平臺
存儲數據:HDFS分布式文件系統
分析預測:HTML5+JAVASCRIPT+MapReduce交互技術
編程語言:Javascript語言
(3)本項目所設計的APP實驗產品是在APICloud中設計完成的,這是一款“云端一體”的移動開發平臺,如圖12所示,利用平臺提供的“云”和“端”兩個方向來提供API,引擎框架一般使用HTML5和Javascript作為編程語言??梢詫崿F服務器數據的云托管,為APP設計提供較好的實驗環境。

圖12 APICloud平臺示意圖
(4)服務器數據結構。將需要服務器維護的信息、需要客戶端與服務器不斷請求的信息(如案件位置信息、用戶認證信息、新聞發布信息等)存儲在遠程服務器端。遠程服務端數據庫主要包括5張表信息和兩張數據字典信息,如圖13所示。

圖13 服務器數據結構圖
近年來,隨著互聯網上各大視頻軟件企業的發展,我國已經進入大眾麥克風時代。彈幕字幕的存在早已為人所熟知,它是將視頻中出現的對話或者旁白用文字的方式呈現在視頻中。但現在的字幕可不一定就是劇中人的對話,還可能是大眾瀏覽者的彈幕。彈幕是一種即時評論,它會立刻顯現在正在播放的視頻中,把對影視作品的評論從“看完再說”變成了“同步進行”,這些評論從屏幕飄過時,效果看上去像是飛行射擊游戲里的子彈,因而被稱為“彈幕”。作為一種即時互動方式,它不僅增加了社交性和趣味性,更是信息的雙向傳遞。正是因為這種“自媒體”式的雙向信息傳播,需要我們對其進行監測和管控,“智監彈幕寶APP”可以更好的解決這一“云”問題。