邵德奇 李騰飛 王理瑞
(科技日報社技術研發部, 北京100038)
隨著互聯網的快速發展,媒體信息技術驅動媒體轉型,媒體發展已經進入了新媒體時代,新聞傳播方式發生了巨大的變革。新媒體時代,新聞傳播呈現出傳播速度快捷化、傳播內容海量化、傳播主體多元化、傳播形式多樣化等特點。[1]新聞傳播向大眾化、多元化、全球化發展,媒體與公眾的互動性不斷增強,網絡傳播已成為最主要的傳播渠道。如何快速量化新聞的傳播力,如何客觀準確了解媒體在多元化渠道的影響力,如何了解專業記者的影響力,如何了解媒體的轉型效果,如何了解公眾最關注、喜歡的新聞內容等問題,是所有的媒體都特別關注而且亟需解決的。
針對上述問題,本文利用大數據、人工智能等技術手段,緊密結合新媒體時代新聞媒體的評價要求,建立了新聞傳播指數系統,通過客觀、嚴謹的傳播影響力計算模型,實現對新聞、媒體、記者、區域等多維度對象的自動監測、自動跟蹤、自動分析和自動評價。為媒體影響力評估、績效考核、選題策劃等業務提供支撐。
為了實現新聞媒體傳播的分析和評價,首先要利用監測技術及時發現需要考核的新聞,即信源發現;發現信源后針對信源在考核期內進行全程跟蹤,記錄并分析信源的傳播行為,包括在考核期間的轉載、閱讀等情況,即信源的跟蹤和處理;綜合考慮新聞、媒體、記者、區域等多維度的傳播影響因素,設計一套新聞傳播評價指標體系,建立新聞傳播指數計算模型,通過綜合運算,計算出考核期內的所有考核對象的傳播指數,媒體的綜合指數和記者的影響力指數,對新聞、媒體、記者和區域進行綜合評價。
新聞傳播指數系統由基礎設施層、平臺層、工具層、軟件系統層和應用層組成。如圖1所示。其中,基礎設施層由服務器、存儲、備份、網絡、虛擬化、安全設備組成;平臺層由操作系統、數據庫、應用中間件、開發環境和公共組件組成;工具層由爬蟲引擎、搜索引擎、計算引擎和分析引擎組成;軟件系統層由信源采集、信源跟蹤處理、傳播分析組成;應用層由領導駕駛艙、指數查詢、記者榜單、區域分析和趨勢分析組成。

圖1 新聞傳播指數系統架構圖
新聞傳播指數系統具體包括信源采集子系統、信源跟蹤處理子系統、傳播分析子系統3個子系統。
信源是產生各類信息的實體。常見的信源有文字信源、圖像信源、數字信源等等。信息傳播過程簡單地描述為:信源→信道→信宿。其中,“信源”是信息的發布者,即上載者;“信宿”是信息的接收者,即最終用戶;“信道”是信息的傳播通道。本系統中信源就是需要進行傳播分析的對象。分析對象既可以是新聞,也可以是需要分析評價的媒體或記者。因此,既可以將新聞和發布新聞的媒體視為信源,也可以將上載信息的記者視為信源。信源發現是新聞傳播指數系統的重要環節,信源的及時發現對信源的評價十分重要,本系統利用信息檢測爬蟲技術采用如圖2所示的信源采集子系統,實現信源的及時發現。通過對考核對象的信源進行配置,解析新聞標題、正文等信息,就可以及時自動發現信源的更新并自動抓取數據,并將此納入考核對象,進行傳播行為分析。

圖2 信源采集子系統流程圖
信源跟蹤和處理是本系統的難點,對發現需要考核的分析對象通過關鍵特征對比(如文章標題、正文、作者、發布時間等信息)和相似度分析,鎖定分析對象,在設定的考核期內進行全程跟蹤,記錄其傳播行為,并將相關信息記錄到數據庫里。如圖3所示。

圖3 信源跟蹤和處理子系統流程圖
系統發現信源后,要對考核對象進行跟蹤,及時發現考核對象的傳播情況,記錄在傳播過程的轉載情況、閱讀情況,以及考核對象自身屬性的情況。
信源跟蹤和處理子系統包括信源發現子流程、信源跟蹤子流程、信源分析子流程、數據統計子流程4個子流程。
1.2.1 信源發現子流程
信源發現子流程通過自動掃描技術及時發現并爬取考核源數據,并將考核對象納入考核分析數據庫。
1.2.2 信源跟蹤子流程
系統對發現需要考核的分析對象,在設定的考核期內進行全程跟蹤,通過特征提取解析文章標題、正文、作者、發布時間等關鍵信息,記錄其傳播行為,并將相關信息存入數據庫。在全網進行搜索,通過相似度分析精確跟蹤信源傳播軌跡。
1.2.3 信源分析子流程
系統對跟蹤對象的傳播行為進行分析,重點分析考核對象在考核期間的點擊和轉載等情況,并進行網站點擊率和轉載率統計。根據PV、UV計算瀏覽量,根據媒體庫設置,統計各級媒體的轉載數,并記錄轉載地址。
1.2.4 數據統計子流程
從文章維度、作者維度、媒體維度和區域維度等多個維度,按照定制算法進行統計。
新聞傳播分析重點關注新聞誰在看、誰在轉等傳播問題,而且不同媒體傳播轉載的影響因子是不同的,為此筆者對新聞傳播行為進行分析后,設計了一套評價指標體系,建立了新聞傳播指數評價模型,通過綜合運算,計算出考核期內的所有考核對象的傳播指數、媒體的綜合指數和記者的影響力指數等,來對新聞、媒體、記者和區域進行多維度的傳播效果評價。
大數據技術為傳播效果評價奠定了基礎,基于海量傳播數據可以科學、客觀地構建評價指標體系。本系統在借鑒相關研究經驗和理論模型的基礎上,結合考核對象的信源數據等獲取的可操作性、客觀性,探索出了一種客觀、科學、標準化的傳播力評估指標體系的優化方法,根據數據測試對評價體系不斷修正,通過對指標項的修正和權重的調整實現評價結果的不斷優化升級。
格雷厄姆 · 威廉姆森指出傳播力(communication capacity)是指傳播者和受眾成功對信息進行編碼和解碼的能力(Ability),強調“傳播能力”[2],因此在構建評價指標體系時綜合考慮了受眾因素,從多維度進行評估分析。從指標選取上主要遵循關聯性、重要性、全面性、客觀性、可操作性五大原則,采用可量化獲取數據指標進行評估。其中關聯性主要衡量評估指標與傳播力之間的相關性,也即相關指標是否會影響傳播力,基于關聯性原則剔除不相干指標;重要性主要衡量指標對傳播力的影響作用程度,基于重要性原則剔除相關但影響作用甚微的指標因子(如用戶評論量,因是人工進行篩選后發布,雖然與影響力有一定關聯但是不具備重要性,在此不納入指標體系);全面性主要衡量評估指標因子的豐富程度,盡可能保證在可操作的基礎上從最多視角進行傳播力評估;客觀性是指評估因子不受主觀判斷影響,均為客觀數據,設置該項原則主要是考慮到對大規模樣本評估過程中的可操作性和評估結果的客觀科學性。
同時新聞傳播指數評價模型基于開放性、專業性和權威性的原則,力求做到“科學、合理、客觀、公正”,并通過動態迭代和優化來不斷提升模型的權威性和專業性。[3]評價模型有“四全”:一是稿件考核增加了全網傳播力這一重要考核指針;二是實現了全形態生產要素的考核,包括文字、圖片、視頻、音頻等;三是實現了全體生產人員的考核,不僅包括媒體內部采編人員的評價考核,還包含對外部記者,如記者站、通訊員的評價;四是可自定義媒體級別和類型,綜合考慮新聞、媒體和記者的影響力,自主定義指標權重,實現了全維度生產要素考核。

不同等級媒體根據媒體的影響力和重要性不同來劃分。如一級媒體為影響力較大的中央主流媒體,占比b1%;二級媒體為地方、專業各領域媒體,占比b2%;以此類推。具體的媒體等級數、各級媒體的數量、具體媒體名稱和占比情況可依據各媒體單位的實際情況自定義設置。判斷矩陣的歸一化權重向量采用幾何平均法計算。[4]
新聞傳播指數系統已經在科技日報社得到了應用,改變了過去人工評價的主觀性,大大提高了新聞評價的工作效率和客觀性,減少人為主觀性,降低了評價成本,取得了科技日報社的高度認可,并正式作為科技日報社的新聞評價標準和績效考核依據。同時,通過傳播指數進行數據分析,為新聞選題策劃提供了決策依據,具備較高實用價值。
一是能夠實現對新聞、記者、媒體和區域多維度的客觀評價。以用戶需求為導向,依據數據分析,可以實現全自動的新聞跟蹤和分析,并形成傳播指數。構建智能化傳播影響力評價體系,對分析對象自動發現、自動跟蹤、自動計算指數、自動生成評價圖表報告,整個評價過程不需要人工干預。如圖4所示為區域傳播指數統計圖表。

圖4 區域傳播指數統計圖表
二是從宏觀角度對媒體的傳播力綜合分析。綜合分析媒體的傳播情況,形成媒體綜合傳播指數,為媒體發展提供參考。如圖5所示為一定時間內媒體傳播指數的趨勢走向圖表。

圖5 傳播指數趨勢圖表
三是對每位記者發布的每篇文章進行傳播力分析,可以作為KPI考核的重要參考。為每位記者建立獨立的發稿及評價庫。
四是聚焦每條新聞針對內容進行分析,跟進新聞稿件的傳播路徑、傳播效果等指標情況,挖掘用戶最關注的主題、閱讀偏好,進而為新聞選題策劃提供決策依據。
系統已經應用在科技日報社、工人日報社等媒體的實際評價中,已經成為新聞稿績效評價的重要依據,并能為選題策劃提供決策支持。針對不同媒體只需要修改參數就可使用,在媒體行業中具有示范和推廣價值。