朱芷瑤
(作者單位:吉林大學新聞與傳播學院)
量化研究方法具有客觀性、具象性、數據化的特點,能夠有效地排除人文社科學科研究過程中研究者摻雜主觀情感,可以把研究結論形象清晰地呈現出來,有助于人們全面理解各種社會現象。因此,梳理我國新聞傳播領域量化研究的整體脈絡并詳細總結其規律和方法,對推動量化研究在該領域的廣泛運用具有重要作用。
本文設定中國知網(China National Knowledge Infrastructure,CNKI)數據庫為數據來源,使用文獻計量工具CiteSpace對研究數據進行可視化分析,直觀展示研究概況與趨勢。首先以“量化”為主題詞檢索近20余年的文獻,并對其進行比對分析,以此把握研究的整體概況。其次檢索近一年全文含有“量化”字眼的文獻,由此窺探研究前沿。經過編碼一致性檢驗后得到用以研究整體趨勢的820篇文獻。
由于文獻數量過大,筆者借助學者陳美超研發的文獻計量工具CiteSpace對文獻數據進行可視化分析,繪制特定領域的知識圖譜以清晰地展示關鍵詞族群,并對每個族群進行主題詞概括。文獻計量法能夠詳細展示學者發文量、研究領域、所屬機構,并對量化方法在新聞傳播中可應用的話題提供了參考。
研究者在CNKI知網文獻庫以“量化”作為主題詞,限定文獻分類目錄為中文—人文社科版塊—學術期刊—新聞與傳媒學科。為了保證獲得綜合期刊或其他學科領域有關“量化”“新聞傳播”的文獻,筆者同樣以“量化”作為主題詞,同時選取“圖書情報與數字圖書館”“宏觀經濟管理與可持續發展”“出版”“計算機軟件及計算機應用”等相關學科,搜索全文含有“新聞”“傳播”或“傳媒”字眼的文獻,剔除廣告等無效文獻后再進行人工篩選,最后得到820篇文獻,時間跨度為2000年至2021年。
根據檢索,“量化”這一主題詞最早出現在陸原于1986年在《新聞界》上發表的文章《運用系統方法搞好采、編、播》。此后,此類文章發表數量整體呈現波折上升趨勢。1986年后的近20年時間里,相關學者一直保持每年不超過50篇的發文數,并于2010年迎來拐點,首次突破50篇。發文數量在2021年達到頂峰,為211篇(見圖1)。

圖1 文獻年度分布
在研究方法與內容方面,新聞傳播領域的量化研究在2010年之前集中在電視信號(2010年)、電視節目收視率(2003年)、央視招標價值評估(2004年)、報紙差錯(2007年)、報業經營(2010年)等方面。2010年之后,網絡媒體相關研究逐漸熱門化,數據新聞(2014年)、網絡輿情(2014年)、社交媒體(2019年)、用戶生成內容(2021年)等都是代表性的關鍵詞,并在對應年份集中出現(見圖2)。

圖2 量化研究熱點時區圖譜
經過詳細的文獻閱讀,筆者發現,新聞傳播學科的量化研究方法主要集中在以下兩大種類:一是文本分析軟件;二是各種統計學和數學模型。
文本分析的量化研究工具在前期以單純閱讀或觀看文字、圖片、視頻為主,后期轉向了各種編程語言或計量軟件。文本分析的數據來源在前期以圖書或紙媒、電視、廣播為主,后期以網絡數據、采訪文本為主。2004年,湯曉羽選取改革開放初期《人民日報》典型報道的文本進行解讀[1]。2005年,劉自雄把《超級女聲》看作一部以聲音和影像作為敘事語言的戲劇,并從文本角度分析其成功原因[2]。2017年,冉華、竇瑞晴綜合利用Python、SPSS、NetDraw等工具,以CSSCI期刊為研究數據來源進行文獻計量分析,探究媒介融合機制研究的熱點議題[3]。2018年,葉鳳云、沈思、李君君使用NVivo11對新媒體環境下青少年用戶錯失焦慮癥的相關訪談進行編碼,總結出了錯失焦慮癥的相關特征[4]。2018年,王建磊借助DiVoMiner對2017年至2018年的關于“日常化網絡直播”相關報道進行開放式編碼,研究得出該類直播方式吸引用戶的原因:主體、內容、互動這三大直播要素互為補充形成的場景機制契合受眾需求[5]。2021年,孔明、劉鳴箏利用編程語言Python抓取新浪微博中關于伊朗突發新聞的用戶評論作為數據母本進行詞頻統計和隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)主題分析,得出用戶對戰爭類的硬新聞的關注點集中在事件本身[6]。
統計學和數學模型也被廣泛應用于新聞傳播學科的量化研究中。前期研究統計方法相對單一,以數量統計或對比分析為主,后期采用復雜的數學模型并配合各種統計軟件進行統計。2006年,強月新、郭韶明開展了5種主流新聞類學術期刊的傳媒經濟相關研究,通過生成圖表的方式進行了簡單的數量統計,認為思想方式的轉變促進了傳媒經濟的發展[7]。2010年,周云倩、陳信凌利用網站流量統計平臺Alexa的數據對英國廣播公司(British Broadcasting Corporation,BBC)、美國有線電視新聞網(Cable News Network,CNN)、央視國際網站的綜合評價指標數據進行對比分析,以此為參考探尋提高我國廣電媒體的傳播力和影響力的方法[8]。2014年,尤薇佳、李紅、劉魯首先通過問卷調查比較4類網絡信息傳播渠道對于突發事件信息的傳播效果,其次構建突發事件信息渠道信任模型,最后運用結構方程對上述數據進行了分析[9]。
為了緊跟熱點,本文依舊從知網文獻庫文獻分類目錄中搜索全篇含有“量化”字眼的文獻,篩選出2021年1月至2021年12月一年內共2448篇文獻作為數據來源,探索新聞傳播領域量化研究的研究前沿。
本文使用CiteSpace對2021年1月至2021年12月的2448篇全文包含“量化”字眼的文獻進行分析,繪制并生成了關鍵詞共現詞譜(見圖3)。

圖3 量化研究前沿關鍵詞共現圖譜
其中出現頻率較高的關鍵詞如下:媒體融合(N=136)、短視頻(N=127)、新媒體(N=107)、網絡輿情(N=68)、社交媒體(N=62)、融媒體(N=55)、大數據(N=45)、主流媒體(N=39)、算法(N=28)、扎根理論(N=16)。形成了10個主題聚類:#0短視頻、#1媒體融合、#2人工智能、#3新媒體、#4網絡輿情、#5新聞傳播、#6融媒體、#7大學生、#8對外傳播、#9算法。
筆者挑選N>100的3個關鍵詞聚類分別進行文獻綜述。
媒體融合聚類:林信焰結合媒介經濟學理論構建結構方程,探究了媒體各類績效因素對中國媒體融合渠道管理的作用機制[10]。張蘇秋、王夏歌基于文獻計量學方法,利用UCinet對中國知網收錄的媒介融合相關文獻進行了知識圖譜分析,總結出國內近20年的媒介融合研究熱點[11]。劉丹借用卡爾·皮爾遜相關系數分析了網紅、書店、圖書品牌、出版社的短視頻賬號作品數與互動情況的相關性,得出結論:知名出版社短視頻賬號能夠憑借高知名度吸引大量粉絲,但在互動方面不如網紅賬號和書店賬號[12]。
短視頻聚類:安寧、安璐基于ELECTRA和REDP方法分別對新浪微博和抖音兩大平臺的短視頻數據輿情文本信息進行實體抽取和關系抽取,并分析二者的知識圖譜,得出二者的輿情信息既有相同內容,也存在不同的衍生內容[13]。黃艷、劉默揚、李衛東以抖音和快手平臺的“青年學黨史”作品合集為數據來源,使用結構方程模型構建政務短視頻用戶信息分享的實證研究模型,研究發現用戶滿足感在其中起到中介作用[14]。蓋晨飛基于字節跳動旗下的巨量星圖平臺數據統計了抖音內容創作者的商業數據,指出了內容生產者存在就業穩定性差、多頻道網絡(Multi-Channel Network,MCN)孵化能力欠佳等問題[15]。
新媒體聚類:徐麗芳、周伊利用CiteSpace、VOSviewer軟件進行數字閱讀研究知識圖譜分析,詳細考察了數字閱讀相關研究在作者、機構、研究領域等方面的狀況[16]。謝秋逸、周年興、朱凈萱基于SEIR信息傳播模型和廣告預算模型描述了新媒體對旅游地生命周期的非線性影響[17]。
首先,在發文量方面,新聞傳播學科中使用量化方法的研究呈現波折上升趨勢,整體上呈現攀升趨勢。這是因為新媒體時代層出不窮的新型媒體平臺和長時間在線的大量用戶使媒體存儲了海量數據,單一的質性研究無法滿足研究需求,適度匹配量化研究方法有助于使研究結果清晰、客觀,同時巨量的數據也為研究者提供了豐富的研究對象。
其次,在研究方法方面,新聞傳播學科中的量化研究方法主要有文本分析和利用統計學知識構建數學模型兩大類,通過分析1986年至2021年的研究數據,筆者發現,從只是簡單分析數量到構建復雜的數學模型,學者選取的量化方法難度越來越大。這是由于研究對象的復雜程度隨著媒介形式的升級不斷增加,從曾經以文本內容為主的紙媒到文字、圖片、視頻匯集的融媒體,媒介包含的信息數量越來越多,這些因素增加了學者的調查難度。
再次,通過對研究前沿的分析,筆者發現媒體融合、短視頻、新媒體、網絡輿情、社交媒體是使用量化方法的研究者比較偏好的領域,這也與當下的媒介發展趨勢相吻合,未來要持續關注新媒體發展的最新動向,結合實際進行調研分析,利用量化研究方法關注社會熱點問題,作出具有真正人文價值的研究。