邢曉光
摘要:隨著大數據時代的到來,傳播學研究的主要方法逐步由以抽樣調查為主的傳統方式向綜合利用大數據參與的新方法轉變。本文將重點展示數據挖掘技術在傳播學研究領域內的應用案例,并將之與傳統研究方法進行比較,對二者在研究目的、研究手段、研究過程及其邏輯等方面進行區別,從而說明大數據處理信息方式對傳播學在方法論上的積極影響。
關鍵詞:大數據;傳播學;研究方式;轉變
1 傳統抽樣隨機樣本轉變為大數據方法下的全體數據
在新聞傳播學領域,針對一般受訪者測量其認知、態度與行為選擇時,傳統的研究方法以隨機抽樣或固定樣本為主,具體通過深度訪談、問卷調查、實驗法等方式。隨著社交媒體深入人們的生活,人們表現自我的方式更為個性化、多元化,展現的渠道也日益多樣化。在此背景下,研究人員可以通過在網絡上對研究對象的“電子蹤跡”進行搜索、采集、分析、發掘和利用,即可獲得足以反饋其心理動向與行為舉止的海量數據。這就是將大數據方法引入傳播學研究領域的重要表現。并且,大數據研究方法,可以輕松捕捉與處理一些傳統抽樣方法無法采集的細節信息。比如,受到樣本數量的限制,以往的抽樣方法往往無法呈現出30歲以下、接受過大學教育、年收入10萬以上、定居于城市的女性研究對象的情況。顯然,數據挖掘技術彌補了新聞傳播學傳統研究方法上的不足。
需要說明的是,利用數據挖掘技術在傳播學之中進行研究與調查,是具有特定對象、具體主體的數據搜集與處理,譬如某部電影的票房數據、某個公眾號的用戶數據等等,換句話說,是采用了累進的在線網民數據的不斷更新而獲得的樣本,并不是隨機樣本。這種樣本的實際質量與傳統方式得到的樣本質量,沒有絕對的偏向優劣。在一些具體的案例上,大數據處理信息的方法,并不能完全替代過去的抽樣調查。
2 傳統方法與大數據方式在研究目的上的區別
在傳播學研究領域,過去常用的抽樣調查方法,是以追求因果關系為第一研究目標的。這種因果關系的成立,必須首先滿足由因及果的時間順序關系,結果隨原因的變化而變化的共變關系,因果二者之外無其他影響變量的非虛假關系。
相較于此,大數據方法之下,研究人員首先著眼的是研究因素的相關性,比如電影票房與網絡搜索數量之間不存在邏輯上的因果聯系,但是存在著一定的相關性。因此,傳播學的傳統研究方法,可以描述事情的狀況,也可以表述傳播理論,但應用數據發掘與分析技術的方法,則可以更多傾向于對事件發展的預測,在現代商業市場之中具備更高的實際價值與利用潛力。而在理論研究領域,大數據方法也能夠解釋一些長期未有定論或進展的話題。
3 大數據方法放棄了追求處理信息的精確性
與傳統處理方法后能夠保證并追求數據的精確性不同,大數據方法處理現代數字信息時往往需要降低或放棄這種精確度。主要的原因如下:
第一,海量樣本數據。首先,傳統抽樣調查之中,可供搜集研究的樣本往往有限,研究人員客觀條件下需保證樣本數據的精確度,其中采用一些能夠減少錯誤產生概率的方法和策略,對數據進行整理和補充,都是具備可操作性的。但是這種清理數據的方式,在大數據方法之下無法實行,首要原因就是樣本數量龐大,人工復查不現實;其次就是大數據方法搜羅的信息無法保證標準完全一致;最重要的是,當今市場交易中,數據量的龐大在商業領域上能夠創造的價值遠高于傳統調查之中的一點精確性。需要說明的是,從統計學的角度上看,傳統抽樣調查方法以概率獲取樣本,能夠在抽取樣本的過程中減少人為誤差,進而確保了樣本具備代表性,但是通過大數據方法往往不以概率抽取,樣本實際不具備帶表情,誤差存在且一般較大。
第二,平均值接近定值。當數據基數越大時,其平均值將愈加接近一個固定的平均值;單薄的個體資料可能容易出現錯誤,但是總體性的數據其平均后傾向于某個定值,這就是所謂的“平均人”理論。在大數據應用過程中尤為明顯,以挖掘網絡民眾的收入資料為例,其中一部分網民會適當減少收入數據,而有的則會做出相反的行為選擇,最終結果平均值往往接近一個定值。
第三,數字資料非結構化。當今網絡之中大約95%的數字資料具有非結構化特征,這與傳統研究之中充斥的大量結構化數據有極大的不同。非結構化數字信息包括,圖片、視頻等等,這些內容難以精確化,只有在保證其自身多元、多樣的基礎之上,才能為應用數據挖掘與分析技術提供可能性。
此外,相對于傳統研究結果只能單一通過文字或圖表來呈現的情況,大數據對新聞傳播領域話題的表達有更多可視化展現方法,包括圖解、圖形、動畫等等。通過大數據可視化方法傳遞的信息內容,減少了傳統方式的乏味與枯燥,提高了數據的可閱讀性與生動性,增強了讀者與文本之間的互動性。
4 結語
隨著大數據時代的到來,數據挖掘技術與海量樣本信息為新聞傳播研究領域帶來一場革命性的變化,特別在調查方法與研究理念上,新的技術手段對整個學界產生了深刻的影響。然而,新事物在發展過程之中,需要一定時間為大眾所接受,這一方面出于受眾自身的主觀因素,同時也出于技術本身就是雙刃劍,大數據研究方法也不例外。作為一種工具、手段的大數據研究方法,與傳播學傳統調查方法一樣,研究人員在利用之時必須趨利避害,具體問題具體分析,在恰當的主題與合適的語境之下充分發揮大數據對新聞傳播學的研究價值。
參考文獻:
[1]倪寧,金韶.大數據時代的精準廣告及其傳播策略——基于場域理論視角[J].現代傳播(中國傳媒大學學報),2014(02).
[2]楊雅.大數據分析與可視化技術:新聞傳播的新范式——“大數據與新聞傳播創新”研討會綜述[J].國際新聞界,2014(03).
[3]劉義昆.大數據時代的數據新聞生產:現狀、影響與反思[J].現代傳播(中國傳媒大學學報),2014(11).
[4]胥琳佳.大數據對于傳播學研究內容和方法的影響——基于社交媒體和移動互聯網的思考[J].中國出版,2013(18).