胡熳華,王 翀,韓顯男
(1.中國農村技術開發中心,北京 100045;2.浙江農林大學,浙江 臨安 311300;3.中經社控股有限公司,北京 100053)
科普宣傳是利用公眾易于理解、接受和參與的方式來更好地普及自然科學和社會科學知識,在傳播科學思想的同時更好地弘揚科學精神和推廣科學技術。科普宣傳的根本目的是促進公眾理解和掌握科學技術,提高科學素質。科普宣傳的內容和時間比較自由,可以隨時把最新科學思想和最新科技成果向公眾傳播。科普宣傳的形式多樣,途徑靈活,因需施普,科普是具有群眾性和參與性的。因此,作為傳播信息的介質媒體在科普宣傳過程中起到了至關重要的作用。
隨著新一代數字技術、網絡技術、信息技術的發展和應用,承載信息介質的物質形態發生了革命性的變革,信息傳播途徑由報刊、戶外、廣播和電視等傳統媒體衍生出了新技術支撐體系下的新媒體[1]。微博、微信、數字雜志、數字報紙、移動電視、網絡、觸摸媒體等一系列新媒體的出現在迅速地改變著信息世界的接發方式。以微博為例,其設計理念是引導人們關注他感興趣的“人”,并與其建立“關注”與“被關注”的關系。人們在微博平臺上,圍繞包羅萬象的話題,建立起由“人”匯聚成的社區,并在社區里相互分享信息、新聞、創意和觀點。微博具備了信息傳播迅速及時、傳播面廣、反饋速度快、不受時空限制、傳播行為個性化等優勢。科普宣傳利用微博短小、及時、點對面的宣傳特點,微博圈內的每個人都成為科學精神宣傳的小喇叭[2-3]。在科普宣傳過程中,也可以通過建立主題微博圈,開展微訪談等多項微博活動。這些豐富多樣的創新模式可以更加廣泛地、系統地、高效地、全方位地宣傳貼近基層和百姓的科普活動[4-5]。
基于受眾廣泛性和參與深入性的特征,將新媒體應用于科普活動中會產生巨大的影響。同時,由于新媒體使得傳媒走向了基于數據庫的網絡運行平臺,如何充分挖掘數據信息反作用于科普宣傳,便成了輿情研究的重要課題。
目前國內較為權威的觀點認為,“輿情”是由個人及各種社會群體構成的公眾,在一定的歷史階段和社會空間內,對自己關心或與自身利益緊密相關的各種公共事務所持有的多種情緒、意愿、態度和意見交錯的總和。天津社會科學院輿情研究所的劉毅認為:網絡輿情是通過互聯網表達和傳播的,公眾對自己關心或與自身利益緊密相關的各種公共事務所持有的多種情緒、態度和意見交錯的總和[6]。
輿情分析需要將定性分析與定量分析相結合,充分利用人工分析和軟件的應用,對網絡言論進行挖掘和剖析,了解公眾輿論走勢與心理偏好。微博作為互聯網傳播方式具體形態之一,微博的輿情反饋對工作的順利開展具有重要意義。同時,通過實驗、示范、培訓、交流、服務,把科普與社會生活、生產實踐結合起來,可直接為社會和經濟發展服務。根據社會和經濟生活中的熱點問題開展科普是當前有效的、比較流行的方式,因此科普的社會性是顯著的,科普與人文科學相結合、突出對人的關愛是科普形式發展的又一新趨勢。
文本挖掘又稱為文字知識發現 (Knowledge Discovery from Text,KDT)或是文件信息勘探(Document Information Mining),特別著重于利用信息檢索、信息萃取、計算語言學、自然語言處理數據挖掘等技術,自非結構或半結構的文字中挖掘出先前未知、隱含而有用的信息,Dan Sullivan(2001)定義文本挖掘為“一種編輯、組織及分析大量文件的過程,為了提供特定用戶特定的信息,以及發現某些特征及其間的關聯”。
在對文本數據進行分析之前,需要對文本原始數據進行預處理,以排除原始數據中的一些無用或冗余的信息。最常用的方法有分詞技術與詞干提取。分詞 (tokenization)是將一段文本劃分為多個詞項,并去除文本中不表達任何語義信息的停止詞 (stop word)。停止詞指文中出現頻率較高,但是對確定文本主題幾乎沒有用處的詞,如英文文本中的a、the、that和中文文本中的“的”、 “是”、 “得”等。詞干提取(stemming)指去除單詞的詞綴,以得到單詞最一般寫法的過程,如將英文單詞復數“boxes”還原為單數“box”,或者將動詞的不同時態還原,如“stopped”還原為“stop”等。詞干提取可以避免同一個單詞的不同表示形式對文本分析的影響。
對文檔進行分詞和詞干提取處理后,得到表示該文檔的一組詞項稱為詞袋 (bag of words)。各種文本挖掘任務可以對提取的關鍵詞、標記或者語義信息進行,包括文本聚類、分類、信息提取、關聯分析和趨勢分析等。
基于關鍵詞的關聯分析輸入的是文檔中關鍵詞或詞的集合;此類分析收集頻繁一起出現的關鍵詞或詞匯,然后找出其關聯或相互聯系。關聯挖掘過程有助于找出復合關聯 (compound associate),即領域相關的術語或短語,或非復合關聯,如[美元,股票,交易,總額,證券]。
文檔自動分類是文本挖掘的重要任務。文檔分類已經用在自動主題標記、主題目錄構建、文檔寫作風格識別,以及對與文檔集合相關聯的超鏈接分類中。
文檔聚類是無監督方式組織文檔的最關鍵技術之一。最著名的聚類技術主要包括光譜聚類、混合模型聚類、使用潛在語義標引聚類和使用保持局部性標引聚類。其中,光譜聚類方法首先對原始數據運行光譜嵌入,然后對維度歸約后的文檔空間運用傳統的聚類算法。光譜聚類表明了處理高度非線性數據 (數據空間在每個局部區域都有比較高的曲率)的能力。與微分幾何學的緊密聯系使它能夠發現文檔空間中的流形結構。
通過對挖掘得到的信息進行綜合分析和評價來預測和評估輿情態勢。綜合評價是對總體中每個個體多方面特征指標的綜合比較,其基本方法是將反映每個個體的各個方面特征的多個指標綜合為一個可概括全面且便于比較的綜合指標,以反映其綜合水平。若將每個個體的綜合指標值按大小順序排隊,則可得到每個個體綜合發展水平的順序名次,為綜合評比提供了客觀依據,也能綜合反映輿情的關注熱點排名及趨勢。
本文所使用的文本信息為2012年“科技列車青海行”的新媒體數據資料。文本信息參與源類別為:“科技列車行”官方微博、三個支持單位官方微博和參與人員個人微博組成。其中,“科技列車青海行”微博活動的參與人員共有61人,占本次活動總人數117人的52.14%。工作人員、記者、農業專家及科普專家開通微博的人數占各類總人數的百分比均超過50%。在各類專家中,農業專家開通且使用微博的人數比例最大,達到了65.22%。由于醫療專家的職業特殊性,開通并且發布微博的人數占醫療專家總人數23人的17.39%(見表1)。

表1 “科技列車青海行”微博活動的參與人員統計表
文本信息質量和數量方面,所有科普活動參與人員在發布微博時都堅持“客觀、真實、準確”的原則,文明上網、理性發言。截至2012年5月30日,科技列車青海行微博圈中61位參與人員及3個微博支持單位共發布微博920條,連同網友共發布微博1200多條,“科技列車行”官方微博聽眾達35000余人。
微訪談是利用微博進行科普宣傳活動的一個重要內容,體現出了科普宣傳與時俱進、敢于創新的思路。活動期間,科技部中國農村技術開發中心邀請了14名列車行專家和相關領導,圍繞科技列車行回顧、農居抗震、兩彈精神、日常保健、農戶儲糧等主題開展了5場微訪談,有針對性地與網友開展互動話題。為了能夠更好地比較這五次微訪談的輿情和效果,采用綜合評價的方法進行測度。
(1)構建科普微訪談效果評價指標體系。評價指標體系的構成是進行綜合評價的首要環節。選取評價指標體系應以綜合評價的目的為依據,對所要考察的總體按評價的目的將所涉及的各方面指標進行收集,并篩選出最重要最具有代表性的若干個指標組成綜合評價的指標體系。
根據評價目標和數據可得性,通過對微博文本信息的分析將提問問題的數量、對問題的評論和轉發數量、專家回答問題數量、對回答評論和轉發數量這四個指標作為測量維度。同時,采用總和合成法建立綜合評價模型。
(2)各評價指標無量綱處理。對評價指標體系中各個觀測指標的無量綱處理,就是通過某種變換將各個觀測指標的計量單位消掉并使其數量級統一的變換過程。本文采用規格化變換方法來對各指標原始數據進行處理:
設xij為第i場微訪談的第j個指標,其中i=1,2,3,4,5;j=1,2,3,4。記觀測變量 xj在每個個體上的最小觀測值為xmin,最大觀測值為xmax,則規格化變換公式為:

經過規格化變換,消除了觀測變量的計量單位,變換后的指標值均在0和1之間。
(3)權數的確定:層次分析法。層次分析法是美國運籌學家T.L.Saaty教授于20世紀70年代初提出的一種定性和定量相結合的多目標決策方法,它把一個復雜問題分解成若干組成因素,并按支配關系形成層次結構,然后應用兩兩比較的方法確定各因素的相對重要性,然后計算各因素的權重,并以此為基礎實現排序。層次分析法簡便、靈活而實用,是一種系統化、層次化的分析方法,它為復雜評價問題的決策和排序提供了一種簡潔而實用的建模方法。
首先建立評價指標體系中各指標之間相對重要程度的判斷矩陣,設該判斷矩陣為A,則有A=(bij)m*m,其中元素bij為評價指標,zi對評價指標zj相對重要程度的比例標度,一般采用評分規則為:
若指標zi與zj同樣重要,則取bij=1,bji=1;
若指標zi比zj稍微重要,則取bij=3,bji=1/3;
若指標zi比zj明顯重要,則取bij=5,bji=1/5;
若指標zi比zj強烈重要,則取bij=7,bji=1/7;
若指標zi比zj極端重要,則取bij=9,bji=1/9;
若指標zi與zj比較,二者的重要性介于上述各相鄰判斷之間,則取bij=2,4,6,8;bji=1/2,1/4,1/6,1/8。

可將各個評價指標的重要性權數用一個向量表示,向量 W=(w1,w2,...wm)T,該向量是判斷矩陣的特征向量。
設向量V為判斷矩陣A與特征向量W的乘積,即:

得到計算結果見表2。

表2 層次分析法計算結果
因此,判斷矩陣的最大特征根λmax值為:

判斷矩陣的一般一致性指標CI為:

平均隨機一致性指標為RI=0.90,則判斷矩陣的隨機一致性比率CR為:

所以可認為判斷矩陣滿足一致性要求,故所求出的評價指標權數是合適的。
(4)計算綜合評價指數值。加權總和合成法是用加總求和的方法將無量綱化后的各個評價指標合成為一個綜合指標。計算公式為:

通過計算得到這五次微訪談的輿情效果綜合得分,對得分按照從大到小的順序進行排名,具體數據及結果見表3。
(5)微訪談輿情效果分析。結合綜合得分可以看出,關于“原子彈與脊梁”專題訪談得到了最多的關注度,網友共提出了26個問題,專家有針對性地回答了12個問題,回答問題率達到了46.15%。“農戶儲糧技術、雜糧營養和加工技術”的微訪談關注度排名第二,在網友提出的18個問題中有12個問題是關于農業方面的技術知識,專家的回答率在五個微訪談中是最高的,達到了66.67%。
以網友提出問題的內容進行分類,可以將問題分為技術類、政策類、支持條件類、“科技列車青海行”活動的信息類及其他共五大類。通過計算得到五次微訪談中不同類別問題數量占問題總數的百分比,具體數據見表4。

表3 綜合評價表

表4 微訪談信息類型分類表 (單位:%)
微博圈里每個人在第一時間報道活動內容,第一時間反饋網友提問,第一時間交流團隊內部信息,進一步提升這次活動與大眾的互動性,搭建了一個跨時空的新媒體科普服務平臺。微博圈的宣傳也遠遠超過了預期目標,它可以進一步提升科普活動與大眾的互動性,搭建了一個跨時空的新媒體科普服務平臺[7]。同時,通過微博中的圖片可以直觀了解活動情況、知識圖解等內容,更好地理解所傳遞的信息,增強了科學普及效果。
通過建立“科技列車青海行”主題頁面并向網友推薦促進了微博圈的形成,將專家及參與人員 (專家、記者、工作人員等)的個人微博納入并組建“微博圈”,發揮整體集群效應,使專家、網友、媒體記者、工作人員等緊緊聯系在了一起,每個人既是信息的發布者又是信息的接收者,以點對面,使活動組織者在第一時間了解各位專家開展服務的進展,大大增進了活動參與者之間的信息溝通與情感交流。
微博點對面的多級放大傳播方式突破了以往專家一對一、一對幾傳授知識的局限,通過微博這一新媒體跨時空、跨地域地傳播科普知識,擴大了科技服務和科學普及的范圍。另外,參與者在發布微博的同時還能上傳圖片,在普及科學的同時也使受教者能夠通過圖片直觀地了解活動情況、知識圖解等,能夠更好地理解所接受的信息,增強了科學普及的效果。
[1]王元,許曄.迎接“第五媒體”重大技術變革的挑戰[J].中國科技論壇,2010,(6):5-8.
[2]許曄.微博正在改變世界的創新應用[J].中國科技論壇,2012,(8):23-27.
[3]鄭婧伶.公安微博的功能與角色定位[J].傳媒:MEDIA,2012,6:73-74.
[4]張光斌.科普期刊的微博內容分析及其應用研究——以新浪微博為例[J].科技與出版,2012,6:106-109.
[5]廖金寶.微博輔助思政課教學的實踐探究[J].恩施職業技術學院學報(綜合版),2011,23(3):21-23.
[6]劉毅.網絡輿情研究概論[M].天津:天津人民出版社.2007.
[7]曲彬赫,冷盈盈.新媒體時代的科普信息傳播[J].科協論壇,2011,3:46-48.