杜明英 楊珊珊 高向輝 吳倩



內容摘要:根據食品安全網絡輿情的影響因素,本文從輿情關注度、輿情活躍度、輿情受眾、輿情傳播4個角度構建食品安全網絡預警指標體系,利用八爪魚采集軟件從百度和新浪微博抓取輿情指標數據。基于熵值法和層次分析法(AHP)構建模糊綜合評價模型,并且以“福喜過期肉事件”為例進行實證分析,確定了該事件各階段的輿情預警等級。實例表明該模型合理有效,具有可操作性,為政府部門食品安全網絡輿情的預警研究提供了理論基礎。
關鍵詞:食品安全 網絡輿情 模糊綜合評價 熵值法 層次分析法
引言及文獻綜述
隨著互聯網的普及,中國網民人數不斷上升,網絡信息時代己經到來,互聯網憑借其自身的開放性、即時性與交互性等特征已成為公眾獲取、發布和分享信息的重要平臺。近年來我國食品安全事件頻發,食品質量安全問題已引起越來越多的社會關注,食品質量安全網絡輿情成為公眾追捧熱議、政府高度關注的焦點,相關政府部門將加強食品網絡輿情預警和信息發布工作放在了較為突出的位置。
國內學者從食品安全網絡輿情預警的指標和方法方面進行研究。林文聲(2016)等通過問卷調查和客觀指標統計相結合的方式,構建了4個一級指標、9個二級指標和22個三級指標的食品安全事件網絡輿情熱度評價指標體系。馮姝慧(2015)從輿情來源指標、傳播擴散指標、公眾關注指標、發展傾向指標4個維度構建食品安全網絡輿情的監測與預警體系。王鐵套(2012)利用模糊綜合評價法的威脅估計樣本訓練方法,設計了一種基于BP神經網絡的網絡輿情威脅估計模型,為食品安全網絡輿情預警方法研究提供了參考依據。陳愷(2015)提出了基于改進關聯規則-改進熵權AHP-BP神經網絡的預警分析研究方法。
國外從預警模型等方面對食品安全網絡輿情進行相關研究。Geng(2017)利用層次分析法的極限學習機(AHP-ELM)預警建模來處理食品安全中復雜的食品檢驗數據方面的問題。Wang(2017)提出的一種改進的基于模糊分類和神經網絡的食品安全預警系統,采用挖掘技術和互聯網技術及時監控整個供應鏈的所有檢測數據并自動預警。國外政府也相當重視食品安全問題,歐洲食品安全局(EFSA)(2014)發布了食品安全交流戰略,確定了風險交流的工具、渠道以及評估方法。
國內研究主要集中在網絡輿情預警方法的研究,部分文獻對食品安全預警進行了實證研究,國外主要從食品檢驗、食品安全、網絡安全等其他方面建立輿情預警模型,從而應用于食品安全網絡輿情預警。綜合國內外研究,對食品安全網絡輿情指標設計、評價及預警直接研究較少,本文運用模糊模型對食品安全網絡輿情指標評價及預警進行理論與實證研究。
食品安全網絡輿情預警指標體系構建
(一)指標體系構建
建立輿情預警指標體系,需要遵循可行性、準確性、整體性、定性和定量并行的原則,并分析影響食品安全網絡的因素。因此,本文依據以上設計指標原則和食品安全輿情的特點,構建4個一級指標和15個二級指標的食品安全網絡輿情預警體系,如圖1所示。
本文從輿情關注度、輿情活躍度、輿情受眾、輿情傳播等角度建立食品安全網絡輿情預警指標體系:
輿情關注度包括新聞媒體來源數和新聞搜索量。新聞搜索量是指各新聞媒體在相應時間段內發布相關食品輿情的新聞數量;新聞媒體來源數是指對百度新聞標題搜索結果進行分詞,與權威(食品)新聞網站進行匹配,計算此輿情事件出現在這些網站的次數。
輿情活躍度包括原創微博發布、評論、點贊條數和微博轉發數,是指相應時間段內在微博上發布、轉發、評論、點贊的相關食品輿情的微博數量。通過新浪微博搜索食品輿情事件關鍵詞,利用高級搜索工具,自定義搜索時間段,抓取所需要的微博內容。
輿情受眾包括參與頻度、受眾傾向和受眾影響力。參與頻度是指網民參與討論某一食品輿情事件的程度,發布、轉發、評論、點贊此輿情的總次數;受眾傾向是指網民對某一食品輿情事件的正面、中性、負面的情感傾向程度;受眾影響力是指網民對食品輿情事件發布的信息所引發的共鳴程度。
輿情傳播包括輿情演化程度、新聞搜索量變化率、微博數量變化率和解析度。輿情演化程度是指此食品輿情事件可能引發相關食品相關問題被討論的新聞數;微博(新聞)數量變化率是指發布、轉發、評論的微博(新聞)輿情在兩個連續統計時間段內輿情差值之比。解析度是指網民對食品質量安全輿情事件呈現出來的信息的思考情況,反映網民對微博參與的意愿程度,是微博總點擊量與微博評論數的比值。
(二)數據獲取
食品安全事件每年都有發生,2014年發生的“福喜過期肉事件”涉及面較廣、影響較惡劣,成為食品質量安全熱點事件之一,因此本文以“福喜過期肉事件”為例進行數據處理與模型分析。2014年7月20日,據東方衛視晚間新聞報道,曝光了麥當勞、肯德基等洋快餐供應商上海福喜食品公司使用過期劣質肉而被調查,福喜將加工的過期肉制品銷售給肯德基、麥當勞等大部分快餐店,同時也引發了人們對“過期肉”、“劣質肉”等一系列食品問題的討論。
根據建立的食品安全網絡輿情指標體系,利用八爪魚采集軟件(http://www.bazhuayu.com/)從百度和新浪微博抓取了“福喜過期肉事件”的輿情數據。由于食品安全網絡輿情事件有其特定的生命周期,網絡輿情事件也有其時間點,首先依據“生命周期理論”確定網絡輿情的發生周期,結合食品安全網絡輿情的發展特點確定了抓取數據的整體時間段為1個月,以2天為一個小節點來抓取,每個事件包含15個采集時間節點;其次根據“蝴蝶效應”理論分別確定了這10個事件的演化詞,抓取演化詞的數據得到演化程度的輿情數據;最后食品安全網絡輿情指標數據均可通過直接抓取和進行處理得到,得到“福喜過期肉事件”的輿情指標數據,如表1所示。
食品安全網絡輿情預警模型構建
本文所建立的是模糊綜合評價模型,即在模糊數學理論的基礎上,對多個因素進行定量化綜合評價,需要對多個因素計算其隸屬于被評估事物等級的情況,從而對多個因素對被評價事物隸屬等級狀況進行綜合評價。
(一)確定指標集
根據影響食品質量安全網絡輿情發展的因素構建指標集,指標集也就是因素集。設U={u1,u2,…,um}為所有評價因素組成的指標集合,其中m代表評判指標個數。本文需要對輿情事件各階段輿情等級進行評定而不是對輿情事件整體評價,主要使用二級指標進行評價,因此m=15。
(二)確定評語集
評語集是評判者對評判對象可能做出各種總的評判結果所組成的集合,設V={v1,v2,…,vn}為所有評語組成的集合,其中n表示可能的評判結果個數。根據《國家突發公共事件總體應急預案》將預警級別劃分為四級(Ⅰ、Ⅱ、Ⅲ、Ⅳ),預警狀態分別為特別嚴重、嚴重、較重、一般,n=4,定義為V={v1,v2,v3,v4},即V={特別嚴重,嚴重,較重,一般}。采用等級評分制,以對應的預警評價分值區間對應于各等級,根據相關資料查閱和相關專家咨詢建議,評分區間為[0,100],如表2所示。
(三)建立權重集
在食品安全網絡輿情預警的研究中,各指標重要程度不一樣,需要對各評價指標賦予一定權重,為了更合理準確得出評價結果,本文采用主觀賦權法和客觀賦權法的混合賦權法進行賦權,而主觀賦權法采用AHP法(層次分析法)進行指標賦權,客觀賦權法采用熵值法進行賦權。
利用熵值法確立權重。熵值法的基本思路是根據指標變異性的大小來確定客觀權重,是一種客觀賦權法。熵值法賦權步驟如下:
數據歸一化。將各個指標數據進行歸一化處理。假定給了k個指標X1,X2,…,Xk,其中Xi={x1,x2,…,xn},k為指標個數,假設各指標數據標準化后的值為Y1,Y2,…,Yk,那么。
計算各指標的信息熵。根據信息熵的定義,得出信息熵的公式為,其中。
計算信息熵冗余度。冗余度的公式為dj=1-ej。
計算各指標權重。將dj歸一化處理,指標權重為,最后權重向量為Wa=(w1,w2,…,wk)。
根據以上步驟得到二級指標A1-D15的權重:Wa=(0.0251、0.0444、0.0605、0.1235、0.0838、0.0647、0.2614、0.0238、0.0245、0.0404、0.0381、0.0384、0.0747、0.0570、0.0397)
利用層次分析法(AHP)賦權。對于指標集中賦權時可以利用層次分析法的1-9標度法,在兩兩元素進行判斷的基礎上寫出判斷矩陣,然后通過計算判斷矩陣的最大特征根及其對應的特征向量,計算表示指標相對重要性的權值。
建立遞階層次結構模型。層次結構模型是類似于決策目標體系的結構,對于簡單的問題一般可以分為三層結構,第一層為目標層(T),第二層為準則層(G),第三層為方案層(P),本文構建的層次結構模型如圖2所示。
建立兩兩比較的判斷矩陣。為了便于將比較判斷定量化,層次分析法采用1-9比率標度方法,如表3所示,對不同情況的評比給出數量標度進行兩兩比較,得到判斷矩陣(T-G,G-P),判斷矩陣表示針對上一層次某元素,本層次與它有關元素之間相對重要性的比較。
為了比較食品安全網絡輿情各指標之間的重要程度,設計問卷邀請研究食品安全網絡輿情方面的專家進行打分,指標體系共設計了兩層指標,各專家根據經驗對每一層次指標相對它所屬上一級指標的重要程度進行兩兩比較,然后結合1-9標度的分級比例參考表由低到高進行打分。本次調查共向10位專家發放問卷,回收有效問卷9份,在合理的問卷調查范圍內,首先計算各個專家的判斷矩陣,分別得到其權重,然后對所有專家對應的各個判斷矩陣權重進行幾何或算術平均,得到一套多個判斷矩陣的權重,最后進行組合權重計算。
計算各矩陣的最大特征值λmax及其對應的特征向量。根據建立的判斷矩陣A,使用求和法得到特征向量wT,wA,wB,wC,wD和最大特征值,其中n為判斷矩陣階數。
矩陣的一致性檢驗。層次分析法保持判斷思維的一致性是非常重要的,引入判斷矩陣一致性指標CI(Consistency Index)和隨機一致性檢驗CR(Consistency Ratio)。對于多階判斷矩陣,則引入平均隨機一致性指標RI(Random Index),隨機一致性CR=CI/RI,RI值如表4所示。
當階數n≤3時,判斷矩陣永遠具有完全一致性。當階數n>3,CR<0.10時,便認為判斷矩陣具有可以接受的一致性;當CR≥0.10時,就需要調整和修正判斷矩陣,使其滿足CR<0.10,從而具有滿意的一致性。
組合權重計算。經過計算得到準則層權重向量為wT=(0.1871、0.2418、0.2182、0.3529),方案層初始權重向量分別為wA=(0.7351、0.2649),wB=(0.2173、0.2536、0.3790、0.1501),wC=(0.3842、0.2534、0.3624),wD=(0.1009、0.1193、0.1758、0.1748、0.2170、0.2121),基于此,得到方案層A1-D15各評價指標的組合權重計算結果Wb=(w1,w2,…,wk),如表5所示。
混合賦權法。混合賦權法的計算公式為W=σWa*?Wb,其中Wa為客觀權重向量,Wb為主觀權重向量,0 (四)計算隸屬度并構造評價矩陣 計算隸屬度。根據已獲得的食品安全輿情指標數據并利用隸屬函數計算各指標輿情隸屬度。通過分析指標數據,比較各隸屬度函數分布規律,發現各指標的隸屬函數的大致曲線與半梯形偏大型分布相似,所以采用半梯形偏大型分布作為各指標的隸屬函數。各指標的隸屬函數為: