吳新麗 李云飛 高金



摘 ?要:大數據的運用已由簡單的數據積累過渡到深度開發利用數據的嶄新階段,隨著新冠肺炎疫情的持續發酵,為打好這場保衛人民健康安全的防疫之戰,新華網依托自身技術優勢,快速推出“睿思戰‘疫——大數據洞察新冠肺炎疫情動態”大數據服務和《抗擊疫情·睿思這么看》系列報道,對疫情下的熱點話題進行深度挖掘和數據可視化分析。從網民視角出發,用理性數據分析紓解網民情緒,引導網民正確看待疫情和疫情防控。
關鍵詞:新華睿思;新冠肺炎;數據可視化;大數據;媒體融合
中圖分類號:G237 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A
本文著錄格式:吳新麗,李云飛,高金.睿思戰“疫”——媒體大數據創新實踐[J].中國傳媒科技,2020,03(03):11-14.
當前,大數據和人工智能等前沿技術的創新和運用已成為推動媒體融合發展的重要引擎之一,大數據的運用已由簡單的數據積累過渡到深度開發利用數據的嶄新階段。在新一輪媒體變革和技術革命中,新華網踐行“數字中國”國家大數據戰略,以技術為引領,主動出擊,重點布局,將人工智能、大數據等新技術融入業務各環節中,積極探索數據驅動型媒體創新方向,著力自主研發并推廣應用“新華睿思數據大數據產品矩陣”,助力新華網數字內容生態體系建設。
1.新華睿思大數據技術創新與應用
在DT時代,數據作為基礎資源,是利用大數據、人工智能技術推動媒體融合發展的重要前提。新華網自2017年開始建設新華睿思數據資源池,資源池覆蓋當前互聯網上各類公開數據,累計存儲數據量超過620億條,正在以日均1億條數據體量的速度增長。新華睿思數據資源池已成為新華網在數字內容生態發展建設工作中的重要數據礦產。
在技術深耕方面,重點發力數據挖掘分析領域,打造新一代睿思智能分析技術體系,潛心研究并實現多項人工智能算法引擎創新,包括信息分類預測、熱點智能識別、情感極性預測、跨信源傳播追溯、事件演化分析、網民情緒感知、中文熱詞提取等數款數據挖掘分析引擎,申請多項大數據和AI領域技術發明專利,讓技術賦能內容生產全流程。
隨著新冠肺炎疫情的持續發酵,為打好這場保衛人民健康安全的防疫之戰,新華網大數據中心依托自身技術優勢,快速推出“睿思戰‘疫——大數據洞察新冠肺炎疫情動態”大數據服務和《抗擊疫情·睿思這么看》系列報道,用大數據和人工智能技術助力疫情防控。
2.大數據在“疫情”背景下的創新應用——睿思戰“疫”
“睿思戰‘疫——大數據洞察新冠肺炎疫情動態”信息服務實時采集并呈現疫情相關信息,為社會公眾提供多維度的大數據信息服務。睿思戰“疫”信息服務包括五部分:
2.1全國疫情數據可視化分析服務
基于新華睿思獨有的網民情緒感知分析模型、事件演化分析模型以及情感極性預測模型等文本挖掘分析模型,在智能匯聚互聯網上全國疫情相關信息的基礎上,從關注趨勢變化、熱議詞云、網民情緒、熱點話題等多角度、可視化呈現媒體和網民對全國疫情的關注情況。
全國疫情詞云分析:在統計學習基礎上,融合中心詞特征權重、中心詞位置關系、主題分布和搜索規則等多種加權計算策略,從海量新聞、微博、微信等最新疫情信息動態中智能提取最熱關鍵詞并以詞云的方式呈現給用戶。
網民情緒分析:采用TensorFlow的Keras深度學習框架,通過雙向長短期記憶層、注意力機制等神經網絡模型,從海量的互聯網數據中學習網民情緒特征,從語義層面解析在全國抗疫過程中網民行為承載的真實情緒,以雷達圖的形式直觀呈現網民情緒的波動變化。
熱點話題TOP3:采用Spark core+KMeans++大數據聚類技術,優化全局最優K值選擇算法,降低算法局部最優概率,實現對新聞資訊、微信公眾號文章以及長微博等長文本類疫情信息的智能熱點挖掘,為用戶推送疫情最熱議題。
2.2基于信息自動分類算法的信息推薦服務
信息分類預測引擎基于淺層神經網絡分類技術,創新融合大數據和多層Softmax& Huffman樹的深度學習算法對長文本信息進行智能類別劃分,結合公眾關心的疫情多方面動態,提供權威發布、疫情速報、藥物研發、防控科普等十大信息專欄,通過提供實時可靠的疫情信息,全方位幫助公眾了解疫情發展動態和最新抗疫進展。
2.3基于地理位置信息的屬地疫情動態服務
結合全國不同地區公眾對疫情信息的個性化需求,根據用戶所在地理位置,自動定位所在省份,分析該省份的疫情發展趨勢和最新疫情動態,幫助用戶從海量疫情資訊中快速獲取屬地疫情信息。
2.4區域風險查詢服務
與聯通大數據共同打造區域風險查詢服務,支持全國各城市社區級疫情風險免費查詢,為公眾提供自身所在周邊社區疫情風險級別查詢以及所在區縣疫情風險指數查詢服務。
2.5城市動態查詢服務
聯通大數據聯手打造城市動態查詢服務,免費提供340余座城市的實時動態。通過城市返程率、出行強度、流動人口感知等信息服務,為城市管理部門應對防疫壓力帶來幫助,同時也為公眾返程出行提供數據參考。
3.大數據賦能媒體內容生產——《抗擊疫情·睿思這么看》
大數據新聞是基于大數據技術和思維發展而產生的全新報道模式。數據驅動新聞生產,代表了未來新聞發展的一種趨勢,這種生產模式隨著大數據技術的發展和成熟,以及與新媒體傳播環境的融合,正在進入規模化生產時代。
新華網大數據中心從2019年開始嘗試大數據可視化新聞生產,以新華睿思大數據平臺為依托推出《睿思一刻》欄目,運行近一年成果斐然,展現了大數據在新聞領域的長線、全線優勢。新冠肺炎疫情發生后,立足于國家重點新聞媒體的責任和使命,再次傾力打造《抗擊疫情·睿思這么看》系列報道,對疫情下的熱點話題進行深度挖掘和數據可視化分析。從網民視角出發,用理性數據分析紓解網民情緒,引導網民正確看待疫情和疫情防控。
系列報道在1月28日與讀者見面,在新華網客戶端首屏、PC端首頁、微博、微信同步更新,截至3月9日已累計發布26期,系列報道單篇閱讀量最高突破1000萬次,在同類報道中遙遙領先,為新冠肺炎疫情報道添以“數據溫情”。
3.1基于全網公開數據,展現真實的全民戰“疫”,成為信息汪洋中網民信賴的“權威信源”
《抗擊疫情·睿思這么看》系列報道基于客觀數據采集和分析,將選題策劃由經驗驅動和情感驅動轉變為數據驅動,在實現選題策劃數據化、智能化的同時,也真正實現了貼近“民心”、反映“民聲”。系列報道中“抗擊疫情,網民在關注”版塊,為讀者呈現每日疫情相關的權威信息匯總。
此外,抗擊疫情中,社交媒體異常活躍,致使各種未經證實的信息混雜網絡,擾亂輿論場秩序,為疫情防控工作的開展造成了混亂和阻礙,公眾也在信息汪洋中無所適從。《抗擊疫情·睿思這么看》系列報道利用“網民關注度模型”,對公開網絡數據進行多維度分析,將網民最關心、最迫切、最擔憂的問題和國家聯防聯控形勢相結合,提供豐富、客觀的數據基礎、事實真相和觀點分析,在社會動員、凝聚共識、穩定大局、團結鼓勁方面發揮著重要作用,成為網民信賴的“權威信源”。
3.2重視用戶體驗,提供廣度、速度和深度兼備的融合新聞服務
《抗擊疫情·睿思這么看》系列報道重視用戶體驗和閱讀習慣,在便捷性、使用感、互動感、閱讀感、可視化、數據化等多個方面強化升級用戶交互式體驗。
從發布平臺上,《抗擊疫情·睿思這么看》系列報道在每天晚上9:00前后的手機閱讀高峰時段在新華網客戶端首屏發布,利用雙技術平臺(新聞資訊APP+大數據技術平臺)優勢,實現交互式體驗“跳躍”升級。同時,作為新華網“新冠肺炎疫情”重點策劃報道在新華網PC端、官方微博@新華網和官方微信同時段推送,全面提升信息送達率。
從報道形態上,大數據可視化新聞的報道形態更加靈活,以全時性數據為支撐、以動態圖像設計為手段,呈現事件及話題的傳播趨勢、話題演變、網民情緒演化,新聞不僅在視覺效果中動起來,更在內容上動起來。
從報道深度上,大數據技術在選題策劃、數據采集、數據挖掘、數據分析階段實現全鏈的智能化新聞內容生產,大大提升了原創內容生產的效率,降低人力占有率,甚至完成了依靠人力無法實現的新聞初加工,全面推動了媒體生產效能的提升,為新聞服務兼具廣度、速度和深度提供了可能性。同時,應對“新冠肺炎疫情”報道中不斷涌現的話題和熱點,大數據解讀給讀者呈現了全新的思維方式和方向。
3.3在政策解讀和社會動員中,肩負起新聞媒體的社會責任,傳播抗“疫”正能量
這是一場醫療戰,更是一場信息戰,親赴一線的不只有廣大醫療工作者,還有傳遞疫情聲音的媒體工作者。疫情發展至今,主流媒體勇擔使命,始終走在“抗疫防疫”第一線。《抗擊疫情·睿思這么看》系列報道從不同角度,宣傳黨中央重大決策部署和各地有力措施,講述防疫抗疫中的先進事跡和動人故事,作為重點新聞網站抗疫報道的一塊磚石,迅速轉入抗疫防疫報道“戰時”狀態,認真履行新聞媒體的社會責任。
系列報道以大數據技術創新助力全媒體生態和內容產業鏈,使主流媒體的聲音更具時代特征:強信心、暖人心、聚民心,有特色、有亮點、有依據。這種新聞模型也迅速得到輿論回應,為抗疫宣傳工作提供全面精準的“一手”信息反饋,這種數據服務、新聞報道與民生關切的“多向回應”是大數據優勢的集中體現。
3.4自有數據庫不斷豐富,反哺聯防聯控、精準施策等領域研究
目前《抗擊疫情·睿思這么看》系列報道中所積累的數據資源和研判語料,已經成為相關社會問題、經濟問題研究的重要數據庫,數據成果一方面推動技術平臺針對性、精準度的發展,另一方面也為聯防聯控、精準施策提供了數據參考和成效校驗。目前系列報道已正式推出“睿思數據觀”欄目,對不斷積累的數據資源進行進一步的挖掘和研判。
結語
疫情是個“自帶流量”的話題。而當疫情遇到社交媒體高度活躍的2020,真假信息的威力都將被無限放大。從傳播的角度,中國輿論場正在面臨一場不亞于“新冠肺炎疫情”的“信息疫情”,但正是這場疫情,讓我們看到了主流媒體價值和公信力的強勢回歸。以新華睿思為代表的主流媒體大數據平臺將作為這場防疫抗疫戰斗中的“彈藥武器”,以技術手段和產業應用全面加持疫情防控和新聞宣傳工作。疫情是對中國政府治理體系和治理能力現代化的一場大考,也是對主流媒體能否在其中履行自己新聞使命的一場大考。抗擊疫情,媒體在行動,大數據在行動,新華睿思在行動。
[1]劉思揚.鞏固內容創新優勢 建設新型主流媒體[J].傳媒,2020(2):13-14.
[2]彭蘭.智媒趨勢下內容生產中的人機關系[J].上海交通大學學報(哲學社會科學版),2020,28(1):31-40.
作者簡介:吳新麗(1980-),女,河北人,新華網股份有限公司副總工程師兼大數據中心總經理,研究方向:互聯網數據采集、自然語言處理及數據挖掘、輿情大數據、媒體大數據等領域大數據應用;李云飛(1988-),女,山西人,新華網股份有限公司大數據中心產品總監,研究方向:輿情大數據、媒體大數據等領域大數據應用;高金(1988-),女, 山東人,新華網股份有限公司大數據中心分析總監,研究方向:大數據分析、智庫服務。