金靚
摘要:大數據技術越來越多的應用于各個行業,很多單位也在規劃建設與自己行業相關的專業性大數據系統,在收集好自有數據、行業數據等數據的基礎上,充分地利用好數據,發掘出數據的價值是如今數據時代必須要解決的問題。本文以安徽日報報業集團新聞大數據平臺項目作為實例,介紹了平臺的規劃設計與具體實現方式,分析了建成使用后的效果。
關鍵詞:大數據;輿情;數據資產;人工智能
中圖分類號:TP391? ? 文獻標識碼:A
文章編號:1009-3044(2021)26-0022-03
開放科學(資源服務)標識碼(OSID):
1 新聞大數據現狀與背景
隨著云時代的到來,與云計算相輔相成的大數據得到了突飛猛進的發展,大數據已經逐步用于各行各業之中。雖然對數據的挖掘再利用的能力暫時是有限的,但數據的收集早已無時無刻、無所不在。從交通出行到酒店客房,從訂餐購物到新聞閱讀,我們不斷地收集著各類數據,但如何有效地對這些數據進行清洗、管理、加工、利用成為迫在眉睫需要解決的問題。
而與此同時,媒體行業的發展正在從紙質時代飛躍進多端展示的互聯網時代,推動媒體融合發展,是黨中央鞏固宣傳思想文化陣地、壯大主流思想輿論的重大戰略部署,也是傳統媒體轉型的必經之路。地方媒體特別是省級媒體把媒體融合發展作為“再次創業”的良機,大力實施各項媒體融合工程,積極投身融合發展,將資源、技術、發展重心向移動端和融媒體傾斜,探索出了許多媒體融合的創新路徑。
安徽日報報業集團近年來積極推進媒體融合發展,集合全集團之力著力打造多項媒體融合項目,將傳統媒體與新興媒體的優勢互補,既鞏固了老陣地,也拓展了新領域,使黨報的覆蓋面進一步擴大,傳播力、公信力、影響力進一步增強,主基調更鮮明,主旋律更高昂,正能量更強勁。安徽日報新聞大數據平臺便是云時代大數據技術在傳統媒體行業中創新應用。
2 平臺建設目標與需求
安徽日報新聞大數據平臺項目建設是為進一步推進集團的媒體融合發展,實現媒體資源統一調度,合理分配、資源共享,從而構建起新型的內容生產網絡。項目以數據驅動內容生產、以技術監測傳播效果,圍繞構建“一次采集、多種生成、多元傳播”的格局,打通報、網、微、端各個端口,加強融媒體“現象級”產品創作生產和傳播,建設以融媒體矩陣為主的報社全媒體內容生產優化重點工程,將切實提升黨報的宣傳報道效果和輿論引導水平,逐步構建起品牌傳播形象,從而再度提升安徽日報報業集團的核心競爭力。
安徽日報新聞大數據平臺作為媒體融合的核心系統,包含多個子系統的建設,利用各系統對整體業務進行管理運營,通過標準化接口對接各類應用實現資源共享,并能夠對傳播效果跟蹤監測形成可視化數據,為媒體融合發展提供強力技術支持,通過數據為各類應用的發展指導方向。系統平臺的建設,將主要實現了以下需求功能:
1)為政府相關部門掌握傳播導向、提供實時輿情監控分析服務。通過對全網各類新聞事件、突發事件等的實時監測,分析新聞報道的被關注度、傳播量、傳播速度等,第一時間發出預警,及時進行輿情響應,幫助政府職能部門有效提高新聞輿論可控度;
2)為集團決策層針對安徽日報的引導力、影響力提供全方位的決策支持。傳播中央和省級黨委和政府的聲音,及時有效地收集民聲民意;
3)通過全網搜索和數據分析等自動化信息抓取技術,幫助集團所屬媒體發布的各個端口的信息資源全面打通融合;
4)應用大數據分析技術,通過計算機學習及人工智能手段,提供全網即時準確的結構化內容數據,提供新聞熱點和新聞線索的挖掘,為記者編輯的內容生產提供一體化支持;
5)運用多種成熟的大數據產品,對新聞稿件傳播效果的進行監測,對稿件的傳播影響力、媒體端口傳播的影響力進行量化分析和持續跟蹤;
6)從多個環節量化全媒體采編人員的工作情況,以科學的數據為采編人員績效的考核提供更有力的數據支撐;
7)全面實現內容數據化、移動化、智能化的融合云服務,建設集團數據資產,通過數據資產運營,提升集團的經濟效益,完成集團由媒體向運營平臺的轉型發展。
3 平臺的設計與實現
安徽日報新聞大數據平臺以全網新聞數據為基礎,重點抓取收集安徽本地新聞數據,同時整合安徽日報社的歷史數據等數據,搭建安徽日報報業集團特有的數據中心,從數據層面融合數據資源,實現數據統一管理、共享資源、降低運營成本、挖掘數據價值、提升工作效率,給新聞生產提供數據支撐。
平臺在基礎數據的處理能力上擁有領先的專業技術,具備對網站、報紙、App、微信、微博等全媒體數據結構化的能力。針對數據的多元化可挖掘多種屬性的隱藏價值,挖掘數據深度應用模式,標簽配置數量高達500多個。其中,報紙版面分類技術是本平臺的專業優勢,可通過機器自動配置和人工干預審核來實現數據的有效分類。同時,在結構化過程中,可實現無效、不規范、廣告等信息的清洗。平臺還將所有基礎數據建立全文索引并入庫,在數據結構化的基礎上,對數據進行語義分析和深度挖掘,同時利用高效的全文檢索技術和算法,為采編發的各環節工作提供切實的幫助。
新聞大數據平臺包含“可視化大屏幕”“新聞大數據資訊平臺”“歷史稿件數據平臺”三大子平臺,主要功能模塊為:
1)可視化策劃指揮調度平臺
該平臺主要實現可視化、動態化、定制化,呈現數據分析、專題分析、傳播分析效果,快速發現新聞線索,實時分析新聞熱點和傳播情況,通過圖表屬性實時同步到可視化大屏幕上,對包括稿件監測、專題監測、傳播監測、智能分析、應急指揮等應用場景提供管理決策支持。
2)新聞大數據資訊平臺
(1)數據采集
系統通過技術手段對全國縣級以上新聞稿源單位的報刊、網站、微博、微信、客戶端等媒體端口全面覆蓋,實現對國內1400多家報紙、2萬多家國內媒體網站、5萬多官方認證微博、13萬多公眾微信號、1300家新聞客戶端等媒體發布端的稿件數據進行采集、處理和存儲,并支持對數據進行搜索、排序等操作。