顏玉奎
【摘 要】新聞資料工作經歷了四個階段:手工剪報—數據庫全文檢索—網絡化信息化—融合發展。本文通過梳理新聞資料工作進程,研究新聞資料工作在融媒體時代的轉型發展。融媒體時代黨報的新聞資料工作將承擔更大的責任,新聞資料工作與信息技術和媒體業務更加緊密結合,數據中臺是全媒體數據管理的發展方向,信息組織和檢索依然是新聞資料工作的核心內容,要結合新聞業務和用戶需求開發利用全媒體新聞資料數據庫,把數據變成數據資產。
【關鍵詞】新聞資料工作;融媒體;數據中臺;信息組織;信息開發
隨著媒體的深度融合、信息技術的發展,新聞資料工作的手段和方法也發生了深刻的變化。近十年來,傳統媒體和新興媒體深度融合,從中央媒體到縣級媒體兩極,拓展為央、省、市、縣四級融合發展的全媒體傳播體系,有的地方報紙與廣播、電視臺機構融合、資源重組,地市級媒體“深度融合”[1]。原有的新聞資料數據庫無法涵蓋融媒體多種類的新聞信息數據,需要升級換代,新聞資料工作亟須轉型。本文結合廣西日報傳媒集團新聞資料信息工作的轉型實踐,探討融媒體時代新聞資料工作的轉型發展策略。
一、新聞資料工作的發展進程
《新聞資料學概論》將新聞資料工作定義為“新聞資料工作是指搜集、整理和利用新聞資料來為新聞活動和全社會服務的科學勞動。它包括信息的采集、整理、加工、保管、流通、檢索、咨詢等多個工作環節”。新聞資料工作既是整個新聞工作的重要組成部分,又是整個情報資料工作的重要組成部分。梳理新聞資料工作的發展歷程,可以分成以下四個發展階段。
(一)手工檢索階段
新聞資料工作的初期是手工檢索階段,圖書、報紙、雜志、剪報是新聞資料界提供給報社、編輯、記者的所有信息源。很多報社在建社初期就成立了圖書資料室,其主要的工作任務是:選購和管理圖書雜志,收集和管理剪報資料。關于新聞資料方面,大陸出版有論文集《新聞資料漫談》,臺灣出版了臺灣學者關于新聞資料的專業書籍《新聞資料研究》。
(二)全文檢索階段
1991年3月,北大方正推出激光照排系統,我國報紙出版告別了鉛與火,新聞資料數據進入了全文檢索階段,業界開始探討新聞信息數據庫的元數據標準和分類標準,1993年出版了專業書籍《新聞資料學概論》,這是我國第一部系統論述新聞資料工作的論著。
(三)網絡化信息化階段
21世紀前10年,是新聞資料工作發展較好的階段。其代表性的工作成果是報紙電子版網上發布和歷年紙質報紙數字化,在學術成果方面,制定了新聞資料的國家分類標準《中文新聞信息分類與代碼》,出版了《新聞資料工作理論與實踐》等專業學術論著。
《人民日報》紙質歷史報紙分別于1995年、2003年制作了兩個版本的電子版;2002年,《文匯報》《四川日報》《深圳特區報》分別完成了歷史報紙的數字化[2];2005年6月,廣西日報社與湖南青蘋果數據中心簽約制作《廣西日報》紙質歷史報紙的電子版。各家報紙先后完成了歷史報紙的數字化。
網絡環境下的新聞資料工作與計算機技術為主體的現代技術的聯系越來越緊密,2001年8月,中國新聞技術工作者聯合會新聞資料委員會(簡稱“中國新聞資料委員會”)宣告成立。新聞資料界積極探討網絡環境下新聞資料工作的現代化、信息化,并變更新聞資料部門的稱呼:人民日報社、上海報業集團、南方日報報業集團、四川日報報業集團、深圳報業集團將新聞資料部門名稱改為“新聞信息中心”,重慶日報報業集團、湖北日報傳媒集團將其稱為“信息資料中心”,廣西日報社將其更名為“信息服務部”。
(四)融合發展階段
隨著新技術和新興媒體的出現,新聞資料工作與信息技術和媒體業務的聯系更加緊密。由于都市報廣告下滑,紙媒遇到危機,新聞資料工作也受到沖擊。目前國內不少新聞單位取消了獨立的新聞資料工作職能部門,將其歸到新媒體部門或者技術部門,新聞資料工作與媒體融合發展。
二、新聞資料工作的轉型策略
信息資源與物質形態的原材料資源、能量資源并列構成三大戰略資源,信息資源的開發、利用、管理已經得到社會、國家的重點關注。2022年9月,一級學科“圖書情報與檔案管理”更名為“信息資源管理”[3]。一級學科更名后,新聞信息資源的管理成為“信息資源管理”的分支,在學科體系中明確其發展定位,在媒體深度融合發展中被賦予了新的時代使命。隨著媒體融合的縱深發展,原有的新聞資料數據庫無法涵蓋融媒體多種類的新聞信息數據,新聞資料工作亟須轉型發展。
(一)數據中臺是全媒體數據管理的發展方向
當前,搭建技術中臺、業務中臺、數據中臺、AI中臺成為融媒體融合發展創新中的熱門探索,以技術創新帶動管理機制和管理思維的創新,構建全媒體驅動的中臺戰略[4]。融媒體新聞資料數據不僅涵蓋傳統媒體的報紙、廣播、電視等傳播產品,還包括網站、微博、微信、抖音、APP等新媒體的數據,包括文本、版面、圖片、音頻、視頻,有微視頻、小電影、H5、圖文直播、動漫等多種新型的表現形式,新聞資料數據庫的內容要全景覆蓋這些數據,原有的全文數據檢索系統已經無法適應,數據中臺是全媒體數據管理的發展方向[5]。例如,新華社打造一站式智能全媒體數據中臺,整合新華社傳統媒體和新興媒體多渠道數據資源,并通過數據可視化方式,實現對全社媒體資源動態掌控,南方報業傳媒集團通過數據中臺的建設,充分釋放數據潛力,實現了數據到資產的增值,廣西云融媒體平臺建設了全媒體數據中臺,整合了自治區各家媒體的資源優勢,在項目數據部署和媒資支撐方面,除廣西日報社的大力支持之外,廣西廣電網絡公司提供了數據存儲和算力支持,廣西廣播電視臺則在視頻媒資、傳輸能力方面進行協同研發。
(二)借助人工智能技術對新聞資料數據進行信息組織
信息組織依然是融媒體時代新聞資料工作的核心內容。信息組織包括信息選擇、信息分析、信息描述和揭示、信息存儲[6],其中,信息描述和揭示,主要是著錄文獻信息的形式特征(日期、版次、標題、作者、正文等)、標引文獻信息內容特征的檢索標識(關鍵詞、體裁、類號、標題詞、敘詞、關鍵詞、人名、地名等),是數據庫建設的基礎性工作。
分類組織法和主題組織法是數據庫及網絡的信息組織工具,隨著計算機技術被大量應用于圖書情報資料領域,信息組織不再完全屬于圖情專業的專有技術[7]。人工智能的自動標引技術可以快速、高效、實時地對信息資源進行處理,自動標引、自動分類技術廣泛應用于新聞信息數據庫和全媒體中臺。如廣西云全媒體數據中臺,采用智能文本分析系統,基于深度學習+遷移學習方式和Transformer(轉換器)模型,基于國家標準《中文新聞信息分類與代碼》制定自動分類表,對匯入數據中臺的文本數據進行自動分類,對文章中的地區命名實體、人物命名實體、機構命名實體、時間、專業術語等檢索標志進行自動標引,給每一篇文章自動標注核心關鍵詞,自動抽取新聞文本中涵蓋內容主旨的關鍵信息,并生成指定長度的新聞摘要。在匯入圖片、音頻、視頻數據時,會自動調用預設置的AI(人工智能)中臺智能解析能力,將匯入的多媒體內容進行語音識別、人臉識別、字幕識別等解析操作,同時將對應的語音、字幕識別成文字,并根據內容標注人物的名稱,標注涉及的地點、事件以及相關機構。
盡管自動分類、自動標引技術已經進入到智能標引階段,但由于自動分類表比較簡單,自動分類的輸出結果較粗糙,查全率和查準率有一定的局限性,自動標引不能完全取代人工標引。實際應用中,一般仍會繼續保留人工標引,自動標引與人工標引相結合,人工標引對自動分類標引的結果進行糾正,完善自動分類模型,提高自動分類的準確性,新聞資料工作者可以發揮信息組織方面的特長,人工標引原創、專題等重要數據,深度挖掘其數據價值。
(三)結合新聞業務和用戶需求,開發利用全媒體新聞資料數據庫
信息組織的目的是信息利用。媒體單位積累了大量的原創文章、圖片、音視頻等媒體數字資產,需要有效地管理和利用這些海量的數字資產。在全媒體時代,數據分析和應用成為媒體發展的重要支撐。通過數據分析和挖掘,可以為媒體提供多維度觀察,幫助媒體企業了解受眾喜好,提高廣告收益、增加流量,同時通過數據分析和開發,實現數字資產交換、共享和銷售,媒體單位積累的媒體數字資產是寶貴的財富,如《每日經濟新聞》以智能媒資庫為核心,通過智能標簽和匹配算法的情感識別模塊,成功實現“AI化+視頻化”的戰略轉型[8]。
新聞資料部門要變被動服務為主動服務,當發生重大突發事件時,要快速反應及時提供相關背景資料,對于重大報道、重要會議,要提前介入,做好相關專題資料提供給新聞策劃部門,結合新聞業務,充分發揮新聞資料數據庫的作用,把數據變成數據資產,開展數據服務。全媒體新聞資料數據庫的開發利用可從以下幾點來考慮。
一是容易變現的專題信息。結合媒體業務部門和經營部門的工作開發容易變現的專題信息。
二是相對固定重大報道專題。提前介入每年相對固定重大報道,如自治區兩會、全國兩會、黨代會、中國—東盟博覽會等。
三是實體庫(地區專題庫、人物專題庫、機構專題庫)的建設。地區名稱、人物名稱、機構名稱,數據中臺可以自動標注,但有些也需要人工修正或進一步深度標引,比如人物專題庫,可進一步標記不同類型的人物:典型人物、政治人物、敏感人物。在實踐中,敏感人物庫是非常實用的專題庫。
四是利用剪報目錄提取有價值的歷史專題資料。剪報資料是從報紙和雜志上直接剪切下來的,保留了原來的版式,一目了然,很直觀。歷史紙質報紙完成數字化建成了全文數據庫,依據原有的每冊剪報分類或專題做成的剪報目錄庫,可以快速查找原來的剪報,也可以依據剪報目錄在全文報紙數據庫中提取有價值的歷史專題資料,紙質資料依然發揮著獨特的資料價值。
(四)新聞資料工作者的轉型
在手工檢索階段,新聞資料部門是以收藏、整理紙質圖書報刊資料為主的場所。有些人以為受過簡單培訓的人就可以勝任新聞資料工作。因此,新聞資料部門往往成為照顧家屬,分流多余人員的場所。在網絡化信息化階段,“老弱病殘”再也難于勝任夜班或早班的數字報工作。融合發展階段,新聞資料與技術、與媒體的業務緊密結合,對新聞資料工作者提出了更高的要求,迫切需要熟悉新聞業務、懂得信息組織和檢索、能充分利用信息技術進行數據分析的復合型人才,要求從業人員能夠熟練運用計算機進行數據處理和數據分析,快速為新聞業務、為用戶提供信息服務。新聞資料工作者可來自計算機應用、信息資源管理或者新聞學等專業,要有良好的政治思想素質,具有強烈的事業心和責任心,具有較好的學習能力,能掌握與自己崗位相適應的信息處理技術,有較好的業務素質和個人素質。
三、結語
新聞資料工作經歷了手工剪報—數據庫全文檢索—網絡化信息化—融合發展四個階段。融媒體時代,新聞資料工作與信息技術和媒體業務更加緊密結合,數據中臺是全媒體數據管理的發展方向,盡管新聞資料工作方法和部門設置有些變化,但信息組織和檢索依然是新聞資料工作的核心內容,迫切需要熟悉新聞業務、懂得信息組織和檢索、能充分利用信息技術進行數據分析的復合型人才。人工智能技術可以對新聞資料數據進行自動分類和自動標引,但不能完全取代人工標引,需要自動標引與人工標引相結合。結合新聞業務和用戶需求,開發利用全媒體新聞資料數據庫,把數據變成數據資產,全媒體新聞資料數據庫也要通過服務社會來發展自身。一級學科“圖書情報與檔案管理”更名為“信息資源管理”,新聞資料工作者更容易找到自己專業研究的學科自信。新聞資料工作的歸屬部門可能有些變化,但是新聞資料工作不會消亡,報紙是公認的權威性信息總匯,黨報的新聞資料工作將會承擔更大的責任。
參考文獻
[1]葉蓁蓁.2022—2023報業融合發展觀察報告[J].傳媒,2023.7,(上):9-12.
[2]杜官相.對人民日報等六家報社新聞資料數字化建設考察報告[C].中國管理科學文獻,2008-12-01:1023-1025.
[3]毛太田,湯淦.守正創新:學科更名的思考[J].數字圖書館論壇,2022(11): 15-18.
[4]曾祥敏.我國媒體融合發展的十大創新探索[J].報林, 2022(04): 9-11.
[5]楊東,滕健.基于大數據技術的全媒體中臺實踐[J]. 中國傳媒科技,2020(09):19-20.
[6]馬費成.信息管理學基礎(第三版)[M].武漢:武漢大學出版社,2023:8-30.
[7]馮瑾毅.大數據時代信息組織與分析面臨的機遇與挑戰[J].江蘇科技信息,2023(9):31-34.
[8]劉學東.以智能媒資庫為核心 實現“AI化+視頻化”——每日經濟新聞戰略轉型的思維之變與技術路徑[J].中國記者,2023(7):59-65.