文_夏康健
現今從全球范圍看,媒體智能化進入快速發展階段,可以預期,內容生產與人工智能深度融合將是未來新聞傳媒重要的發展趨向。近年來,人民網積極聚焦前沿技術應用,將人工智能等核心技術不斷運用于新聞生產,以主流價值導向駕馭“算法”。其中,最典型、最有成效的應用當是創新建設國內一流的“AI編輯部”,這一新技術的應用改變了傳統新聞生產模式,有效推進新聞產品的生產,大大擴展了新聞傳播的深度與廣度,進而提升了新聞專業生產能力與水準。
“AI編輯部”的設置建設是近年來人民日報技術創新和人民網技術應用的典型成果,它從內容生產層面為人民網事業發展增添了強力引擎。尤其在2020-2022年全國兩會期間,先后推出3個版本的“AI編輯部”,廣泛并迅速應用于人民網采編一線。在2020年兩會期間,“AI編輯部”首次亮相。此時的“AI編輯部”技術融合了人工智能的“看”“聽”“悟”“審”“查”等方面的能力,不僅為一線記者第一時間提供相關資料,也審查稿件寫作中有無錯誤,深度嵌入新聞采集和生產環節。在2021年兩會期間,“AI編輯部”迭代更新,形成了“2.0版本”,增加了云上精編、智能審核、智能海報、多模搜索、一鍵特寫五個創新功能,充分運用5G技術和邊緣計算技術,保證了音像、影像等大容量數據傳送,進一步強化了“AI編輯部”在全媒體生產上的應用深度與廣度。在2022年兩會期間,緊扣移動化、視頻化、智能化的媒體技術發展趨勢,“AI編輯部”提升為“3.0版本”,新增編輯移動端、5G全媒體生產、事實核查輔助、視頻加密暗水印、智能會議紀要、一鍵生成視頻、Cloud ME等輔助性技術,用5G技術連接采訪前后方、用AI技術直抵新聞報道一線。



“AI編輯部”的技術應用,不止于此。人民網處在人民日報媒體融合發展的前沿陣地,在“AI編輯部”的影響推動下,涌現出不少衍生技術和產品。比如,人民網將“AI編輯部”與傳統數據庫技術融合,形成了新的產品發展與演變,“時習之”專欄就是其中的典型。該專欄從“習近平系列重要講話數據庫”思路出發,收錄習近平總書記系列講話重要內容,并將其接入互聯網。該專欄運用“AI編輯部”的深度學習語義分析技術,將“數據庫”升級為“大腦”,在可感知、可運用的前提下為受眾提供學習平臺。同時,人民網又充分運用既有的媒體融合成果,將“時習之”內容延伸到“學習大國”微信公眾號,大大縮短了與受眾的傳播距離,實現了更“近一步”的傳播。作為“時習之”的延伸觸角和內容二次傳播陣地,“學習大國”推出了大量成體系、多層次的學習資料包,如領導人講話原文、重點書目導讀、權威專家解讀等,借助移動化、社交化傳播模式實現與受眾的深入交流,強化生產者與受眾的傳播連接。
與此同時,“AI編輯部”又衍生出許多實用新技術,其中事實核查輔助技術備受一線編輯記者青睞。事實核查技術主要融合了人臉識別、語音識別、自然語言理解、字幕識別、機器視覺等多項人工智能技術,能夠實現對文字、圖片、音頻、視頻等多種形態信息的審核。比如圖片核查技術,可以對新聞稿件中的圖片進行按照傳播鏈路源頭核查,借助圖像向量引擎技術,甄別出舊圖新說、版權侵權、圖文脫節等問題;或者利用智能算法,多角度比對相關度較高的文章,以核查事實不符之處。事實核查比對重點網站,并以中紀委、中央氣象臺、國家地震臺等官方權威數據庫為審核基準,從信源上確保了數據的權威性。同時,事實核查輔助技術集納了教育部、國家語言文字工作委員會的相關行業標準,增強了對敏感關鍵詞和用語規范性的監測、提升了對常識性錯誤和發音不準錯誤的糾正能力,確保新聞內容表述妥當、精準無誤。
一直以來,人民日報社高度重視技術支撐制度建設,從頂層設計上確保人民網技術發展守正創新。首先,人民日報社設有專門的內設機構即技術部來統籌全報社的技術發展。其次,人民日報社規劃了“1+2+3+4+X+N”全媒體技術支撐體系。其中,“1”指的是“人民日報社媒體技術聯席會”機制,統籌報社技術發展規劃、重大項目、網絡安全和協調報社技術資源;“2”指的是傳統媒體和新興媒體兩條業務主線,推動媒體融合向縱深發展,真正做到“融為一體、合而為一”;“3”指的是數據中心機房、同城災備機房和異地災備機房3個技術支撐平臺,“4”指的是全媒體采編、涉密內參、內網辦公、網絡安全,面向技術服務對象;“X”指的是AI中臺、數據中臺、5G中臺、視頻中臺等公共基礎技術,這些技術推動采編、辦公、管理一體化,為全媒體內容創作賦能。“N”是報、刊、網、端、微、屏等全媒體業務矩陣的融通和聯動。這一發展規劃明確了人民日報與人民網在技術發展上的管理關系,有序促進人民網技術創新。比如上文提到的“時習之”專欄就是由人民日報社主管,依托人民網建設的傳播內容認知國家重點實驗室協作共建。
第三點和第四點是相關政府招標采購制度與規劃版圖設計。一方面,人民日報社借助招標采購制度保證技術發展“守正”。人工智能市場魚龍混雜,要想選擇出真正具有實用價值的技術并非易事。人民日報社規定大額標的資產采購必須經過技術部和計劃財務部的共同招標,而負責招標的工作人員均具有較為優秀的專業素養,這從根源上確保了人民網的技術水準。另一方面,從規劃版圖上看,人民網獨有上市公司身份,這保證其能夠不斷引入資本力量對技術展開探索。2019年,人民網就和中科院自動化所共同建立人工智能技術引擎和人才創新平臺,即“人民中科”,借助上市公司帶來的資本力量吸引國內頂尖AI專家,實現智能理解團隊和技術人才儲備。這些都是孕育人工智能技術發展的重要前提。
從媒體融合發展現狀來看,提高新聞內容生產力將是未來技術發展趨勢。目前,新聞傳播的一個突出矛盾是專題新聞策劃多、受眾新聞需求多,但是內容生產不足。如何將人力資源最大限度地從重要但機械的內容生產步驟中解放出來,又最大限度地投入到創意創新生產上,將是一項重要工作。這方面的探索和實踐也是近年來人民網媒體技術發展的著重點。結合人民網的采編播實踐,筆者認為,以下三個方向或是新聞傳媒技術融合與創新發展的著力點:
一是數據庫建設技術。數據庫就是寫作素材的積累庫。數據庫越強大,內容生產的潛能就越強。目前,多家媒體已經開始圍繞習近平總書記重要論述展開數據庫建設,不僅囊括總書記的重要論述,也包括相關重要報道。但是,當下數據庫建設的難題在于如何最大限度接入各類素材,尤其是在確保準確無誤前提下將習近平總書記的重要論述盡可能地納入到數據庫中。目前很多媒體借助抓取技術從海量的互聯網信息中將內容直接抓取出來,但這一技術無法保證內容的準確性與真實性;倘若將信息抓取只局限在幾家權威網站,又會導致數據缺乏全面性,可以說這是一項“卡脖子”技術。另一方面,如何在數據庫中準確搜索到寫作者所需要的信息,也是難題。很多數據庫建設過于依賴傳統的搜尋模式,過于機械化且缺乏精準度。目前,很多互聯網公司將人工智能運用到數據抓取和數據查詢中,將這一技術應用于媒體數據庫建設也是未來重要方向。
二是智能化寫作技術。機器人寫稿發展到今天已日顯雛形。在5年前,機器人寫稿略顯稚嫩,寫出的稿件表達機械且缺乏感情,難以廣泛應用于現實。但在今天,隨著人工智能技術的應用,機器人寫稿出現了新情況,即“生成型人工智能”的廣泛應用。人工智能包括兩種,即“分析型人工智能”和“生成型人工智能”。前者是傳統意義上的人工智能,顧名思義,重在數據分析,它興起于2016年并迅速蓬勃發展,市場規模從2016年的600億美元上漲到2021年的近3000億美元,廣泛應用于亞馬遜、字節跳動、特斯拉等公司。生成型人工智能則是重在創造新事物,如創造文本。這種人工智能尚未完全發展成熟,但在未來有著廣闊前景。在不遠的將來,生成型人工智能將廣泛應用于機器人寫稿中。
三是防差錯技術。對于新聞工作而言,事實錯誤帶來的傷害是不可逆的,直接損害新聞媒體在受眾心中的權威性,因此如何更好地提升事實核查效率、降低事實錯誤率,是重中之重。從實際來看,對于每家媒體,尤其是報社而言,核校是極為耗時但產出不明顯的工作,拴住了大量人力物力,也不能保證內容完全無差錯。目前,人民網等媒體將人工智能應用到防差錯技術中,不僅有效削減了人力資源投入,更降低了內容差錯率。在未來,這將是新聞生產力進一步解放的重要突破點。