石 超
(新華通訊社,北京 100083)
日新月異的新媒體技術帶人們進入擁有人工智能、云計算、AR/VR等高科技的智媒時代。智能化技術全面進入傳統媒介新聞生產的核心環節,及其寫作正在給新聞傳播領域帶來革命性的變化。[1]作為人工智能技術在新聞實踐領域運用的代表性產物,“機器新聞寫作”是指運用機器算法對數據進行抓取、分析、整理和呈現的新聞寫作模式,它使新聞生產開始走上了工業化、自動化和智能化的道路。[2]
新華社承載了各種類型稿件的播發,其中資訊稿是其中之一,其新聞發布的時效性,生成次數的頻繁,數據采集的繁瑣,無一不牽扯了編輯記者大量的時間和精力。新華社寫稿機器人“快筆小新”應運而生,它的工作范圍涵蓋了體育賽事、財經、各大部委官方資訊、天氣等領域,自2015年11月7日上線運行以來,7×24小時不間斷工作,為編輯記者在線采集海量數據,生成大量咨詢類稿件,解放了編輯記者的雙手,使其有精力和時間投入到新聞稿件深度報道中。[3]
從2016年起,“快筆小新”相繼承擔了里約奧運會、平昌冬奧會、中華人民共和國第十四屆運動會、東京奧運會重大賽事報道,并圓滿完成比賽成績公報播發的任務。2022年北京冬奧會,“快筆小新”再接再厲,從各種賽事報道中不斷積累經驗,積極探索業務需求和智能化采寫技術的結合點,在北京冬奧會賽事報道中推陳出新,解決困擾記者編輯多年的痛點,真正做到技術落地,解放生產力。
隨著機器人寫稿在新華社的影響逐漸擴大,業務部門聯系機器人寫稿項目組,提出2016年里約奧運會的發稿需求,這是首次嘗試在奧運會級別賽事上使用機器人寫稿系統播發比賽公報。在數據方面,為了確保數據的準確性和時效性,多次聯系奧組委,申請接入奧組委奧運賽事數據服務(ODF,Olympic Data Feed)。和ODF的成功對接,為將來的奧運會賽事的機器人寫稿順利進行打下了堅實的基礎。
此次里約奧運會機器人寫稿實現了包括每日中英文獎牌榜,所有39類項目的英文當場成績和排名,重點球類項目(籃球、排球、足球、水球、曲棍球、乒乓球、羽毛球)英文當場成績和小組賽排名等賽事公報的自動寫稿。里約奧運會期間共生成稿件4000多條,其中寫入待編庫350多條(決賽成績排名和獎牌榜),被業務部門最終核對簽發稿件280多條。
機器人寫稿在里約夏季奧運會賽事報道上的成功應用,促使業務部門將之后各大國際重大賽事的成績公報的報道任務交給“快筆小新”進行。平昌冬奧會是“快筆小新”接手的第二個國際重大賽事,因有里約奧運會的機器人寫稿開發經驗,以及和奧組委對接的經歷,平昌冬奧會機器人寫稿的開發工作非常順利。同時,在反思里約奧運會時機器人寫稿在便捷性上的不足,重新開發了前端頁面,能方便業務部門編輯直接在線選稿、編輯稿件以及簽發至待編庫等操作,深耕用戶需求,以用戶為中心,提升和完善機器人寫稿功能。
“快筆小新”在東京奧運會上首次實現自動發稿。國際疫情形勢嚴峻,導致賽前測試數據嚴重不足,因此采取敏捷開發的方式,循序漸進,逐步完善不同賽事的報道服務,直到正式比賽開始一段時間之后,“快筆小新”才全部開發完畢。
一場比賽正式結束后,“快筆小新”同步接收奧組委ODF賽事數據,實時自動編寫奧運會賽事稿件,并自動入庫,全程無人工干預,將稿件第一時間呈現在編輯面前,發稿效率進一步提升。奧運期間共采寫1050篇稿件,由于稿件生成又快又準,業務部門的英文終審發稿人特別表揚機器人寫稿反應快,效果很好。
同時,“快筆小新”為新華社中英文客戶端奧運獎牌榜提供實時獎牌榜數據接口。獎牌榜數據更新快,效果好,截至奧運會閉幕式當天,新華社英文客戶端獎牌榜海外瀏覽量超過1600萬,互動量近20萬,多次成為新華社海媒賬號當日瀏覽量和互動量最高的稿件。新華社中文客戶端瀏覽量超過2600萬,訪問用戶678萬人次。
完成東京奧運會賽事報道后,“快筆小新”臨時接到新的需求,即一個月后的全運會報道。全運會賽事系統和奧運會ODF是完全不同體系的平臺,短時間內對接成功,并開始播發賽事稿件是非常艱巨的任務,同時還需要滿足業務部門不斷變更的新需求。時間緊,任務重,“快筆小新”頂著壓力,在敏捷開發模式下,嘗試總結歸納整個賽事期間生成的所有數據,首次生成41篇按賽事種類總結的中文稿件,并全部被業務部門采用簽發。
此次全運會首次報道的成功,能夠做到機器人寫稿中文和英文稿件全覆蓋,以及成功對接全運會賽事平臺,為后續的全運會賽事的機器人寫稿提供了寶貴的經驗。
此次北京冬奧會,是新華通訊社作為奧組委官方合作通訊社后第一次報道的冬季奧運會賽事,報道內容和范圍都比之前有了進一步擴大。“快筆小新”也肩負起了更加重要的使命。業務部門決定將比賽報道范圍從原先的半決賽、決賽擴大至每種比賽的各個階段,這將導致本屆冬奧會機器人寫稿的稿件數量規模上遠遠超過以往冬奧會賽事報道。據統計,寫稿機器人在冬奧會期間自動生成稿件1105篇,把記者從大量繁重的基礎性工作中解放出來,騰出更多時間和精力采寫更精彩、更有趣的深入性報道。
同時,按照業務部門需求,新增每日比賽歸納總結性稿件,每種比賽需要在當天所有子項目結束時,歸納所有子項目比賽結果。“快筆小新”研發團隊積極響應用戶的每一個需求,做好用戶服務。
冬季項目比賽運動員需要佩戴頭盔、護目鏡等安全護具,身份不易辨認,稍有疏忽就有可能弄錯。在以往報道中,這給記者編輯發稿帶來很大麻煩,為此需要耗費大量時間核對運動員身份,影響了發稿時效。
為助力北京冬奧會報道,破解困擾記者編輯多年的痛點,技術局自主研發出“Bib號速查”系統,首次實現在新華社奧運報道中實時查詢運動員的身份信息和成績。
這個報道神器,助力前后方編輯記者,尤其是攝影記者在比賽現場通過運動員身上的號碼牌(Bib號)快速查詢運動員姓名、成績、排名等信息,賽前可預先查閱即將出場的運動員信息,便于提前做好報道準備。系統支持運動員信息導出到圖片編輯軟件,輸入Bib號自動替換為運動員名字,避免拼寫錯誤。導出的數據樣式可根據情況自行設定,盡量減少重復性手工操作。系統嵌入到新華社“新圖片”系統和“采訪通”App,實現對不同應用場景的支持。這些功能大大提高了冬奧報道時效,得到了編輯的一致好評。
“Bib號速查”系統同時集成了冬奧機器人寫稿功能。編輯記者只要勾選運動員的名字,就可以自動生成稿件,方便快速發稿,同時減少人名拼寫錯誤等問題,很大程度提高了冬奧報道的時效性和準確性,為冬奧智慧賦能。
冬奧會期間,運動員信息查詢系統日均接口調用量5000余次,查詢比賽2000余次,提供40多場2000多名運動員的信息和比賽成績查詢服務,為冬奧會報道提供強大助力。
“Bib號速查”系統在冬殘奧期間也多次被記者“點名”,希望可以繼續使用如此便利的功能。在北京冬奧會數據開發經驗和基礎上,“快筆小新”研發團隊增加了殘奧會600多個運動員、180多場比賽的信息數據,并針對殘奧會的特點增加了視障項目“引導員”中英文姓名的查詢和導出功能,得到了前方記者的好評。冬殘奧會期間,“Bib號速查”系統平均每天查詢比賽300多場次。
在北京冬奧會報道期間,“快筆小新”研發團隊,配合業務部門,在后方做了大量的數據支持和運維保障工作,提供實時獎牌榜數據更新服務,協助推出了北京冬奧會獎牌榜(中文版和英文版),獎牌榜數據更新快,數據準確,取得了非常好的傳播效果。
在新華社中文客戶端以及對內報道渠道上,累計獲得近532萬次瀏覽;在新華社英文客戶端和海外社交媒體平臺等渠道上,累計獲得超過322萬次瀏覽,受到各方好評。
數據清洗過濾與分析方法研究與模塊實現:通過ODF提供的Schema,進行一致性檢查、篩除錯誤結構,清洗接收的ODF數據。過濾非正式比賽結果信息,例如訓練賽數據、比賽場地與天氣數據等。通過利用各種數據分析方法檢測比賽數據中的結構和模式,輸出離散數據模式。例如比賽數據中的成績結果、獎牌榜的更新等。該模塊與具體比賽數據類型相關,針對不同的數據類型所輸出的數據模式是不同的。通過對數據模式和輸入事件進行分析,推斷出對應的比賽成績處理模式,同時推斷出它們之間的關系,最后輸出高層消息以及消息之間的關系。例如針對某一場比賽數據,如果是實時比賽結果數據,這種中間結果產生的消息只需記錄即可,如果是最終的比賽結果,則需要創建一條最終消息。還需要檢測分析消息之間的關系,例如因果關系、時序關系等。
新聞規劃方法研究與模塊實現:用于對信息進行篩選歸類,并規劃新聞篇章結構。針對不同的比賽規則和最終文本的呈現效果,分析決定哪些信息和關系需要在文本中提及,同時要確定文本的結構,最后輸出需要提及的信息以及文檔結構。文檔規劃模塊必須明確文本中需要說明和展示的信息,一般可根據專家知識、消息的重要性、上游需求等來進行選擇和確定。當然,該模塊與成績數據類型也很相關,不同數據類型對消息的選擇所考慮的因素不一樣,文檔的結構也會不一樣。
句子規劃與實現方法研究與模塊實現:基于選中的信息及結構,通過自然語言生成技術輸出最終的文本。該模塊主要涉及對句子進行規劃以及句子實現,要求最終實現的句子具有正確的語法、形態和拼寫,同時采用準確的指代表達。
此次北京冬奧會機器人寫稿服務,分為三部分,分別是賽事公報稿件生成服務、運動員號碼牌查詢導出服務和奧運會獎牌榜數據支持服務。
賽事公報稿件生成服務。基于奧組委奧運賽事數據分發服務(ODF, Olympic Data Feed)的數據源,經本地高性能自動數據處理轉發服務,按照比賽的過濾規則進行數據清洗,結合奧組委提供的Common Codes文檔,對數據進行解析,提取關鍵信息,通過設定的模板庫實時生成各項數據并且傳送到目標服務器,為新華社提供實時動態精確的奧運會賽事報道服務。

圖1 機器人寫稿簽發系統
運動員號碼牌查詢導出服務。基于ODF數據源,經本地高性能自動數據處理存儲服務,通過手機App或者PC端查詢某一場比賽運動員的號碼牌對應的成績、姓名等信息,并提供導出成文件功能。

圖2 Bib速查系統
奧運會獎牌榜數據支持服務。基于ODF數據源,經本地高性能自動數據處理轉發服務,解析官方獎牌榜數據,按國家提取金銀銅牌個數等關鍵信息,提供實時獎牌榜排行數據服務。

圖3 北京冬奧會獎牌榜(中文版)

圖4 北京冬奧會獎牌榜(英文版)

圖5 系統業務流程圖
庫茲韋爾曾經斷定,人工智能將于2045年超越人類智慧;美國Narrative Science也斷定未來九成以上新聞內容將由機器創作。[4]可以預見,隨著未來人工智能技術日新月異的發展,機器人必定會在新聞內容生產方面發揮更大的作用,同時也必將更好地輔助媒體人在深度報道方面創造更多的可能。
近年來,“快筆小新”不斷地從各種賽事報道中積累經驗,積極探索業務需求和智能化采寫技術的結合點,新增各種解決新聞報道痛點的功能服務,除了體育賽事的報道,在其他領域,包括財經、各大部委官方資訊、天氣等也有成熟的稿件編寫能力。在此基礎上,“快筆小新”將繼續探索其更豐富的智能化功能,助力新華社新聞業務更上一層樓。