文/本刊記者 王 飛
25秒完成九寨溝地震報道,寫稿機器人要讓記者失業?
文/本刊記者 王 飛
8月8日21時19分,四川九寨溝縣發生7.0級地震,舉國震驚。不過更令媒體和公眾感到吃驚的是,在21時37分15秒,中國地震臺網機器人自動編寫稿件,僅用25秒出稿,540字并配發4張圖片,內容包括速報參數、震中地形、熱力人口、周邊村鎮、周邊縣區、歷史地震、震中簡介、震中天氣8大項。
25秒能做什么?當人類記者還處在驚愕中時,機器人已經迅速完成了數據挖掘、數據分析、自動寫稿的全過程,不禁讓公眾浮想聯翩:記者是否要徹底失業了?
在筆者看來,對于這個問題其實并不需要恐慌,需要客觀看待,既要看到寫稿機器人在信息采集、加工、分析這個領域的巨大優勢,也要明白按照現在的人工智能技術的發展,寫稿機器人盡管有一定的優勢,但其還很難達到記者寫稿中所飽含的事實、情感、邏輯、思想等高度。
其實,對于機器人寫稿,傳媒界并不陌生。從技術層面上來說,寫稿機器人實際上是一種數字技術和智能寫稿編程系統,機器寫稿背后涉及到的技術包括數據挖掘、自然語言處理、機器學習、知識圖譜、搜索等等。一般而言,機器人寫稿流程分為數據采集、數據加工、自動寫稿、編輯簽發4個環節。毫無疑問,面對海量數據信息,人力的處理速度肯定趕不上機器人,因此在以信息發布為主的消息、上市公司公告、財務報表、官方發布、社交平臺、證券行情等類型文章上,寫稿機器人不僅提高了新聞的時效性,同時節約了人力成本。
比如,新華社機器人發稿系統后臺有500到600個模版,可以根據不同的要求,呈現不同的稿件。目前新華社機器人發稿系統運營維護僅需4到5人的團隊,平均一天稿件簽發量在100條左右。
此外,在眾多寫稿機器人中,今日頭條寫稿機器人“Xiaomingbot”比較知名,它的中文名字叫張小明。張小明由今日頭條實驗室研發,可以通過兩種文本生成技術產出新聞:一種是針對數據庫中的表格數據和知識庫生成自然語言的比賽結果報道,即簡訊;另一種是利用體育比賽文字直播精煉合成比賽過程的總結報道,也就是資訊。
筆者以為,從以上例子可以看出,寫稿機器人并不是指實體意義上的機器人,而是對機器自動生成文本、產出內容的一種抽象化命名。具體來說,寫稿機器人多以特定的信息庫為基礎,通過一定的篩選、分析、運算等信息處理手段,將信息進行重新排列組合,并套用事先設置好的寫作模板,輸出新聞報道。
因此,機器寫作一般可以總結為兩種主要形式:第一種是基于數字進行事實陳述及簡單的邏輯分析,比如體育比賽的簡訊;第二種是對信息源進行針對性的信息提取,再根據不同的規則把信息要點組合成一篇文章。今日頭條機器人張小明撰寫稿件就是第一種,而此次中國地震臺網機器人發布的新聞屬于第二種。
可以看出,這些機器人編寫的稿件基本上還是以短平快的消息和數據新聞為主,這些稿件類型實際上是以模塊化的信息為主,這次中國地震臺網機器人自動編寫稿件也是以信息發布、分類處理、背景介紹為主,并不是通訊、評論、特稿、深度調查等以專業性和思想性見長的稿件。
因此,從這個意義上來說,盡管隨著當前人工智能技術的日益強大,寫稿機器人在新聞基礎領域可以部分取代記者的工作,甚至會比傳統的人力工作更高效,但與機器人寫稿相比,人的最大價值在于對事實的判斷以及對復雜邏輯關系的推理,這是記者本身創造性的體現,也是目前機器人所沒有的能力。比如,質疑、追問、尋找對方話語中的新聞線索,這就是人類記者的法寶。相較于寫稿機器人,記者能夠生產優質的、深度的、有觀點、有分析的作品,這種優勢恰恰是機器人并不具備的。
正是因為寫稿機器人和記者的各有優勢,可以預見,未來新聞界可能的一大發展趨勢就是人機協作來完成新聞作品,具體的模式就是讓機器人完成新聞信息的搜集、整理、分析和加工,然后記者在這個基礎上進行深度挖掘,完成邏輯判斷,形成觀點和思想。所以,面對此次寫稿機器人的橫空出世,記者們其實不必恐慌,但這個群體必須要有危機感,如果記者的工作不能展現超越當前機器人的專業性,如果記者的文章不能體現事實、邏輯、情感、思考等關鍵性要素,那么這種記者不僅會在和同行的競爭中被淘汰,遲早也會被機器人淘汰。