黃磊
近年來,人工智能在新聞領域的應用越來越頻繁,不少人驚呼連記者這個行業都要被機器化了么?本文將對當前新聞寫作機器人的應用情況、應用優勢和不足進行說明和探討,并對其發展前景作出展望。
2015年9月10日,騰訊財經頻道用自動化新聞寫作機器人Dreamwriter,發布了一篇名為《8月CPI漲2%創12個月新高》的報道,開了國內機器人寫稿的先河。
2016年里約奧運會上,一個名為“張小明(xiaoming-bot)”的新聞機器人小試鋒芒。在奧運會開始后的13天內,共撰寫了457篇關于羽毛球、乒乓球、網球的消息簡訊和賽事報道,每天30篇以上。其發稿速度之快,讓人驚訝——幾乎與電視直播同時。
2017年12月1日,在武漢交警撮合下,武漢長江大橋聯手騰訊,“寫”出了全國首篇物聯網交管新聞。當日上午9點23分,騰訊2歲寫作機器人Dreamwriter接收到1180公里外,60歲的武漢長江大橋發出的數據。兩件“物體”合作,0.5秒內,一篇323字的新聞稿《長江大橋11月日均車流量9.2萬日高峰車流10.4萬》躍然紙上。武漢長江大橋,成了全國首個物聯網“通訊員”。
新聞機器人,或者叫AI機器人,早已被世界上的主流媒體所關注并加以使用。例如,國外有美聯社的Word-Smith、華盛頓郵報的Heliograf以及紐約時報的blossom等。國內則有新華社的快筆小新、騰訊的dreamwnter、第一財經的DT稿王等。這些寫稿機器人無一例外都運用到了大數據處理技術。
1.提升發稿速度,全天候新聞熱點監測,提高新聞的時效性
時間對于新聞的意義非同小可。新聞機器人通過之前學習相似稿件的寫作模式,憑借其快速的信息處理能力,可以在極短的時間內就寫出一篇符合該媒體寫作風格的作品。以“小明”為例,在奧運會期間其一篇稿件的完成時間約在2秒左右,也就是說比賽剛一結束,稿件就已經寫好發布了。其發稿速度上要快其他媒體一步。此外,記者在長時間的報道壓力下可能忙中出錯,而身為機器“小明”可以實現全天候24小時監測賽事熱點,既不漏題同時也保證了記者有充分的精力應對關鍵比賽的詳細深度報道。
2.數據海量,規模處理
隨著大數據技術的發展,機器人寫稿能力會越來越強。據估計,當前全球存儲的數據總量以上萬艾字節測量(1艾字節=10億千兆字節),而且仍在加速增長,大約每3年實現一次倍增。這些數據以各種格式存在,往往難以用傳統數據軟件進行匹配分析。
大數據技術則能夠規模化處理這些信息。無論是文、圖、音視頻還是其他形式的信息,機器人編輯都可以像音樂家排列音符一樣去組合、重構。無論天氣預報、地震預警還是賽事報道,最終都能放人機器人數據庫中,可以構建無限可能。
3.信息抓取,精準加工
機器人寫稿的另一大優勢就是精準。寫稿機器人生產新聞,可以不依賴于現場采訪獲取素材,而是通過對現有數據、資料進行快速搜集加工編制而成。在數據量足夠大、樣本足夠多的情況下,機器人寫稿可有效避免假新聞出現。
4.實時監控.快速報道
寫稿機器人用機器代替人類完成對信息源的實時監控,并利用文本解析和爬蟲技術實現自動信息抽取,采用算法技術并融合編輯記者團隊的經驗和智慧,以模板和規則知識庫的方式輸出稿件。真正達到了對信息的實時監測、實時發布。
5.數量龐大,效率極高
和傳統媒體人相比,寫稿機器人可以瞬間完成海量閱讀、分析并根據互聯網活躍點擊量數據,瞬時篩選出下一個熱點新聞,然后通過后臺算法快速合成新聞。總體來看,寫稿機器人在速度和數量上有著絕對優勢。
1.機器人對信息的深度理解不夠
新聞機器人所能做的只是在現有數據庫的支持下,對文章進行詞匯和語句的抓取,然后進行排列組合,對文章的深度理解能力還遠遠不能與人類相提并論。已經有機器人記者被發現偽造新聞事實的情況發生。
2.扁平化新聞千篇一律,缺乏亮點和重點
由于模塊式的報道,機器人寫稿難以回避的一個問題就是千篇一律,每篇報道的結構甚至是用詞用句都差不多,缺乏亮點和重點,難以給讀者留下印象。
3.對信息的提煉和概括能力不足
要想把一篇文章寫好,對信息的概括和提煉能力是一個記者必備的職業素質,長而空洞的文章是沒有人看的。但目前的寫作機器人顯然沒有提煉和概括的能力,提煉與概括的前提是理解,機器人對于人類語言的理解能力還十分弱,這就限制了機器人寫作的文章體裁和領域。
4.寫作領域較為單一
機器人新聞當前的應用還停留在以使用數據為主的新聞領域。具體的說是在財經和體育方面,很少能“身兼數職”、“一機多能”。這一方面是由于其初始寫作模塊的設置,功能較為單一,未能考慮到深讀學習功能;另一方面,數據壁壘的導致“小明們”不能獲取學習更多的數據資料,導致其“知之甚少”。
倫敦大學教授NeilThurman發布的比較人類記者和機器人記者的研究報告提出,機器人可以用于突發新聞事實的報道,隨后由人類記者做深度挖掘和擴充。人機協作是必然趨勢。未來的新聞稿背后也許都會站著一個人類記者和一個虛擬記者,透過不同的視角看世界。未來,機器人新聞或許有以下發展方向:
1.跨領域的多面手
目前來看,新聞機器人的寫作能力還僅僅停留在某一領域。像新華網的快筆小新,它其實是有3個分身,每個分身各處理一個領域的新聞消息。隨著其數據處理能力的增強,以及數據開源成為可能。跨領域的機器人新聞寫作將成為可能,這樣一來,不僅大大節約了成本,而且寫出的稿件將更加全面,不同數據庫的資料可以相互補充,取長補短。
2.人類記者、編輯的助手
將來的新聞編輯部很可能出現二加一的局面,即機器人記者同人類記者撰稿,機器人編輯同編輯共同審核把關。機器人記者可以對大量文本、音視頻數據進行處理,形成報道提綱或數據圖表,使得記者省去了查閱資料,整理匯總的不便,對報道重心做到心中有數,下筆有神。同時,可以協助編輯校對文稿,并快速發布到各媒體終端。
3.平等的交流者
目前為止,寫作機器人還停留在單向度的接受指令,進行運算的層面。也就是說機器人還只能停留在輔助記者工作的階段。但相信在不久的將來,隨著數據量的增多,機器的運算能力的增加,以及機器對于自然語言理解能力的增強,機器人可以平等地同人類進行交流,對人類的意見進行反饋建議。
4.多平臺終端、數據庫資源的連通者
未來,隨著各機構數據庫、不同平臺之間的不斷開源,新聞機器人可以實現“推”與“拉”的多平臺終端、數據庫資源連通。一方面可以將寫好的稿件快速同時上傳到多個媒體平臺:另一方面,將不同數據庫連通起來,使得數據交叉整合,發揮更大的效能。
5.媒介融合的推動者
在今后的發展中機器人甚至可以將視頻、音頻甚至虛擬現實技術整合起來。實現真正的媒介融合。新聞機器人可能是今后媒介融合的一個具體產物,它出現在新聞現場,根據新聞對象需要,安裝相應的新聞模塊,裝配虛擬現實攝像頭,可以快速寫稿、現場直播、制作VR作品。
參考文獻:
[1]耿磊:《機器人寫稿的現狀與前景》,《新聞戰線》2018年第1期
[2]錢童心:《機器人上崗寫稿人類記者價值更易凸顯》,《第一財經日報》2017年第7期