趙晗陽
自動化新聞指的是在新聞生產過程中“在沒有或者有限的人類干預下,由預先設定的程序將數據轉化為新聞文本的自動算法過程”[1],是隨著技術提升和數據庫資料的擴充,由計算機輔助報道演化而來的新聞生產新方式。
自2015年始,國內的自動化生產技術與新聞內容也進入快速發展時期,騰訊的“Dreamwriter”、新華社的“快筆小新”、阿里巴巴與第一財經的“DT稿王”、今日頭條的“Xiaomingbot”、百度的“度秘解說”、南方都市報的“小南”以及廣州日報的“阿同”等機器人寫手相繼推出,自動化生產成為新聞傳播的重要組成部分。
與當前自動化新聞廣泛的生產實踐活動相較,自動化新聞的學術研究相對滯后。筆者將從三種關系層面對自動化新聞的邊界進行探析,以厘清自動化新聞研究領域存在的三種誤區。
在前述的由預先設定的程序將數據轉化為新聞文本這一新聞生產過程中,國內學界一直存在機器人新聞與自動化新聞這兩種稱謂,筆者認為,這一對概念之間有很大區別:
一方面,從形式上看,機器人新聞強調存在機器人這樣一個實體,或是肉眼可見的一個科技產品,通過此類產品形成新聞稿件;自動化新聞并無較高的產品形式要求,生成新聞依賴的是抽象的計算機軟件、代碼或數據。
另一方面,從內容上看,機器人新聞的外延更廣,強調新聞生產需從新聞采集延伸到新聞產品呈現的全自動。從當前的實踐情況看,自動化新聞只需在相應的數據庫中搜尋符合某種算法的數據進行新聞生產,對新聞的采集與分發無具體要求。機器人新聞與自動化新聞是兩種不同的概念。當前我國對此種新聞生產行為的研究應是更注重算法的自動化新聞。筆者下文將統一運用“自動化新聞”這一稱謂代替“機器人新聞”這一模糊概念。
有學者認為,自動化新聞是一種基于大數據的生產模式,大數據時代的到來將自動化新聞的分析對象由結構化轉為半結構化乃至非結構化,筆者看來,這種觀點實為對大數據與自動化新聞關系的強扭。

首先,從數據量的角度看,此數據應為單機處理不了的內容(如內存限制、時間過久等),定量來說至少是PB級別以上的數據才能算是大數據。
其次,復雜算法也是動用大數據的基本條件之一,如自動化新聞所需數據只是PB級數據庫中數據的簡單累加或簡單計算,也不能稱之為動用了大數據的方式進行處理。
真正的大數據運算是同時滿足數據量和復雜算法這兩個標準時才會動用的手段。因此,自動化新聞生產和大數據的處理技術基本沒有關聯。自動化新聞的工作人員會構建一個相對有限的數據庫。拿一場籃球比賽來說,新聞算法動用的數據也不過是歷史上相關籃球比賽的所有數據,對于球員的度假信息、教練是如何參與當地政治一類的延展性信息并沒有過多涉及。即使是自動化寫手計算了該領域全部報道者的語言文字特點,算法所基于的數據也只是有限的結構化數據,而非半結構化甚至非結構化數據,更不用說大數據所謂的全量數據。基于此的算法只需要計算一下兩球隊歷史上的交鋒次數與勝率,某球員獲得職業生涯最高分等數據,用較為簡單的算法嵌套在預先寫好的模板中,便可生成新聞內容。從以上分析可以看出,那些強扭自動化新聞與大數據關系的觀點顯然是站不住腳的。那么大數據與自動化新聞的關系是什么呢?
大數據時代的核心是預測,這種預測精神才是大數據帶給自動化新聞的最大貢獻。通過這種思維的創新,數據處理人員可以在相對結構化的數據里通過某些算法找出所研究對象的發展趨勢,對其進行基于海量數據的合理預測,以此更好地研判自動化寫手不太擅長的分析類報道。
當前學界對自動化新聞的生產流程基本達成共識:經由一個結構化的數據處理、新聞性的測量、報道角度的選擇及排序、報道角度與數據點的匹配及報道文本的生產過程。從流程中我們不難看出自動化新聞是一種從信息數據經由特定算法到達新聞文本的生產過程,但其所生產的新聞文本并不是最終投放界面的新聞產品,而是上傳到發布者的內容管理平臺就結束了整個流程。
從當前學界對自動化新聞的研究看,對其積極影響中的滿足個性化需求、放大長尾效應以及消極影響里形成的“過濾氣泡”“信息繭房”以及造成“單向度的人”的觀點,筆者不敢茍同。
推送分發軟件可以通過分析用戶的瀏覽記錄和喜好,運用某種算法,點對點地為用戶推送其喜聞樂見或關心的新聞信息,具體來說,推送機制主要依靠用戶資料與用戶瀏覽記錄等建立與新聞內容相似的匹配模型,并通過用戶的點擊收藏等正向反饋與標記“不感興趣”的負反饋不斷優化和提高投放的精準度,但這都已經超出了自動化新聞這一生產流程的范疇。如果我們強行認為,正是因為自動化新聞可以在短時間內生產海量的新聞,才使得推送的算法擁有更多可以個性化精準投放的資源,那無異于《寡人之于國也》中所描述的:“刺人而殺之,曰:‘非我者,兵也。’”基于以上觀點,我們可以做出判斷,自動化新聞旨在進行新聞文本生產成型以及之前的流程實踐,至于如何推送,是由其他算法進行的,自動化新聞與新聞信息的推送機制無直接關聯。
學界普遍認為,自動化新聞的發展,不會帶給新聞業和人類記者毀滅性的打擊,相反我們要利用好自動化寫手,使之與人類記者在新聞寫作的廣度和深度方面互補長短,助推新聞業的全面進步。
在撫育管理方面,林地間作不科學、不合理;林地撫育管理不及時,管理經營粗放,導致原有油茶林地灌木和雜草瘋狂生長,造成與油茶爭光、爭水、爭養分,使得油茶長勢頹廢不健壯、欠佳。
與當前研究領域的觀點相同,筆者也相信自動化新聞的發展會帶給新聞界更多積極的變化與發展,但發展的方面和程度,需要我們仔細考究并提出特色化發展建議。除去已有研究成果中的擴展信息采集庫、提高相關技術水平、增加算法信息透明度、“術業專攻”地生產專業新聞外,筆者在新聞信息搜集、新聞事實核查與新聞產品融合角度對自動化新聞做出展望。
在上文中,筆者指出我國當前研究領域的自動化新聞是由提取數據庫中有效信息而進行的新聞生產,但隨著技術的發展,自動化新聞的外延應更為廣闊。
2016年3月,《華盛頓郵報》研發出聊天機器人“Feels”,在美國總統大選三周前,“Feels”聊天機器人每天晚上以一個簡單的問題與讀者互動:“今天的大選讓您感覺如何?”隨后的第二天早上,聊天機器人便向用戶推送關于前一天大選的感覺圖表和關于用戶感覺的原因摘錄。[2]通過此種方式,“Feels”將用戶信息采集并儲存在自己的信息庫中,直接充當了傳統自動化新聞中的數據庫。學者匡文波提出:“技術總是會讓新聞報道增色”[3],我們有理由相信自動化新聞的光明前景。如若將機器人的信息采集、自動化新聞生產與新聞信息推送的算法整合到同一產品之中,自動化新聞就將由半自動化轉向全自動,新聞實踐就會有突破性進展。
2016年,英國的一家事實檢查機構 Full Fact發布了測試版的監控系統,旨在從幾十個英國新聞網站(BBC、衛報等)中搜尋信息,自動分析英國議會記錄和其他一些內情,目標是捕捉每個謠言的生命周期,進而粉碎這些謠言。Full Fact下一步的計劃是以概念驗證的方式進行自動化檢測和核實統計出來的報道,在確保數據機器可讀的情況下提高人工智能的情景分析能力。[4]
這個實踐活動向我們展示了自動化新聞作為客觀無思想的科技產品,不僅在新聞生產領域有重要作用,在事實的核實方面也有人工無法達到的優勢。正如Full Fact 的主任 Will Moy所言,事實核查在信息來源中監控媒體、確認關于事實的報道、檢驗真假和公布核實結果的四個階段都可能實現自動化。
在美國學者簡·斯蒂文森(Jane Stevens)的定義里,融合新聞是文本、照片、視頻段落、音響、圖表和互動性的集合體,它以非線性結構呈現在網站上,不同媒介的內容互相補充且不重復。[5]若想拓寬自動化新聞的報道領域,提高新聞內容的深度和適用性,應使其所生產的新聞產品呈現出融合的形式。
自動化新聞一個很大的問題在于其涉足領域局限在天氣預報、體育賽事、公司財報、信息匯編、突發快訊等,但這種劣勢恰恰也是自動化寫手占領上述領域的有利條件。自動化新聞的算法不僅可以選取海量數據中的相對應數據嵌套進模版以生成文字,運用其準確高效的算法生產圖表、鏈接相關新聞及圖片,未來甚至可以做到在技術從業者將所采集到的音頻、視頻上傳到材料庫中后對其音頻和圖畫信息進行解碼、重新編碼,最終形成嵌套文字、圖片、音頻、視頻等小模版的融合型大模版,直接生成融合式新聞內容,再由相關從業人員進行簡單的人性化處理,形成新聞產品。2016年10月,美聯社戰略企業發展部高級副總裁JimKennedy,在接受采訪時透露了美聯化人工智能應用的下一個方向:將文字新聞自動轉換為廣播。[6]該項目的設想是,開發團隊集中于一項特定的體育項目,制作出將文字轉換為廣播的模版,在此基礎上開發出適用于這一轉換的算法。這種融合式的新聞既保證了新聞時效性,又使自動化寫手所生產的新聞內容得到更充分的展示,是吸引用戶關注、增加用戶在特定領域的黏性的可行之舉。
注釋:
[1] 許向東,郭萌萌.智媒時代的新聞生產:自動化新聞的實踐與思考[J].國際新聞界,2017(5).
[2] 聊天機器人是新一代資訊App?《華盛頓郵報》最新開發手記曝光|獨家編譯[EB/0L].傳媒狐,[2016-12-19].http://www.sohu.com/a/121939061_465296.
[3] 匡文波.記者會被機器人取代嗎?[J].新聞與寫作,2017(9).
[4] 在人工智能和新聞的結合上,國外媒體已經飛起來了?[EB/0L].刺猬公社,[2016-12-06].http://36kr.com/p/5058392.html.
[5]Jane Stevens.multimedia storytelling: learn the secrets from experts at multimedia storytelling institute 2014 [EB/OL].[2013-12-14]. http://multimedia.journalism.berkeley.edu/tutorials/starttofinish/multimedia/.
[6] 美 聯 社 黑 科 技 :機 器 人 寫 稿, 還 要 轉 換 成 廣 播 [EB/0L].傳 媒 狐 ,[2016-11-05].http://m.sohu.com/n/473268658/?pvid=000115_3w&_once_=000022_shareback_wechat_flow.