文|劉挺
機器人來了,記者去哪兒
文|劉挺

美聯社、紐約時報用機器人寫新聞的消息一度充斥媒體,最近騰訊財經也用機器人寫新聞了,“狼”不但來了,而且在中國登陸了。古往今來,寫作是人類的專利,關乎人類的尊嚴,無生命的機器真的能夠替代人嗎?本文是一個工科背景的人對這位“狼先生”的看法,嘗試探討機器人技術將對新聞領域產生的變革。
機器人將給新聞領域帶來的沖擊包括四個方面:編輯、寫作、傳播、輔助設備。
注:在新聞領域談機器人,并非特指有胳膊有腿兒的人形實體機器人,而是泛指能夠模擬人的某種能力的智能信息處理系統,可能有硬件載體,更可能是純軟件。
互聯網對新聞界的沖擊首先是試圖替代編輯,以Google News為代表的互聯網公司推出的新聞服務,可以快速地采集各大傳統媒體的新聞報道,并自動地將其分類匯總,篩選出當天廣大讀者可能會共同關心的話題置于頭版。這一度引發了版權之爭,但互聯網公司有強大的入口優勢,能夠為傳統媒體帶來流量,雙方很快達成了合作的默契,而且每天的熱點新聞也就那么幾條、幾十條,機器并沒有發揮出其大規模計算的能力,選出來的新聞也未必有人類編輯的眼光那么敏銳獨到,所以不足以構成對傳統媒體的威脅。
此后,以“今日頭條”為代表的個性化新聞火了,要每天為每一位讀者編輯一份符合其閱讀興趣的獨特的電子報刊,這個計算量是巨大的,人類編輯完全無法承受。“今日頭條”是對傳統媒體的有力補充,但它同樣只是編輯篩選新聞,而不是生成新聞,同樣不會危及傳統媒體人的生計。
現在,機器人寫手登場了,機器原創的新聞出現了,革命的旗幟在地平線上時隱時現,恐慌隨之而來。然而,理性地將機器當前能夠達到的智能水平,以及與人類記者相比所具備的優勢分析一番,就可以看出:機器在可預見的未來可能吞噬的人類記者的生存空間是有限的。
機器寫手目前能夠寫的新聞都必須是“規范化”的新聞,比如財報,體育比賽的報道,對地震的報道等,而完全無法寫出具有“自由風格”的新聞。要寫規范化的新聞,可以從大數據中自動抽取出一些關鍵的數字,比如籃球比賽中的進球數、籃板數等,把這些數字自動地填充到人事先編輯好的模板(套話兒)里,一條新聞就誕生了。
人們可以對同一類事件寫出花樣繁多的模板,以免讀者很快察覺到機器新聞刻板生硬的缺陷,也可以利用人工智能技術,具體地說是自然語言處理技術自動地從人類撰寫的大量同類新聞中自動抽取模板再經人過濾修訂,以便提高模板庫的構建速度,以及模板的多樣性,但機器一旦闖入缺少嚴格規范的新聞話題中,或者那個話題也有一些規范可循,但除了規定的骨架要素外,還需要更多的鮮活靈動的內容,需要一些個性化的細節,需要栩栩如生的描寫和或多或少的煽情,需要獨立的見解以及提出一些開放的問題引起讀者的深思,需要分析事件背后的原因揭示出問題的實質所在,此時,機器,失靈了!這就是機器新聞寫手當前的局限,也是未來機器智能寫作要重點研究的課題,即從“規范化新聞”到“自由風格的新聞”,但這有很長的路要走。
雖然,由于機器能力的局限,在可預見的未來還無法替代人類記者寫出自由風格的新聞,但與人類寫手相比,機器的優勢也是不容小覷的,這包括:
(1)機器的速度快,比人更善于應對突發事件,比如一旦地震,機器可以從地震局的大數據中第一時間采集到異常波動,搶先發出災難來臨的新聞;
(2)機器人比新聞人更不知疲倦,人可以熬夜到清晨,而機器永不停歇;
(3)機器新聞具有客觀性,除非事前或事后進行了人工干預,否則機器寫出的新聞就是結構化數據的一種文本形式的可視化表現,基本上不會歪曲數據;
(4)最后,也是最為重要的:機器有可能從大數據中挖掘出人類寫手受視野限制,受時間和精力的限制,而無法發現的頗有價值的新聞話題。一個非常有挑戰性的研究課題是:如何從大數據的異常變化中自動發現能夠引起公眾普遍討論的新聞話題,即新聞價值的自動預測。事情已經發生,事實就在那里,但不能夠被挖掘出來推送到新聞頭條就等于不存在,因此,自動挖掘具有傳播潛力的新聞話題,將極大地拓展人類對這個世界的觀察視野。
機器人寫手的出現一方面讓從事規范化新聞寫作的人下崗,一方面又給人類寫手解放出更多的時間去做更有價值的深度新聞的撰寫,技術對行業的變革總是在殘酷的“破”與熱切的“立”的矛盾中呼嘯前行。
在新聞傳播方面,人工智能技術的發展除了可以幫助度量一條新聞的價值,預測這條新聞能不能“火”以外,還可以做很多事兒,包括:
(1) 預測一下,用什么樣的文風(口氣)寫一條新聞,這條新聞可能傳播得更遠;
(2) 自動發現哪些人,尤其是哪些大V可能會對這條新聞感興趣,甚至幫助傳播,如何激活這些人的閱讀和轉發的能量,讓新聞實現最大范圍的覆蓋;
(3) 傳播不但要廣泛,而且希望得到讀者正面的評論。目前做文本情感分析的研究者已經開始做情感預測,即預測某個人或某個群體讀到某條消息后可能產生什么樣的情緒反應。
(4) 傳播效果的事后自動分析,包括量和質兩個方面,量指的是覆蓋了多大范圍的人群,質指的是覆蓋的人群都是什么樣的人,以及這些人對該條新聞產生了什么樣的反饋,如果該新聞的目標是褒揚某個人或某個企業,那么通過從海量評論文本的自動褒貶傾向分析可以準確地判斷是否達到了預期的新聞效果。
在新聞采集和傳播的各個環節,智能輔助設備的介入都可以提高新聞的生產與傳播效率,甚至獲得傳統新聞媒體所無法獲取到的新聞數據,以及無法想象的傳播效果。
(1)無人機航拍從視聽覺的角度極大地拓展了新聞采集的視野。
(2)基于語音識別的新聞采訪自動轉寫技術,能夠把訪談錄音自動轉換為文本,并對文本進行自動的潤色編輯,大幅度提高記者的成稿速度,科大訊飛公司正在緊鑼密鼓地研發這方面的產品,而哈工大也利用其在自然語言處理方面的優勢參與其中。人在對著手機講話時(稱為“語音聽寫”),知道聽者是機器,所以他會調整自己發音的清晰度、講話的速度,以便配合機器,但要記錄人與人之間的自由對話(稱為“語音轉寫”),因為人處于自然狀態,而且可能發表長篇大論,所以語音識別的難度要高很多,而這樣的技術突破將產生的商業價值也要大得多。
(3)聽新聞:讓語音合成的自然度達到讓讀者愿意聽新聞而且感到很舒服的效果,這對于有視覺障礙的殘疾人(盲人)或視覺通道暫時被占用的正常人(比如開車時)都是重要的福音。
總體而言,機器將憑借其不斷發展的智能,在新聞的編輯、寫作、傳播、輔助設備等各個環節上發揮越來越重要的作用,為人類新聞工作者提供更多的支持、補充,當然也包括替代越來越多的人類程式化的腦力勞動。在新聞領域,未來將是人機共生、人機協同的局面,對機器的恐懼是多余的,對人工智能將帶來的變革的理性認知和高度關注是非常必要的。而在推進機器采集、編輯、撰寫、傳播“中文”新聞的過程中,國內中文信息處理研究者經過幾十年的奮斗積累起來的國際領先的中文技術,將發揮重要作用,媒體人與技術專家的充分溝通與協作迫在眉睫。
(作者:哈爾濱工業大學教授,社會計算與信息檢索研究中心主任)