邢旭東
摘? 要? 機器人還處在弱人工智能階段,無法思考文字含義,無法有意識地運用文字指代周圍世界,其寫作像是玩文字組合游戲,按照某些方式將文字與數據組合起來形成新聞。其寫作模式主要有三種。一是基于定制模板的數據填充模式,結構和文字由人類設置好,部分地方留出“空格”,讓機器人抓取數據填充。二是基于自動摘要的二次創作模式,機器人提取同一主題下多篇報道的摘要進行整合寫作。三是基于機器學習的智能化寫作模式,全方位模仿人類,寫出有傾向性、有特色的作品。
關鍵詞? 新聞機器人;人工智能;媒體;寫作模式;定制模板;自動摘要;機器學習;深度學習
中圖分類號? G2? ? ? 文獻標識碼? A? ? ? 文章編號? 2096-0360(2019)13-0024-04
新聞機器人指的是能夠模仿人類的思考和行為方式,從事新聞采訪、寫作和編輯工作的智能化軟硬件系統。新聞機器人可以在特定領域寫作出合格的新聞作品,甚至在有些方面超越了人類記者。但是由于新聞機器人目前還不具有自我意識,因此不能真正的理解新聞事件對于自身、對于人類、對于世界的含義。
1? 新聞機器人的發展現狀
1.1? 引入新聞機器人從事采編工作已經成為傳媒業的趨勢
紐約時報明確指出,由機器人記者主導的新聞行業正在迅速崛起[1]。2014年開始,華盛頓郵報、洛杉磯時報、衛報、路透社、美聯社等國際頂級媒體分別擁有了新聞機器人系統。目前,美國的彭博新聞社,有1/3的新聞都是由機器人完成的。從2015年開始,國內的新華社、騰訊、百度公司也擁有了自己的新聞機器人,目前國內至少有數十家媒體和公司擁有了自己的新聞機器人。
1.2? 新聞機器人還處在不懂裝懂的弱人工智能
階段
新聞機器人的核心是人工智能。“人工智能可能需要一段時間才能充分發揮其潛力。這一潛力的范圍大到難以想象”[2]。依據其對人腦模仿的程度分為兩個大類:強人工智能和弱人工智能。強人工智能指的是機器人具有與人類相同的認知能力,能夠理解事物的意義。弱人工智能指的是機器人不需要具有與人類一樣完整的認知能力,只要設計的看起來像具有智慧即可[3]。
目前,機器人還處在弱人工智能階段,其寫作更多像是在玩文字組合游戲,按照某些特定的方式將文字與數據組合起來,寫出看起來有意義的新聞報道,其實就是不懂裝懂。現階段的新聞機器人無法思考文字的真正含義,無法理解文字對于現實世界的指代關系,不能夠有意識地運用文字符號去指代周圍世界,也無法真正理解事物的意義,還處在弱人工智能階段,“機器人能夠通過編程來解釋符號,可他們無法感覺其中的含義”[4]。
2? 研究新聞機器人寫作模式的意義
2.1? 新聞機器人給人類記者帶來了挑戰和機遇
新聞機器人既是人類記者的競爭者,又是人類記者的有力助手。新聞機器人在一方面取代記者的部分工作,特別是機械性、重復性的材料收集、數據計算和文字校對工作,進而取代記者完成那些有著固定數據來源與寫作模板的新聞報道,記者在內容創作中的獨一無二的地位正在受到機器人的挑戰,部分新聞人會因為機器人的到來而失業。但是另外一方面它又可以使得記者從繁重而枯燥的重復勞動中解放出來,從以人為本、審美需求和社會發展的角度,進行批判式的思考,進行深度調研、深度思考,探索新聞事件深層次的價值與意義,挖掘新聞事件的情感訴求和審美價值,從事更具創造力、更具挑戰性的新聞活動,更好地理解和闡釋新聞事件對于人類社會和特定個體的意義。
2.2? 理解機器人的寫作模式可以幫助記者抓住機遇、應對挑戰
新聞記者要想更好地應對機器人帶來的挑戰和機遇,就必須對新聞機器人的工作方式有一個基本清晰的認識,才能更好地利用機器人的特點,揚長避短,提高工作效率,將更多的時間用于深度調研、深度思考和深度分析,更好地引導機器人成為自身的合作伙伴而不是競爭對手。同時,記者在理解了機器人的工作模式之后,還可以受到啟發,提高自己的采寫技能。因為機器人的工作模式一定程度上是對人類工作模式的優化,可以讓人們看到自身工作中的不足,以及提高工作流程的方式方法,記者可以從機器人的寫作模式獲得啟示,從而提高自己的新聞采寫效率。
3? 新聞機器人寫作的三種主要模式
3.1? 基于定制模板的數據填充模式
這種模式就像讓機器人做填空題一樣,新聞報道的基本結構和文字表述都是人類記者和編輯預先設置好的,只是在文中的部分地方留出“空格”,讓機器人填充。機器人在互聯網上抓取數據,如人名、地名和數字等,對數據進行相應的計算或其他形式的處理,然后填充到人類預先設置好的文字模板中。針對同一個主題預先設置好的模板可以有多個,機器人會根據獲得的數據選擇使用具體的模板。
比如,機器人要寫作一篇基于模板的單只股票的報道,編輯們已經設置好了如下模板,“**年**月**日,**股份股價進一步(拉升/下跌),上漲**,截至發稿,該股報**元每股,成交**手,換手率**,振幅**。”,“**”部分就是機器人需要從互聯網上抓取數據、計算并填充進入模板中的。括號中(拉升/下跌)的文字部分需要機器人對數據計算后進行選擇判斷。這種寫作模式適合于由數據驅動的財經新聞、體育新聞和天氣新聞,對于深度報道是無能為力的。
機器人采用這種模式可以輕松的分析出一家上市公司業績變化的趨勢,以及與同行業其他公司相比其經營狀況的優劣。美聯社新聞機器人Wordsmith可以在一秒鐘生產數千篇財經,之所以能夠實現這種高效的寫作,其實它就是將上市公司的數據及其處理的結果放入預制好的模板。《華盛頓郵報》的寫稿機器人heliograf針對大選所寫的報道,也采用了這種模式。《華盛頓郵報》的編輯,需要先設置好故事模板,“模板建立以后,可以將相應的數據簽套到heluigraf的模板當中。”[5]
那種數據驅動的體育報道也比較適合這種模式。下面這條新聞由“今日頭條”的機器人AI小記者撰寫的,“北京時間8月15日07:30時,現世界排名第8的戴資穎在奧運會羽毛球女子單打小組賽中勝出。戴資穎本輪的對手是現世界排名第52的娜塔莉亞-佩米諾娃,實力不俗。但經過28分鐘的激烈較量,最終,戴資穎還是以總比分2︰0戰勝對手,笑到了最后。”除了人名和數字以外,其他的文字表述應該都是事先模板里面設計好的。包括“實力不俗”“激烈較量”“笑到了最后”等帶著人類感情的詞匯,其實都是預先放進機器人寫作模板的。此種寫作模式只適合于由數據驅動的新聞報道,那種需要敘述故事情節和描寫場景細節的新聞報道顯然不能使用這種寫作方式的。
3.2? 基于自動摘要的二次創作模式
這種模式就是讓機器人在互聯網上自動獲取特定主題下的大量新聞報道,在分析處理之后,提取同一主題下多篇報道中最能表現主題的精華摘要,然后進行整合寫作,形成一篇新的報道,對機器人而言,可以看作是二次創作。記者和編輯提供的主題關鍵詞,機器人根據關鍵詞去查找和收集相關的文字報道,按照一定的算法提煉這些文字素材的摘要,然后將這些摘要進行二次加工,整合形成一篇新的報道。當然為了體現創新性,會對語言做一些處理,比如句子的壓縮、同義詞的替換等。
自動新聞摘要就是用正文中的一些關鍵語句來概括整篇新聞報道的大致內容,用戶通過閱讀摘要就可以了解原報道的主要意思。自動摘要方法“基于一個假設,一篇文章的核心思想可以用文檔中的某一句或某幾句話來概括,那么摘要的任務就變成了找到文檔中最重要的幾句話,也就是一個排序的問題”[6]。這里介紹一種文章比較常見的自動摘要模型。機器人程序對報道中的所有句子打分,得分高的句子按照順序組合在一起。對句子打分的標準分為三部分。第一,句子位置。根據句子在全文中的位置給出分數。比如第1句話得分最高,第2句話次之,第3句話的得分又稍低。當然,每段第1句話也可以賦予較高的分數。第二,文章內容與文章標題的關系。句子是否包含標題詞?包含多少標題詞?根據句子中包含標題詞的多少以及對標題意義的呼應程度來打分。第三,句子關鍵詞。首先對文章進行分詞,統計每個詞語的頻率,將排名前5或者前10的有意義的詞語提取出來,作為關鍵詞,通過統計句子中包含關鍵詞的情況以及關鍵詞之間的間隔距離來打分。除了這種摘要模式,還有其他的摘要模式,都有一定的合理性與不足。
該過程涉及自然語言處理(Natural Language Processing,簡稱NLP)技術,它是人工智能和語言學交叉融合下的全新研究領域。主要研究如何幫助計算機最佳地理解、處理和生成人類的自然語言。主要技術范疇包括自動分詞、詞性標注、句法分析、文本分類,文本情感分析、自動摘要、語音識別與合成等。涵蓋了語言學、數學、心理學、哲學、統計學、計算機科學、生物學等領域的理論知識。這也是百度機器人writing_bots的寫作方式之一,百度機器人“在已有稿件的基礎上,通過內容分析聚合生成新的文章。因為是基于己有稿件內容創作的新的稿件,因此可以看作是二次創作”[7]。
新聞機器人在寫作體育新聞和娛樂新聞時,也經常使用這種模式。在體育報道中,機器人獲得比賽的直播文字之后,依據關鍵詞出現的頻率或者其他標準,對直播文字進行語句進行打分,將得分高的句子抽取出來,按照一定順序重新組合,最后生成一個比較精彩的體育報道。如果是娛樂新聞,機器人按照一定的算法標準,分析明星微博中和網民跟帖中最具哪些語句得分高,然后把明星微博和網民跟帖中得分高的語句摘錄出來,同相關的背景信息組合在一塊,就可以形成一篇不錯的娛樂新聞。
3.3? 基于機器學習的智能化寫作模式
這種模式就是讓機器人全方位地學習與模仿人類記者的寫作方式,對采集到的新聞素材進行完全自主的加工處理,寫出有傾向性、有情感、有風格特色的新聞作品。不需要預先定制好的模板引導,也不會只是將獲得的摘要進行簡單組合,而是在對新聞素材進行語義解析的基礎上進行真正意義上的全新創作。人工智能領域現在還在對這種模式進行艱難的探索,取得了一定的成果,但是進展還不是很理想。
這個模式的核心是機器學習。機器學習“用類似于人類的方式來學習,即從經驗中學習并在獲得更多經驗的同時繼續完善其表現”[8]。機器人在寫作之前,會在人類的指導下進行學習,通過解析海量的新聞文本,掌握基本的寫作技能,這也是新聞機器人真正的魅力所在。“機器自己就能從大數據中尋找特征、發現規則、總結模型……是擅長‘發現套路的行家里手”[9]。“比如把某日報過去10年每期的所有文章標題,以及專業人士對這些標題的評判結果輸入給深度學習(機器學習的方式之一),它自己會琢磨出其中的規律并建立預測模型”[10],然后機器人根據挖掘出的規律和模型為文章制作出比較優秀的標題。
這類新聞寫作機器人的智能核心,一定程度上模仿人類的神經網絡,對獲取的海量的新聞報道進行深度解析,分析與梳理出新聞報道中字詞的搭配、語句的銜接以及段落的過渡方式。進而學習和模仿人類的新聞寫作模式,學習和模仿名記者的寫作風格。在訓練完成之后,可以實現完全自主的數據抓取、新聞線索發掘以及新聞寫作。此類機器人可以對平淡的原始新聞素材進行加工,使其具有某種典型的寫作風格和情感傾向性,可以是模仿某位名記者的,也可以機器人自己獨創的。此類機器人也可以對某個話題下的網民言論進行有效的分類、總結和情感分析,從而揭示網絡輿論的走向。當然,也可以揭示某些事物之間的復雜聯系,并呈現在新聞報道中。
當然,人類目前對于大腦的運作機制的認識還不是很深刻,對于自我意識的本質還沒有搞清楚,因此,人工智能的算法不能完全模擬人類的思考和行為方式,采訪寫作和編輯活動總體而言還顯得比較呆板、簡單。但是,隨著人工智能學科的快速發展,基于機器學習模式的新聞機器人在未來數十年應該有迅猛的發展,新聞機器人在對外部環境的感知和理解方面,對新聞價值的判斷方面,以及對文字符號的運用方面,可能有一個質的飛躍。
這三種寫作模式并不是截然分開的,很多時候是有機融合在一起的。就目前而言,前兩種寫作模式已經投入了新聞傳媒業的實踐應用,一定程度上替代了新聞采編人員的低端重復勞動,引導新聞采編人員從事更有創造力、更有價值的新聞活動。第三種寫作模式目前還處在探索和萌芽階段,但卻是最有發展前景的機器人寫作模式。
4? 人類記者如何應對機器人的挑戰
人工智能正在深刻而迅速地改變著新聞傳媒業,媒體為了應對競爭,必然會引進機器人來提高工作效率,機器人寫新聞已經成為無法避免的趨勢。不少新聞人已經感受到了人工智能帶來的威脅,認為記者的飯碗會被新聞機器人搶走。在新聞寫作方面,人類記者如何應對機器人的挑戰?
首先,記者應該充分發揮自身進行現場采訪的優勢,深入現實生活的各個領域、各個角落,進行深入、細致的調查采訪活動,獲得第一手的、原創性的新聞素材,并保證資料的真實性和可靠性,在此基礎上進行新聞創作。在采訪思維和采訪行為的創新方面,新聞記者都遠超機器人,很多對人類記者比較輕松的采訪活動,對于機器人而言,都是很難實現的。
其次,人類記者在新聞寫作中應該充分體現人文關懷的意識,體現出對人類尊嚴、人類情感、人類自由、人類價值的重視,這種重視必須是發自內心的、真誠的,而不是像機器人運用預設語言模板來模擬出的人本色彩。
再次,人類記者應該通過靈活多變的寫作風格,來同機器人相對呆板的寫作風格競爭。機器人的寫作很大程度上受到預設模板和程序算法的限制,變化比較少,寫作風格比較呆板,也很難運用暗喻、反諷等修辭手法。人類記者具有無窮的創新力,具有天馬行空的想象力,在寫作方式、寫作風格,以及語言的表述上,可以有無窮無盡的創新力,可以巧喻善比,可以巧妙地運用多種修辭手法,人類記者應該充分發揮這方面的優勢。
5? 結束語
通過對機器人寫作模式的探析,不難看出,機器人在基于模板和基于摘要的新聞寫作中,已經可以完成合格的作品,很大程度上可以減輕甚至是替代人類記者的工作。但是,也不必對此感到過度的悲觀。人類有很強的適應性和無窮創造力,具有自我意識和情感傾向性,這些都是目前處于弱人工智能階段的新聞機器人所不具備的優勢。即便是基于機器學習的智能化寫作模式,也無法消解人類記者在深度調查與深度思考方面的優勢。并且,機器人可能永遠也無法具備人類的同理心和悲天憫人的情懷,哪怕發展到了強人工智能階段也是如此。人類記者應該將機器人視作自己的合作伙伴,將重復、枯燥的低端工作留給機器人去處理,將時間和精力放在更有價值的新聞環節中,創作出更有深度、更有內涵、更具有人類情感的新聞作品。
參考文獻
[1]機器人記者崛起,難道我們工作真有價值嗎[EB/OL].(2019-02-09).http://mini.eastday.com/mobile/190209120706584.html.
[2]費朗索瓦-肖萊.Python深度學習[M].北京:人民郵電出版社,2018:11.
[3]林大貴.TensorFlow+Keras深度學習人工智能實踐應用[M].北京:清華大學出版社,2018:26.
[4]約翰普利亞諾.人工智能時代的人類生存法則[M].北京:文化發展出版社,2018:79.
[5]機器人寫新聞這件事,現在進展到哪一步了?[EB/OL].(2017-02-19).http://tech.qq.com/a/20170219/005801.htm.
[6]人工智能,基于深度神經網絡的自動文本摘要[EB/OL].(2017-08-13).http://www.360doc.com/content/17/0831/04/37113458_683452166.shtml.
[7]你看到的文章其實都是它寫的.解密百度智能寫作機器人[EB/OL].(2017-04-12).http://www.sohu.com/a/133447139_500657.
[8]路易斯德爾.人工智能大爆炸[M].深圳:海天出版社,2019:54.
[9]王作冰.人工智能時代的教育革[M].北京:北京聯合出版公司,2017:31.
[10]王孌.深度學習給新聞行業帶來的機遇和挑戰[J].新聞戰線,2018(1):27-28.