周璐
摘要:社會需求的增長,推動了云計算、物聯網、大數據和人工智能等新技術的發展,促成了如今媒體技術融合的時代。越來越多的互聯網新產品應運而生,成為我們生活中不可或缺的一部分。新聞媒體行業也在新趨勢的帶動下,不斷與前沿科技相融合,提高媒體產能和推廣范圍,準確把控靶定對象。本文主要以輿情分析系統為例,對當下新聞行業進行分析,以及對未來新聞媒體行業的發展做出的思考。
關鍵詞:人工智能;新聞報道;輿情分析;機器書寫;MGC
中圖分類號:G201.7
文獻識別碼:A
文章編號:1001-828X(2019)010-0420-02
一、引言
隨著我們每天的數據以PB規模不斷增長,以及人工智能研究的快速發展,中國傳媒行業已經在人可控范圍內迅猛成長。自2017年12月由新華社在成都發布的中國第一個媒體人工智能平臺
“媒體大腦”成功上線,到如今的媒體大腦“3.0”在進博會上的成功表演。這也就說明,我國目前在信息技術革命領域新聞報道方面已經有了質的飛躍。
在新聞報道方面,不管是新媒體,還是傳統媒體,對于機器寫作助手的認可已經是毋庸置疑的了。例如今日頭條的“張小明”、
“Giiso”寫作機器人、《時代財經》等上千家出版社的“御用”寫手,都已經逐步滲透到了人們的生活中,這些機器人依靠后臺強大的智能語義系統和數十億個數據庫中數千個節點的素材庫、知識地圖和語法功能讓它們躲過了大腦語言系統的審查。隨著數據庫的不斷更新、機器人系統的創新升級和營銷擴大化,新聞報道行業的自動生成系統已經初見規模。
二、輿情分析系統簡報自動生成
輿情分析系統的簡報自動生成,通過前端設定監測時間、關鍵詞等一系列范圍性要點,在系統后臺篩選出有價值的情報信息,并將它匯總到一篇文章中,簡明扼要的對輿論信息及事態進行恰當分析。對于簡報的輸出形式,根據不同的輿論輸入類型,文本生成可以大致劃分為三大類:文本到文本的生成,數據到文本的生成以及圖像到文本的生成[2]。
簡報自動生成系統,主要來自于大量文義的解讀,在文本中抽取出相同含義的句子,將這些句子整合成語義不變的新句子。但是哪些句子是可以抽取出的呢?這個答案來自于句子抽取領域的第一篇論文,由IBM公司的科學家Luhn在1985年撰寫的《TheAutomaticCreationofLiteratureAbstracts》,他表示如果句子當中包含的關鍵詞較多,那么就認為這個句子就越重要,系統后臺就是要根據一定的算法找到這樣的句子,將他們匯總到一起,調整語序和表達詞匯,綜合成一篇簡報。看起來這樣的工作量很大,但對于計算機來說,強大的軟硬件的支持讓需求者可以在眨眼的功夫便拿到這樣一篇簡報。文檔的完整解釋和總結摘要對于人類來說通常是困難的,而對于現有的文本自動摘要技術,也同樣是困難的[1]。這只是最初級最快速的辦法,如果想要深入,簡報完全不能滿足人們對大量內容分析結果的需要。
雖然簡報自動生成系統是初級的,但對于需要每天面對大量數據分析的現代人,簡報又是不可或缺的。
例如,對“全球硬科技創新大會”進行輿情分析,檢測周期為十五天,運用主題聚焦,定向站點采集,元搜索采集及第三方數據引入等手段對國內外新聞網站、紙媒、廣播電視、海外主流媒體等多個渠道多語言進行全面監測,檢測到信息4000余條,新聞報道3600余篇,紙媒報道370余篇等其他信息條。這樣龐大的一項數據監測若是運用人力怕是一件極其艱難的事情,但是通過輿情分析系統可以準確把控到各大媒體的媒體走向、媒體流量、關注度等。將輿論后龐大的數據根據特定的算法和文本深度語義算法自動分析,得到所需基本內容概述。
三、文字自動生成的特點
目前,學術界對“機器人寫作”的更一致的看法是,它是基于計算機的程序算法,在此基礎上捕獲和分析信息內容。然后運用一種新的新聞制作方法,使用自動生成內置模板的手稿完成新聞報道。目前用于財務,體育和災難性報道,特別是對于大量數據的新聞報道,它具有固有的優勢[3]。
1.新聞報道生產速度之快,數量之大是人類望塵莫及的。生產之快源于它基于計算機強大的大腦,它可以在收集巨量數據后進行整合,這包括靜態數據,也包括動態數據,即每時每刻所發生的信息,都要在同一時間錄入到智能語義庫進行讀取,并在下一瞬間進行篩選、分割和重組,直到事件完成。同時,由于強大的數據儲備支持,電腦也會在同一時刻調取到以往相關數據進行分析,確定相關性以及匹配性,這一系列的動作都是在大數據中來回的快速穿梭,以求在最短時間內,完成高質量的新聞報道。如今,一篇文章的完成我們已經可以用毫秒或是秒來計算了。
由于生產速度的提高,機器又優于人類不知疲勞,所以機器的新聞報道生產數量是巨大的。在上百家媒體中的新聞報道一年可達10億個,平均每秒2000篇的速度。智能化生產,在提高生產率的同時,節省了成本,增加了收益。
2.新聞報道是個性化的。基于現有龐大的數據庫和智能分析軟件,我們可以輕易的找到每個人,每個領域,每個年齡階段等不同類的語言使用習慣;另外,還可以根據需要、偏好和讀者群去人為設定新聞生成的種類與個性。騰訊公司的Dreamwriter推出個性化的實時多版本功能,其寫作邏輯是在達到一定的觸發條件后,系統通過對若干計算模型進行定量和定性的分析,自動根據數據選取合適的表達模板,將數據與模板相結合。[4]這樣的文章就不會是機器式死板的,而是靈活可變的。
四、媒體大腦生成“MGC”
在新聞生產的這100多年的歷史上,從最初的專業化生產到業余化生產再到如今的智能化生產,從個人非營利性生產到成為專業職業,從靠人力資源到如今的多維融合。隨著智能化新聞生產逐步走向潮流,UGC、PGC已經成為了我們新聞發展道路上的主要形式。而MGC(Machine?Generated?Content)也悄然到來。MGC一個通過攝像頭、無人機獲取視頻及數據,然后經由識別技術讓機器進行價值判斷,最后依托于媒體大腦將理解到的內容進行關聯,檢索語義,編版,最終智能生產新聞的新興技術。
第一條MGC新聞,時長2分08秒,由“媒體大腦”中的2410(智能媒體生產平臺)生產,耗時10.3秒。2018年全國兩會上發布了全球首條關于兩會實時內容的MGC視頻新聞——《2018兩會MGC輿情熱點》,這是在5億條輿情熱點信息中綜合篩選匯總后生成的。可見,智能新聞生產已經開始擺脫單一的呈現形態、單一的表現方式和單一的題材領域的局限,人類的新聞生產活動被真正帶入到全媒體、多形態、多領域的新聞生產過程中,利用新的媒介技術創新新聞生產方式。[5]
利用MGC進行新聞生產,最終形成富媒體新聞,這是一個需要多學科雜合融匯的過程,是一個技術深度交叉融合的結果,攝像頭、傳感器、AI技術+大數據,每一項都是真實可靠的。機器是不會說謊的,它記錄到什么,收集到什么,就會反饋出什么,系統同樣會辨別出新聞的真實度,讓未來新聞越來越客觀真實。另外,MGC的生產效率之快是人類所不能企及的,人類生產一條新聞視頻的時間,媒體大腦可以生產180條,并且它還可以保證在快速出產的同時依靠全球最大新聞資訊庫使信息達到精準無誤。
MGC新聞是將算法+數據+遙感相結合的產物,它提高了危險新聞報道的安全性,使得在某些特定地點,特定時間,不再需要人類去做一些繁復簡單或是充斥危險的一線工作。隨著科技的不斷進步,“MAGIC”的提出,各媒體平臺相互交融,以擴展傳播途徑和廣度,實現新聞報道新方向的新發展。五、新聞報道未來的發展
1.人機協同。寫作機器人、媒體大腦等新型的媒體手段,是新聞領域科技時代的前沿技術。時代在發展,但無論人工智能發展到什么樣的階段,人工智能都不會凌駕于人類之上,當然,這需要人類對這一領域做出一定的行業標準,在人類可控范圍內,最大化的突出人工智能區別于人的優勢。人類要與它們協同合作,強強聯手,優勢互補。運用人類的思維和機器的速度,實現傳媒行業人機一體化的轉變與進步。
2.思想是先鋒。從目前的機器人寫作情況來看,詩歌、對聯、專項新聞等占主要部分,而散文隨筆小說等帶入感情的純文學的作品,機器人還是達不到的。現代機器人無思想,無趣味性,無人情味,缺乏現場應變能力等等與情感有關的方面永遠都是他們的短板。在人類世界中,那些有溫度的話題,有微妙情緒的語句,也只有人類自己可以理解,這些無形的情感,是很難用程序化的代碼可以代替的。另外,傳媒人也應不斷思考新鮮事物,將多樣化的信息以新穎的方式展現在人們面前,在永遠保持一顆對主流事態和社會的責任心和社會認同感的同時,提升眼界和思維。
六、結語
在新聞報道領域發展的舞臺上,人與機器,并不應該是同臺競賽,對于新聞業的未來,也應保持一顆平常心。在這個逐步發展,轉變的過程中,本著從用戶的角度來看待科技創新帶來的發展,堅守住新聞人心中的底線。我們有理由相信,在未來,“人工智能+大數據”必將帶來可以期待的精彩。
參考文獻:
[1]Mani?I?.Automatic?Summarization[M].John?Benjamins?Publishing,2001.
[2]Paper_weekly.EMNLP?2018?|?從對話生成和文本風格轉化看文本生成技術[OL].https://blog.csdn.net/c9yv2cf9i06k2a9e/article/details/83388740,2018,10.
[3]徐婷婷.新聞業的“人工智能”時代[J].科技傳播,2016,8(15):82-83.
[4]楊名宜,吳海榮.探討“機器新聞寫作”的發展趨勢[J].視聽,2016(11):131-132.
[5]蔡筱牧.新華社媒體大腦:技術驅動新聞生產方式變革[J].傳媒,2018(20):54-56.