涂佳焰
摘要 機器新聞寫作是新聞界技術發展的成果,應對新聞業的革新,我們應該主動建立起機器新聞寫作發展研究現狀的基本框架。文章對2015-2017年3年間中國知網上關于“機器新聞寫作”研究的文獻進行內容分析,從文獻發布概況、文獻被引下載量、文獻研究內容和文獻采用的研究方式四個方面探析機器新聞寫作的研究現狀。
關鍵詞 機器新聞寫作;機器人寫作;研究現狀
1研究背景及目的
人工智能的概念早在1956年就己被提出,“人工智能是關于知識的學科——怎樣表示知識以及怎樣獲得知識并使用知識的科學”,而“機器新聞寫作”是人工智能技術在新聞領域的具體運用。機器人寫作作為一種新興的新聞內容生產方式對新聞行業甚至整個社會有著巨大的影響。本文通過對2015年-2017年間中國知網上關于機器新聞寫作研究的文獻,來闡釋學術圈對該議題的基本研究狀況,并根據研究結果展望今后的發展趨勢。
2研究設計與結果分析
2.1研究設計
運用《中國知網》作為待分析文獻的來源,獲取關鍵詞為“機器新聞寫作”“機器人寫作”“機械新聞寫作”等的相關文獻,選擇下載2015年-2017年間與研究有關的文獻。經篩選,獲得的總樣本文獻為41篇,從文獻發布概況、文獻被引下載量、文獻研究內容和文獻采用的研究方式四個內容分析類目來探討改議題的研究現狀。
2.2研究結果分析
2.2.1文獻發布概況分析
這一部分主要對研究的機器新聞寫作文獻進行大體上的把握,主要通過發表時間和研究者單位這兩個變量進行分析。
1)研究者單位分析。通過將研究者單位的統計,大致可以分為新聞院系、非新聞傳播院系、媒體公司和媒體單位這四類。其中新聞院系發表關于機器新聞寫作研究的文獻最多,約占78%。其次是媒體單位約占12%,其中包括新華社、人民網、中央電視臺等。剩余只有零星幾篇文獻來自于媒體公司和非新聞院系。
2)文獻發表的年份分布。關于機器新聞寫作的研究文獻數量不多,該議題還處于方興未艾的狀態。根據所選的樣本文獻,2016年的文獻數量出現一個高峰,占總樣本的一半有余,說明2016年是研究機器新聞寫作的熱門年份。到2017年文獻數量回落,但由于該年份未結束,按照其趨勢該議題的熱度依舊。
2.2.2文獻被引下載量分析
通過分析被引量和下載量排名前四的文獻可以得出機器新聞寫作研究中的重點被關注文獻,為接下來要做的研究指引方向。被引量和下載量均排在前四名的兩篇文章都由彭蘭教授所寫,分別是《移動化、智能化技術趨勢下新聞生產的再定義》和《智媒化:未來媒體浪潮——新媒體發展趨勢報告(2016)》,是對未來智能媒體的前景展望,以及機器新聞寫作作為一種新的新聞生產模式的業務探索。被引量第二的是從中外對機器新聞寫作的概念定義上來探究該議題。剩下兩篇下載量較高的文獻是從機器人寫作對傳媒業的影響入手。
2.2.3文獻研究內容分析
由于一篇文獻中不只含有一個研究議題,因此研究議題的總數大于樣本文獻數。在樣本文獻中,研究者最關注的是后果影響,占總樣數的一半,其中有21篇都在探討對記者行業的影響。其次是對業務探索(13)的重視,其中包括對業務流程、業務分類、業務差異以及內容生產特點的研究。其余的文獻分布在發展前景(7)、風險挑戰(7)、發展優勢(8)、應用現狀(9)、概念定義(1)等幾個方面。
1)概念定義。國外研究者用“機器人新聞”“機器寫的新聞”“自動內容”“自動新聞”等名稱來指代“機器新聞寫作”,雖然叫法不一,但所指代的內容基本相同,都具有“沒有人工干預”“基于數據”“自然語言生成”的特點。
部分研究者將機器新聞寫作劃分到計算機新聞的范疇,將它歸入到計算機新聞的發展中,而不是單獨的研究個體展開探索分析。其中,Teny Flew、Anna Daniel和Adam Swift認為,計算機新聞技術能充分發現數據的價值,對數據的掌握很完整不會有缺失,這使得計算機的獨創新聞報道變得自成一體,并且有價值。
我國學者蔣枝宏在《傳媒顛覆者:機器新聞寫作》中提出“機器寫作”又稱“機器人寫作”,是指計算機根據既定的算法將獲取到的全部數據輸出成語言的一種人工智能技術,核心正是自然語言生成。“機器新聞寫作”則指用這種技術進行新聞寫作,是人工智能學科在新聞領域的應用。
2)應用現狀。機器人寫作最先應用于國外。2007年,Statsheet成為美國首家致力于自動化生產新聞的公司。3年后,美國Automated Insight公司研發的Wordsmith投入市場,與此同時,美國的Narrative Science公司將同樣功能類型的軟件Quill投放市場。中國緊跟其后,《8月CPI同比上漲2%創12個月新高》這篇報道在2015年9月發布,由騰訊公司生產,成為中國第一個運用機器新聞寫作技術的公司。撰寫這篇新聞的是機器人Dreamwriter,輸出十分高效,耗時僅一分鐘。2015年11月,新華社推出“快筆小新”,為多個部門提供新聞稿件寫作。這是一次技術的飛躍,越來越多的機器人開始在新聞行業撰寫新聞,新聞行業的自動化生產時代已經來臨。
機器新聞寫作是對寫作者與寫作模式的再定義。彭蘭認為現在的機器寫作基本是一種“人工模板”+“自動化數據填充”的模式。機器新聞寫作的廣泛應用值得我們注意一個問題,數據是未來新聞行業的重要資源,我們要重視數據思維。同時,數據收集、數據分析的平臺競爭會更加激烈。喻國明、劉瑞一、武叢偉也提出類似觀點,認為機器新聞寫作是人工智能化與新聞行業的結合,從此新聞的內容不僅是由專業新聞工作者生產,更有一部分是機器生成內容。
3)業務探索。目前新聞寫作“機器人”的業務分類。楊名宜區分為:一是實時動態新聞寫作。作者列舉了一系列代表,Automated Insight公司研發的Wordsmith、“快筆小新”和“DreamWriter”都屬于這一類型的應用。二是篩選稿件。根據設定條件甄別出具有特定潛質的稿件,編輯機器人“Blossomblot”能夠根據大數據甄別具有“病毒式”傳播潛質的文章。
機器新聞寫作的工作流程。張蕊認為分為三個部分:新聞信息數據的獲取;機器人對新聞觀點提煉;機器新聞寫作出版。金兼斌以Wordsmith平臺“自動生成”作品的寫作流程為例,提出以下5個步驟:獲取數據;分析數據;提煉觀點;結構和格式;出版。
人工智能技術對于新聞傳播行業的生產方式和傳播格局是多角度、全方面的影響。喻國明認為其內容生產的特點是:其一,精準快速,時間一般不超過30秒,且差錯率遠低于人工寫作;其二,適應性強,表達多樣化;其三,智能化標簽;其四,建構客觀、總體性視角。
對比機器新聞與人工新聞寫作的業務差異。付松聚進行實證性研究,從新聞標題、新聞導語、新聞主體、新聞背景等方面進行對比,找出兩者差異。
4)后果影響。對記者行業影響。Arjen van Dalen關注機器人新聞寫作對記者的負面影響,研究對記者自身認知的沖擊,具體探討機器新聞寫作技術的運用使傳統記者重新審視專業能力的過程。人工智能對新聞行業帶來的不僅是沖擊,也有積極地促進作用。喻國明認為機器新聞寫作不是無所不能的,更不是新聞記者的“對立者”,兩者協作將是未來發展的主要模式。
不同學者對此的表述不同但觀點一致,機器新聞寫作和人工寫作相互補充、相互發展,以人為本。用張江艷的總結更為全面,她認為機器新聞寫作對人類寫作帶來的影響是:智能化機器人寫作為人類記者寫作三維立體化新聞稿件提供了便捷;基于大數據的新聞寫作更需要人類記者掌握分析數據的方法;大數據語境中的新聞寫作要透過數據去觀察和關注超越個體的“人”;基于大數據的新聞寫作需要站在“人”的立場上去思考和分析數據。
新聞寫作自動化趨勢下的媒體轉型與發展。盧永春認為從兩個方面實現:積極搶占數據浪潮的高地和大力推進業務、技術深度融合。申云對機器人新聞寫作下新聞采編的發展途徑提出三個層面的觀點:“命運共同體”——人機結合的新認識;愈戰愈勇——新聞從業者的態度;推陳出新——新聞機構的原則。
5)發展優勢。楊名宜、吳海榮認為現階段機器新聞寫作的優勢集中在以下5點。
第一,速度快。機器人寫稿的速度可以用毫秒來計算。
第二,數量大。目前機器新聞寫作一年的報道量可達10億個,新技術得到了廣泛的應用。
第三,全天候待機完成寫稿任務。
第四,客觀準確性。屬于結構化數據的一種文本展現。
第五,個性化,是機器新聞寫作的核心競爭力。
機器新聞寫作在突發新聞報道中發揮著越來越重要的作用。喻國明舉例在地震災難報道中,機器人新聞寫作可以在第一時間從數據庫中獲取數據并生成文本。新聞生產完成無縫對接,高效快速的完成海量稿件。
從實證分析角度,陳小晰根據近年來自動機器寫作軟件和人類記者撰寫的財經類、體育比賽類新聞稿件,進行對比分析。探討機器和人工寫稿的各自的優勢。
6)風險與挑戰。自動化新聞的限制點。周羽佳總結了6點局限:依賴單一、孤立的數據流;所依賴的定量數據的膚淺性;詢問這些數據的困難性;生成文本時缺少人類角度;難以提前預測“頭條新聞”的模板;對模板中的新聞數據進行創造性寫作的困難。同時盧永春還提出數據庫中數據的好壞直接影響機器新聞產出內容的質量。
機器新聞寫作存在的新聞倫理問題。胡素霞提出一系列問題:機器新聞寫作的倫理問題主要集中在責任的規定,機器人新聞是否具有版權,如果有版權該如何保護,如果機器人新聞出現錯誤,應該負責任的是具體的編輯還是新聞機構。
版權等法律問題。Tom Kent對“數據上傳者的權利和媒體平臺的權利”提出了質疑,具體為數據用戶提供數據的權利和媒體單位改動數據的相關權利沒有明顯劃分。阮開欣指出版權法中所保護的作品必須是人類意志的產物,但機器新聞的寫作是算法的成果,因此機器生成的文本內容不屬于版權法所保護的對象。
7)發展前景。未來理想的新聞寫作,將是人的能力與計算機智能的結合。彭蘭認為機器的作用,不僅僅是獲取并運用數據,還將體現在:提供新聞線索、發現新聞的潛在價值、總結精煉新聞生產規律,更有甚者可以對數據分析的結果預估傳播效果。
未來機器新聞寫作的發展趨勢。徐曼認為有以下4點:機器人寫手新聞在整個新聞報道中占據的份額會越來越大;質量日益提升,并將突破數據新聞的模式限制;開辟更多報道領域,實現更廣泛的應用;更加個性化,面向個人用戶。
2.2.4文獻研究方式分析
該部分主要分析研究者在研究時所采用的研究方式,分為研究方法和研究類型兩個變量。絕大部分文獻所采用的研究方法都是定性分析,只有個別文獻采用實證分析和個案分析的方法。其次,對樣本文獻的研究類型進行統計,多數文獻都是以描述性研究為主,解釋性、應用性和預測性研究較少。多數是在陳述現象和觀點,需要運用數學和計算機學來建立模型,通過信度分析,提供可借鑒性的判斷。由此看來,機器新聞寫作的研究方式較為單一,還需要不斷發展,是一個值得探索的議題。