□ 文/黃 可
編 輯 陳國權(quán) 24687113@sina.com
新媒體技術(shù)的迅猛發(fā)展帶來信息產(chǎn)品的極大豐富,一方面滿足了信息社會人類對資訊的多層面需求,另一方面過量信息也不斷挑戰(zhàn)著人腦的處理極限,冗余造成的負(fù)擔(dān)更成為信息社會的頑疾。在追求信息需求與供給的動態(tài)平衡中,突破生物體自身局限的人工智能技術(shù)扮演著日益重要的角色,機(jī)器人記者的出現(xiàn)就是其在新聞傳播領(lǐng)域的典型案例。
雖然機(jī)器人記者(Robot-Journalist或Writing Machine)在2014年底才出現(xiàn)在大眾視野,但這并不是一個新概念。早在2010年,位于美國芝加哥的Narrative Science就開發(fā)出一款名為Quill的自動寫作軟件,它可以將數(shù)字轉(zhuǎn)化為有結(jié)構(gòu)的描述性文字。Quill的工作從早期的自行生成新聞標(biāo)題,到編寫體育賽事新聞以及撰寫基金業(yè)績報告,不僅受到諸如《福布斯》《財富》、瑞士信貸、USAA等知名企業(yè)客戶的肯定,更獲得美國情報機(jī)構(gòu)的青睞,為其生成大量的文字報告。真正讓機(jī)器人記者廣受關(guān)注的是2014年7月,美聯(lián)社與Automated Insights公司達(dá)成合作引入一款名為Wordsmith的內(nèi)容生成平臺,從當(dāng)年10月開始完全全自動地為美聯(lián)社提供針對企業(yè)財報的新聞報道撰寫服務(wù)。借助美聯(lián)社在全球新聞生產(chǎn)領(lǐng)域的影響力,機(jī)器人記者的概念廣為傳播,一些著名新聞機(jī)構(gòu)如《紐約時報》《洛杉磯時報》、赫芬頓郵報、雅虎新聞等也紛紛引入機(jī)器人記者參與新聞采寫。
目前,機(jī)器人記者在新聞生產(chǎn)領(lǐng)域的適用范圍還較為有限,主要集中在金融報道、體育報道、自然災(zāi)害報道、罪案報道、房地產(chǎn)消息、健康資訊等,這些報道類型的共同點是新聞產(chǎn)制通常涉及大量數(shù)據(jù)、圖表和量化分析,新聞寫作從內(nèi)容到結(jié)構(gòu)有相對固定的標(biāo)準(zhǔn)和模式,這使基于人工智能自然語言生成技術(shù)的機(jī)器人記者有巨大發(fā)揮空間。
觀察機(jī)器人記者目前參與新聞生產(chǎn)的方式,其工作遵循一些固定流程:
首先,基于已有資料或數(shù)據(jù)庫采集新聞寫作所需的素材。這一過程類似于搜索引擎對網(wǎng)頁的抓取,主要以新聞關(guān)鍵詞、數(shù)據(jù)指標(biāo)、時間維度等為線索。
其次,對采集到的數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理和分析。包括數(shù)據(jù)資料的結(jié)構(gòu)化歸類、多維度的統(tǒng)計分析等,試圖發(fā)現(xiàn)其中的變化和趨勢,同時不斷將統(tǒng)計結(jié)果與系統(tǒng)內(nèi)已經(jīng)設(shè)定的新聞點標(biāo)準(zhǔn)進(jìn)行比對,以確定報道方向。
接著,在初步分析結(jié)果的基礎(chǔ)上選擇新聞點,這一過程可能存在人工干預(yù),協(xié)助進(jìn)行新聞價值判斷和新聞點的甄選。
之后,基于選題和新聞點,套用系統(tǒng)內(nèi)已有的寫作模板生成新聞稿。據(jù)報道,Wordsmith通過與微軟、美聯(lián)社、雅虎、《紐約時報》等合作,確定了超過3億可使用的新聞寫作模板,且隨著機(jī)器人記者應(yīng)用領(lǐng)域的拓展,這一規(guī)模還在不斷擴(kuò)大。
最后,根據(jù)需要,由人工編輯在新聞出稿前潤色、審核并發(fā)布。
從近期實例看,在生產(chǎn)新聞過程中,隨著自然語言生成技術(shù)算法的不斷完善和成熟,機(jī)器人記者將逐漸嘗試提供個性化和充滿人情味的寫作技法,也可以根據(jù)需要在報道的詳略、側(cè)重點、遣詞用句等方面進(jìn)行調(diào)整,并針對不同媒體平臺提供不同的新聞版本。有報道稱,Quill甚至能依據(jù)受眾群體特征選擇報道角度,比如針對某球隊的支持者進(jìn)行報道時,盡量避開使用負(fù)面消息和用詞。
機(jī)器人記者的出現(xiàn)既是信息技術(shù)進(jìn)步的成果,也是信息社會新聞業(yè)發(fā)展進(jìn)化的必然,雖然目前機(jī)器人記者可適用的新聞主題和報道領(lǐng)域仍然有限,也永遠(yuǎn)不可能完全替代具有專業(yè)素養(yǎng)的新聞從業(yè)者,但這種方式的出現(xiàn)對于新聞生產(chǎn)流程優(yōu)化及人類信息生產(chǎn)卻有著多重意義。
現(xiàn)代社會,信息流動呈現(xiàn)高速、海量、網(wǎng)狀發(fā)散的特征,如何在信息海洋中凸顯并獲得關(guān)注,“速度”成為新聞采寫過程中的關(guān)鍵要素,而這正是機(jī)器人記者的突出優(yōu)勢。2014年3月18日,美國加州發(fā)生了一次里氏4.4級的地震,在地震發(fā)生僅僅三分鐘后,《洛杉磯時報》的網(wǎng)站上就刊發(fā)了該消息,這即源于報紙內(nèi)部人員開發(fā)的地震新聞自動生成系統(tǒng)。同時,機(jī)器人記者也大大突破了人工記者的工作極限,Automated Insights公司的Wordsmith平臺每秒能生產(chǎn)2000篇文章,每周可以寫出上百萬篇文章,這是人工記者根本無法做到的。隨著機(jī)器人記者應(yīng)用的日漸成熟,這樣“極速”“海量”的新聞報道將越來越多,借助機(jī)器人記者的高效,必然引發(fā)新聞生產(chǎn)方式的根本性變革。
新聞報道中出現(xiàn)錯誤往往可能引發(fā)嚴(yán)重后果,而在傳統(tǒng)的新聞生產(chǎn)、傳播流程中,差錯概率在各環(huán)節(jié)都無可避免。2008年,某報刊登報道《招行投資永隆浮虧百億港元》引發(fā)招商銀行股價暴跌并帶動銀行股板塊整體下跌,由此招商銀行A股流通市值損失超過百億元,這條消息事后被原新聞出版總署通報為虛假消息,僅僅由于記者在采集香港永隆銀行的股價數(shù)據(jù)時出現(xiàn)一個數(shù)字錯誤,進(jìn)而得出招商銀行浮虧逾百億港元的不實結(jié)論。類似案例在報道中并不少見,尤其是傳統(tǒng)嚴(yán)謹(jǐn)?shù)呢斀?jīng)報道中,過多的數(shù)據(jù)和指標(biāo)、繁雜的計算和分析對編輯記者的細(xì)心和耐心都是一種挑戰(zhàn),而機(jī)器人記者卻能較好地應(yīng)對這一切,嚴(yán)格遵守程式設(shè)定的數(shù)據(jù)采集和分析規(guī)則,套用標(biāo)準(zhǔn)的新聞格式,使出錯概率降至極低。
機(jī)器人記者的出現(xiàn)一度成為新聞討論的熱點,其中“機(jī)器人要搶記者的飯碗”的標(biāo)題更博得眾多眼球,引發(fā)了不少討論。預(yù)測未來人工記者是否要下崗來讓位于機(jī)器人記者還為時過早,但正確認(rèn)識其中機(jī)器與人的關(guān)系卻十分必要。目前,機(jī)器人記者更多扮演著新聞采寫工具的角色,雖然可以做到完全獨立的新聞采寫與刊發(fā),但依賴于人工設(shè)定的采寫程式讓機(jī)器人的工作始終處于人類掌控之下,距離成為嚴(yán)格意義上“真正的記者”仍有較大差距。而對于傳統(tǒng)新聞人,機(jī)器人記者的出現(xiàn)無疑可以分擔(dān)大量繁雜的基礎(chǔ)性采集工作,讓記者從枯燥無味的機(jī)械性重復(fù)勞動中獲得解放,從而有精力聚焦于對新聞內(nèi)容的深度挖掘和批判性思考,在機(jī)器人記者的成果上生成更具個性化、針對性的新聞產(chǎn)品,正如美聯(lián)社對機(jī)器人記者功能的定位——“解放記者,減少重復(fù)性的新聞和數(shù)據(jù)處理”。因此,目前及未來一段時間內(nèi),機(jī)器人記者都將扮演新聞采寫工具的角色,既是人工記者的補(bǔ)充,同時也是新聞采寫方式創(chuàng)新的嘗試方向,善用機(jī)器人記者將大大提升人工記者的工作效率,兩者的創(chuàng)新性結(jié)合也會是由“海量報道”到“高質(zhì)量報道”轉(zhuǎn)化的必需,新的報道模式及新聞產(chǎn)品也許由此應(yīng)運而生。
在使用機(jī)器人記者之前,美聯(lián)社每季度出產(chǎn)約300篇針對財報的新聞報道,而使用機(jī)器人記者后,這一數(shù)量猛增到4000篇。據(jù)Automated Insights的統(tǒng)計,Wordsmith在去年寫了近10億篇文章,平均每篇文章的瀏覽次數(shù)在100萬次左右。此外,Wordsmith創(chuàng)造出100多種報告類型,建立了50萬則推特內(nèi)容。新聞產(chǎn)品數(shù)量的激增為客戶和用戶提供了更多選擇,更為新聞產(chǎn)品營銷提供了更多可能。長尾效應(yīng)同樣適用于新聞產(chǎn)品的產(chǎn)制,基于機(jī)器人記者的作品,編輯部對“數(shù)據(jù)”“信息”“事實”進(jìn)行分析解讀和二次加工,并根據(jù)需要轉(zhuǎn)換新聞點、文章結(jié)構(gòu)、表述方式等,生成適配平面、網(wǎng)絡(luò)乃至移動、社交等多媒體終端的產(chǎn)品,為用戶和受眾提供個性化定制內(nèi)容。可以預(yù)見,“海量+個性化”的組合,將更好地體現(xiàn)媒體核心競爭力,給予新聞用戶更多選擇權(quán)、賦予新聞產(chǎn)品營銷更多的活力和空間。
隨著新興媒體形態(tài)的擴(kuò)張和受眾媒介習(xí)慣的改變,傳媒行業(yè)也經(jīng)歷著激烈的動蕩和調(diào)整,對此,身處第一線的記者們感受更為深刻。在信息技術(shù)日新月異、新媒體大行其道的傳播環(huán)境中,固守一支筆、一個本的傳統(tǒng)記者形象已顯得與時代格格不入。面臨類似機(jī)器人記者的沖擊,傳統(tǒng)的新聞人能夠做些什么,值得所有從業(yè)者思考。在互聯(lián)網(wǎng)+的大背景之下,媒介融合已成為行業(yè)發(fā)展的主流趨勢,信息技術(shù)的應(yīng)用也日益廣泛和深入,時代發(fā)展對于走在信息洪流前沿的記者們的要求也越來越高,震后三分鐘寫出報道的地震機(jī)器人Quakebot(地震新聞自動生成系統(tǒng))是由《洛杉磯時報》的記者兼程序員所創(chuàng)建,這種“多才多藝”的記者也許就是未來新聞工作者的標(biāo)準(zhǔn)形態(tài)。同時,自然語言生成技術(shù)等關(guān)鍵元素對于中文的適應(yīng)性和拓展性也會是挑戰(zhàn)傳統(tǒng)新聞寫作規(guī)則的新命題,機(jī)器人記者的本土化更不會一蹴而就。在國外,機(jī)器人記者已經(jīng)正式上崗,在國內(nèi),除了靜觀其變,我們更需積極求變。