【內(nèi)容提要】在擔憂新聞機器人是否將代替人類記者時,人們或多或少地忽視了其網(wǎng)絡(luò)安全。隨著新聞機器人逐漸滲透至網(wǎng)絡(luò)的各個領(lǐng)域,其作為“技術(shù)”的本質(zhì)或?qū)⒁l(fā)多種問題,威脅著網(wǎng)絡(luò)安全,我們有必要采取相關(guān)措施以防患于未然。
【關(guān)鍵詞】新聞機器人 網(wǎng)絡(luò)安全 對策
2017年“兩會”期間,人民網(wǎng)、《光明日報》、新華社等數(shù)十家媒體共推出15臺虛擬及實體新聞機器人,在“兩會”新聞報道中可謂賺足了眼球。作為新興科技的新聞機器人以高效、精準的數(shù)據(jù)挖掘及分析大大解放了人類記者的生產(chǎn)力,使其得以投身于挖掘數(shù)據(jù)背后的潛在關(guān)系,以生產(chǎn)更高質(zhì)量的新聞。然而,在擔憂其是否將取代新聞記者時,不少研究者卻忽略了新聞機器人的網(wǎng)絡(luò)安全。相較于傳統(tǒng)的網(wǎng)絡(luò)安全,新聞機器人所引發(fā)的網(wǎng)絡(luò)安全問題將更為集中,防范及控制難度更大,這是必須要引起重視的問題。
一、新聞機器人的發(fā)展趨勢
所謂“新聞機器人”,實際上是一套軟件或算法語言,它自動采集數(shù)據(jù),然后撰寫出人類可讀的內(nèi)容。①通過哥倫比亞大學對“敘事科學”公司的新聞機器人進行的數(shù)據(jù)公開,我們可以發(fā)現(xiàn),新聞機器人的新聞生產(chǎn)主要包含五個步驟,即數(shù)據(jù)抓取、“新聞性”評估、確定角度和框架、填充“故事點”和文本生成。這一新聞生產(chǎn)流程全程實現(xiàn)自動化,能通過低廉的成本生產(chǎn)海量的新聞資訊,大大減輕了記者的數(shù)據(jù)信息采集負擔,有望開啟“人機分工”新聞生產(chǎn)模式的新篇章。以美聯(lián)社所使用的Wordsmith為例,其在相同時限內(nèi)生產(chǎn)的新聞數(shù)量是人類記者的十倍不止,打破了人類的新聞生產(chǎn)極限;同時,基于互聯(lián)網(wǎng)斷點式數(shù)據(jù)抓取技術(shù),新聞機器人能在天氣、財經(jīng)及體育等有著“純凈數(shù)據(jù)”的信息領(lǐng)域,高速發(fā)布較為準確的新聞資訊,目前已在歐美各主流媒體得到廣泛推廣。2015年,騰訊公司成功開發(fā)Dreamwriter寫作機器人,迄今為止以每天產(chǎn)出超過2000篇財經(jīng)科技類稿件、500篇體育類稿件的速度進行寫作。同時,隨著新華社的“快筆小新”、《南方都市報》的“小南”以及今日頭條的“張小明”等新聞機器人投入使用,我國的機器人寫作也逐漸步入發(fā)展的上升期。
然而,新聞機器人在為新聞工作者帶來極大便利的同時,也為網(wǎng)絡(luò)安全帶來不小的隱患。從“安全”的指數(shù)來看,網(wǎng)絡(luò)安全側(cè)重于網(wǎng)絡(luò)社區(qū)的安全,強調(diào)“網(wǎng)絡(luò)系統(tǒng)中的數(shù)據(jù)內(nèi)容是否遭到破壞、更改、泄露,系統(tǒng)是否連續(xù)可靠地正常運行等”,②著眼于信息的機密性、真實性以及可驗證性。隨著新聞機器人全面興起,其廣泛的數(shù)據(jù)抓取分析、高度的自動新聞生產(chǎn)在一定程度上不斷地侵蝕著這一網(wǎng)絡(luò)信息安全基礎(chǔ),同時其自身的“技術(shù)”本質(zhì)也或使法律責任判定陷入混亂,使得網(wǎng)絡(luò)安全面臨新的考驗。
二、新聞機器人網(wǎng)絡(luò)安全的隱憂
(一)廣泛的數(shù)據(jù)抓取或?qū)е聜€人信息泄露
“敘事科學”公司的CTO曾指出在未來的15年內(nèi),將有超過90%以上的新聞由機器人生成。換言之,未來的新聞機器人將不局限于天氣、體育及財經(jīng)等“公共數(shù)據(jù)”領(lǐng)域。隨著軟件的推陳出新,機器人算法邏輯的不斷增強,新聞機器人將能勝任新聞行業(yè)大部分領(lǐng)域的數(shù)據(jù)采集及信息挖掘工作,其數(shù)據(jù)覆蓋范圍將逐步脫離“純凈數(shù)據(jù)”的范疇向著大眾化、生活化的信息內(nèi)容方向發(fā)展,基于強大互聯(lián)網(wǎng)索引及數(shù)據(jù)抓取技術(shù)的新聞機器人,在拓展了信息收集及傳播技術(shù)的同時,也對網(wǎng)民的個人隱私安全提出了挑戰(zhàn)。
據(jù)CNNIC發(fā)布的第39次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,截至2016年12月,我國網(wǎng)民規(guī)模已達7.31億。③龐大的用戶群體產(chǎn)生的UGC內(nèi)容已占據(jù)互聯(lián)網(wǎng)知識信息的大半江山。浩如煙海的數(shù)據(jù)信息中實則包含了豐富的個人資料數(shù)據(jù),如用戶的居住地、職業(yè)、年齡、興趣愛好、個人習慣等等,加之接入互聯(lián)網(wǎng)所產(chǎn)生的Cookie信息包,用戶在機器人算法面前可謂一絲不掛。鑒于先前“傳感器”新聞生產(chǎn)的成功運用,如今有著強大的數(shù)據(jù)處理能力的新聞機器人,對于大數(shù)據(jù)的處理分析已是輕車熟路,因而對于互聯(lián)網(wǎng)用戶的個人生活軌跡的分析更是不在話下。隨著新聞機器人不斷滲透生活的各個領(lǐng)域,依照其已被壓縮至毫秒的信息處理、分析及評估過程,新聞機器人能在現(xiàn)有模板支撐的情況下,在短時間內(nèi)完成某特定網(wǎng)站所有用戶的個人情況報告。如果說在大數(shù)據(jù)時代用戶的個人隱私保護已是形同虛設(shè),那么當“90%的新聞由機器人撰寫”的時代來臨之后,用戶個人隱私安全將面臨更為嚴峻的考驗。
(二)“脫韁”的新聞生產(chǎn)或引發(fā)輿論動蕩
2014年,谷歌公司的“維基百科實時監(jiān)測”機器人曾因《紐約郵報》關(guān)于失蹤球員昆頓·羅斯的一則烏龍新聞自動發(fā)表一條推特簡訊,稱該球員的尸首已被發(fā)現(xiàn)。雖然這則新聞在之后得到報社的澄清,但谷歌旗下的新聞機器人卻因內(nèi)在算法的限制未能對已發(fā)布的消息進行改正,導(dǎo)致這一“假消息”得以繼續(xù)傳播,存在散布不實消息之嫌,造成了不小的輿論動蕩。
依托算法程序的機器人新聞生產(chǎn)模式的一大亮點便是高度的自動化,在數(shù)據(jù)爆炸的今天能夠快速、準確地挖掘新聞素材并迅速以簡報的形式進行上報或直接發(fā)表。“黑箱”技術(shù)的特點卻決定了其運行過程的不可逆且難以控制,程序一旦檢測出數(shù)據(jù)異常波動便立即觸發(fā)新聞寫作流程,能在極短的時間內(nèi)完成新聞的寫作及發(fā)布。然而現(xiàn)階段基于程序運作的機械缺乏人類所具備的批判性思考,也無法親臨現(xiàn)場獲取一手資料以驗證消息真?zhèn)巍T谏鲜霭咐校侣剻C器人的新聞生產(chǎn)流程之所以被觸發(fā),是因為在同一時間段內(nèi)出現(xiàn)五個人對三個語言版本的“昆頓·羅斯”詞條進行修改,算法在沒有也無法確認事實真?zhèn)蔚那闆r下判定這是一條“重大新聞”。不可否認,新聞機器人在數(shù)據(jù)監(jiān)控挖掘、信息整理及撰寫速度上遠超人類,然而其錯誤的產(chǎn)生及傳播的速度也同樣遠遠領(lǐng)先人類。同時,病毒性的網(wǎng)絡(luò)傳播模式能使機器人產(chǎn)生的錯誤或有害的信息,以前所未有的速度擴散至整個網(wǎng)絡(luò)社區(qū)。另外,新聞機器人的新聞寫作尚未擺脫“陳述事實”的模式。這種客觀事實陳述雖然在一定程度上避免了人類記者所持有的個人偏見,然而冰冷的數(shù)據(jù)羅列在缺乏新聞工作者所必須具備的人文關(guān)懷的同時也將留下巨大的解讀空間,存在被過度解讀的危險。一旦發(fā)生信息誤讀或惡意的信息投食行為,“脫韁”的機器人新聞生產(chǎn)便可能引發(fā)網(wǎng)絡(luò)輿論動蕩。
(三)“技術(shù)中立”或?qū)е仑熑闻卸ɑ靵y
一旦新聞機器人產(chǎn)生上述行為對網(wǎng)絡(luò)社區(qū)利益造成損害時,人們最先想到的便是訴諸法律以求制裁。然而,新聞機器人在本質(zhì)上屬于一種技術(shù)手段,其復(fù)雜的技術(shù)背景以及作為互聯(lián)網(wǎng)技術(shù)的本質(zhì),或?qū)⑹狗韶熑闻卸ㄒ颉凹夹g(shù)中立”原則陷入困境。
從早期的“索尼案”到“Napster案”再到2016年的“快播案”,“技術(shù)中立”一直是新興技術(shù)領(lǐng)域所不可避免的話題。一方面,技術(shù)本身無罪,并且新聞機器人作為非“自然人”在法律上無法承擔相應(yīng)的法律責任,這將導(dǎo)致造成個人隱私泄露或引發(fā)輿論動蕩的新聞機器人無法作為被告被起訴。另一方面,回顧新聞機器人的發(fā)展史,谷歌公司擁有新聞機器人源代碼的專利權(quán),并授權(quán)于美國“敘事科學”、“自動洞見”及法國“耶索”等公司進行開發(fā)使用。新聞機器人的開發(fā)初衷并非為實施違法行為,因此谷歌公司作為“實質(zhì)性非侵權(quán)”技術(shù)的提供者也同樣不承擔法律責任。那么,是否授權(quán)開發(fā)公司或網(wǎng)絡(luò)中間商應(yīng)為新聞機器人產(chǎn)生侵權(quán)行為或發(fā)布不實消息而接受制裁呢?依據(jù)現(xiàn)有案例分析,中間方責任的認定主要是基于行為人是否能被證明存在“指示、鼓動”的言論,是否存在“共同”犯罪的行為。然而,暫不提在取證、立案等技術(shù)層面對上述責任進行判定存在極大的困難,我國現(xiàn)有法律在新聞機器人違法事件追究責任方面依舊是空白,而走在新聞機器人領(lǐng)域前沿的美國也依然處于立法討論階段,并無明文法律進行指導(dǎo)。同時,從科技立法角度看,過早地對尚未成熟的新聞機器人進行專項立法存在投入大、回報小的缺陷,并不利于該技術(shù)的完善和發(fā)展。因此,法律的缺位使得當新聞機器人造成違法行為后,因“技術(shù)中立”的抗辯理由而使得責任方判定陷入混亂,為網(wǎng)絡(luò)安全的有序發(fā)展埋下禍根。
三、新聞機器人隱患之對策
(一)限制數(shù)據(jù)庫接入,完善機器人訪問協(xié)議
新聞機器人對于個人隱私信息的獲取,是基于對社交網(wǎng)站及公共網(wǎng)絡(luò)數(shù)據(jù)的監(jiān)測及抓取。然而,全球至今尚未對機器人數(shù)據(jù)覆蓋邊界做出明確的規(guī)范。出于新聞工作的要求,我們不能摒棄新聞機器人算法中所包含的數(shù)據(jù)監(jiān)測及評估系統(tǒng)和聯(lián)想機制,反而應(yīng)大力發(fā)展之。因此,采取一定措施限制新聞機器人對網(wǎng)站數(shù)據(jù)庫的接入并完善機器人訪問協(xié)議,對保護用戶隱私、防止侵權(quán)行為的產(chǎn)生有著極為重要的作用。被監(jiān)測網(wǎng)站可與包含敏感信息的數(shù)據(jù)庫(如用戶Cookie數(shù)據(jù))設(shè)立相應(yīng)的機器人監(jiān)測及排除協(xié)議,并做好信息漏洞的檢查及防范措施;同時,新聞機器人的運作方需明確“新聞”與“隱私”的邊界,從數(shù)據(jù)喂食的源頭控制新聞機器人的數(shù)據(jù)庫覆蓋范圍,并規(guī)范機器人新聞生產(chǎn)的內(nèi)容,杜絕涉及個人隱私信息的新聞發(fā)布,在技術(shù)層面做好互聯(lián)網(wǎng)社區(qū)的隱私保障工作。
(二)堅持“把關(guān)人”角色,做好審查及補充工作
美聯(lián)社于2014年開始在機器人新聞撰寫方面取消了原有的人工審核制度,新聞機器人可以不經(jīng)由人工審查自動完成從數(shù)據(jù)采集到新聞發(fā)表的全過程。但美聯(lián)社很快表現(xiàn)出了對新聞機器人的不放心,并推翻先前聲明,堅持對“每篇自動生成的報道進行審閱后再發(fā)表”④。筆者認為,隨著新聞機器人逐漸深入人類生活的各個領(lǐng)域,在大力發(fā)展其新聞生產(chǎn)自動化的同時必須保證內(nèi)容審查工作的進行,對于部分深度新聞寫作更是需要“把關(guān)人”對新聞內(nèi)容進行審核把控,在提高新聞生產(chǎn)效率的同時保證新聞內(nèi)容的真實性。同時,鑒于新聞機器人的語言組成技術(shù)依舊處于發(fā)展階段,運行方在對稿件進行潤色的同時也可對部分缺乏邏輯或停留于陳述層面的內(nèi)容進行補充說明,在提升機器人新聞的可讀性的同時完善新聞內(nèi)容,防止新聞被過度解讀所引發(fā)的輿論危機。
(三)完善標準評估,確定相關(guān)責任方
目前,我國的數(shù)據(jù)庫建設(shè)依舊處于發(fā)展中狀態(tài),技術(shù)發(fā)展的不對等使得相關(guān)利益方的平衡關(guān)系發(fā)生了改變。因此,在采用“知道原則”“誘導(dǎo)原則”⑤之余,各利益方可集中進行協(xié)商并結(jié)合實際國情制定相應(yīng)的責任評判標準。同時,雖說“技術(shù)中立”原則是科學技術(shù)得以迅猛發(fā)展的一大“保護傘”,但是一旦技術(shù)被投入市場并廣泛使用,技術(shù)的開發(fā)及運營方就肩負著一定的社會責任及義務(wù)。在新聞機器人開發(fā)公司不斷對算法進行更新以及發(fā)布補丁的同時,新聞機構(gòu)作為技術(shù)的使用方在做好相應(yīng)的技術(shù)更新及審核工作之余,必須履行對所屬新聞機器人的監(jiān)管責任,在運行新聞機器人的過程中不忘掌控機器人的“電源”。“解鈴還須系鈴人”,技術(shù)所導(dǎo)致的問題還須交由技術(shù)解決,因運營不當所導(dǎo)致的后果也應(yīng)由相關(guān)運營方承擔,而非法律或社會為其買單。
注釋:
①鄧建國.機器人新聞:原理、風險和影響[J].新聞記者,2016(9).
②王世偉.論信息安全、網(wǎng)絡(luò)安全、網(wǎng)絡(luò)空間安全[J].中國圖書館學報,2015(2).
③中國互聯(lián)網(wǎng)絡(luò)信息中心.第39次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》.http://www.cnnic.net.cn/gywm/xwzx/rdxw/20172017/201701/t20170122_66448.htm.
④孫瑛.機器人新聞:一種基于大數(shù)據(jù)的新聞生產(chǎn)模式[J].編輯之友,2016(3).
⑤武萬方.論技術(shù)中立原則[D].中南民族大學,2015.
作者簡介:黎文松,南昌大學外國語學院碩士研究生
編輯:王洪越