【摘要】從體育實況轉播到股市行情、房地產新聞乃至詩詞創作,人工智能生成內容技術在實踐中的應用越來越廣泛,也引發一系列法律問題和倫理爭議。通過對人工智能生成內容著作權糾紛第一案為研究對象,具體分析人工智能生成內容在當前法律體系中的法理依據和實踐中的技術窘境,并對未來的立法思路展開了探討。此案具有劃時代的意義,也是對人工智能侵權的開拓性探索。
【關鍵詞】人工智能生成內容;機器寫作;版權
自從微軟人工智能機器人“小冰”在學習519位詩人的現代詩、訓練超過10000次后,創造出詩集《陽光失了玻璃窗》,中國的人工智能內容生成技術在譜寫歌曲、撰寫小說和電影劇本、繪畫繪圖等各領域得到了越來越廣泛的應用,由此也引發了人工智能生成物在法律上如何認定的一系列問題。
2019年4月25日,北京互聯網法院一審公開宣判北京菲林律師事務所訴北京百度網訊科技有限公司侵害署名權、保護作品完整權、信息網絡傳播權糾紛一案,首次對人工智能軟件自動生成內容的屬性及其權益歸屬作出回應。
案件判決后,業界和學界意見存在分歧,爭議的焦點包括:統計數據分析軟件生成的圖表和報告是否構成著作權所保護的作品?如果人類在其中也做了分析工作,同時由系統生成圖形圖表,著作權究竟應該屬于機器人還是自然人?
筆者認為,此案的判決沒有突破現行立法,有法理依據,比較符合實際,但也比較保守,存在一定的瑕疵。同時,學術研究應有一定的前瞻性,在弱人工智能時代可以適用現行法律,當強人工智能時代到來時,我們必須根據機器人的行為能力考慮AI的主體資格及相應程序鏈中的各類主體及責任分配。
一、現行版權保護和規范的是自然人的智力勞動成果
這起“人工智能生成內容著作權第一案”的原告為北京菲林律師事務所(以下簡稱“菲林”)。菲林主張其為涉案文章《影視娛樂行業司法大數據分析報告——電影卷·北京篇》的著作權人,涉案文章由文字作品和圖表作品兩部分構成:文章的圖表來自于法律統計數據分析軟件(威科先行法律信息庫)生成的數據報告,文字則是基于該報告而進行的分析。
法院認為,涉案文章中的圖形為人工智能軟件自動生成,不符合圖形作品的獨創性要求,不構成圖形作品,原告對其享有著作權的主張不能成立。根據現行法律規定,文字作品應由自然人創作完成,涉案文章中的文字內容是人工智能軟件自動生成的內容,既非自然人創作成果,也未能傳遞軟件研發者和軟件使用者的思想、感情的獨創性表達,因此,該分析報告不能被認定為著作權法意義上的作品。但是,原告作為法人組織,確實主持創作并首次發表了涉案作品,故涉案文章可被認定為原告的法人作品,原告對其享有著作權。被告在未經原告許可的前提下,私自在自己的平臺上發布涉案文章,侵害了原告的信息網絡傳播權,應為此承擔相應的民事責任。
《中華人民共和國著作權法》(以下簡稱《著作權法》)第十一條規定:“著作權屬于作者,本法另有規定的除外。創作作品的公民是作者。由法人或者其他組織主持,代表法人或者其他組織意志創作,并由法人或者其他組織承擔責任的作品,法人或者其他組織視為作者。如無相反證明,在作品上署名的公民、法人或者其他組織為作者。”由此可見,著作權的法律主體包含且僅包含自然人與法人,即“生物意義的人”與“具有法律擬制人格的組織”。根據我國現行的法律規定,只有自然人或者法人創作的作品適用著作權法保護,也只有自然人和法人具備主張相關權利的資格。若使用人工智能技術生成內容,該技術本身或利用該技術研發的軟件產品不能被認定為著作權人,無法作為適格主體進行權利主張。
本案法院的判決思路沒有突破“創作是人類專屬的或者特有的”法律邏輯。法院將涉案文章劃分成軟件生成的圖形部分、數據報告以及由前言構成的文字部分,法院認為由原告創作的包括前言部分的文字作品具有版權保護;而圖形不是基于創作產生的,不能滿足獨創性要求。在現有法律體系仍能充分保障相關軟件智力、經濟投入能夠獲得相應報酬及其他權利保護的前提下,暫時無須對民法主體的基本規范作出改變。軟件生成的數據報告雖具有文字作品的形式要求,但它不是自然人創作的,從而否定了“人工智能創作物”獲得著作權保護的可能性。
同時,人工智能技術及軟件生成的內容雖然在形態及表達方式上日趨接近自然人,但人工智能的“心智”未能達到相應法律規定的主體資格,無法與自然人同等地享有權利和承擔義務。即便人工智能有“寫作”的事實行為,但其所依賴的算法仍由自然人所控制,僅滿足外部條件而缺乏內心意志的表達,也依然無法劃歸為法律意義上的“意思表示真實”。目前的技術尚處于弱人工智能階段,機器本身并不具備意識能力,即不具備預測和控制人工智能寫作所經歷的數據挖掘、數據分析、內容生成中任一環節的結果的能力。所以,從根本上而言,“弱人工智能”機器人并不具備獲得民事行為能力以及權利主體資格。雖然此分析報告實際由數據軟件威科先行法律信息庫利用輸入的關鍵詞與算法、規則和模板結合形成,一定程度上表現為由威科先行庫“創作”而成,但數據軟件威科先行法律信息庫并不能成為權利主體。
二、“人工智能生成內容”依托的是大數據,缺乏獨創性的思想或情感表達
人工智能生成內容受著作權保護和規制的前提條件,是其所生產的內容符合《著作權法》中對于作品的“獨創性”要求。《中華人民共和國著作權法實施條例》第二條對“作品”作出了明確定義:“著作權法所稱作品,是指文學、藝術和科學領域內具有獨創性并能以某種有形形式復制的智力成果。”其核心要件在于“獨創性”。所謂獨創性,是要求作品獨立完成且具有最低限度的創造性,并且現有的表達與過往所有作品的表達存在差異。[1]判斷這種差異是否存在的標準并不單純以外觀的形態展現為準,而是取決于作品中所蘊含的作者的思想或情感的獨創性表達。
目前實踐中機器寫作的各個環節尚離不開自然人的介入,本案威科先行法律信息庫軟件的開發和使用環節都有自然人作為行為主體直接參與,智能人本身的獨創性不足。雖然在現有的法律體系之下,人工智能本身并不能成為《著作權法》的適格主體,但這并不意味著所有人工智能參與制作的成果都無法享有法律的保護。在本案判決中,法院將涉案文章劃分成軟件生成的圖形部分和文字部分,分別對其內容是否具備“獨創性”進行了討論。
法院認為,分析報告中所出現的由人工智能自動生成的圖形雖兩兩相異,但出現差異的原因僅僅在于每個圖形所依據的數據差異,是根據原始數據變換而形成的機械系變化,不能劃歸為具有獨創性情感或思想表達的智力成果的范疇。涉案文章中所出現的圖形是原告基于收集的數據,利用威科先行法律信息庫軟件制作完成,雖然圖形會因數據變化呈現出不同的樣態,但這種樣態的不同是基于數據差異產生的,而非基于創作產生。針對相同的數據,不同的使用者應用相同的軟件進行處理,最終形成的圖形應是相同的;即使使用不同的軟件,只要使用者利用常規圖形類別展示數據,其表達也是相同的,此類圖形在法律意義上無法符合滿足圖形作品的獨創性要求。
就本案所涉分析報告的文字部分而言,軟件設計者只是對軟件作出了技術性開發,并未在特定報告的內容中體現出使用者和設計者思想和情感的獨創性表達,因此,軟件設計者不能作為涉案文章的著作權主體。軟件使用者雖然對報告進行了信息輸入,但這一輸入僅包含特定客觀性關鍵詞,關鍵詞既算不上智力型成果,更無法定性為主觀上的思想和情感表達。綜上所述,威科先行法律信息庫軟件的開發者和使用者都未能對涉案報告作出獨創性貢獻,也無法成為涉案報告在法律意義上的作者。考慮到原告完成涉案報告過程中的指導性行為,以及其在經濟和時間成本上的支出,法院最終將涉案報告定性為原告主持創作的法人作品,基于該作品的傳播價值,原告對該作品享有《著作權法》上的信息網絡傳播權。
目前人類社會正逐步邁入人工智能時代。智能機器人往往是人類預設好的“算法程序”,運用計算機算法抓取和處理信息數據,并經過加工整理自動生成數據、圖表或新聞稿件。2016年2月搜狐推出一個智能股市播報系統“智能報盤”,由機器人自動跟蹤、捕捉股票市場動態,產出信息流同步推送到搜狐新聞客戶端財經頻道。中國在機器生產新聞的領域還相繼推出了騰訊“Dream Writer”、新華社“快筆小新”、Giiso資訊機器人、搜狐“智能報盤”、《今日頭條》“機器人記者”小明、新華社“媒體大腦”等。這些都預示著大量的數據分析和新聞采編都可以由人工方式轉向智能自動化生產模式,人工智能技術在沖擊新聞傳播行業的同時,也將對現有的法律體系發起挑戰。
三、本案判決的局限性與機器寫作的前瞻性分析
從目前人工智能生成內容的能力來看,新聞生產領域主要的技術仍集中在數據搜集、信息整理及基于上述兩個環節的內容加工層面,機器寫作的成果與經由人類深度調查、思考、分析所完成的作品相比還有相當大的距離。缺乏人工的把關,機器寫作所依據的海量互聯網數據良莠不齊,數據分析報告的準確度難免受到影響。技術層面,基于概率的算法邏輯本身的不確定性[2]也威脅著人工智能生成內容的可靠性。此外,從機器學習到算法決策,大數據分析的原理僅能使人工智能在拼湊信息和數據時,在形態上越來越趨近于人類的語言表達習慣,卻無法取代自然人通過文字圖像展示情感的能力,更無法模仿自然人利用語境、語氣、社會背景、人生經歷挖掘信息碎片背后的故事的能力。
本案中,以數據報告為體裁的文字表達盡管“體現出針對相關數據的選擇、判斷、分析”,但法院否定了“人工智能創作物”的可版權性,而其判決思路與版權法律制度的法理仍值得探討。倘若強人工智能到來后,軟件生產的內容和體裁,具備了版權作品的形式要求和實質要件,具有一定的獨創性,那么仍簡單地認為非人類獨創就沒有著作權是否合適?如果機器寫作的作品已經完全具有版權法意義的獨創性,能否賦予機器寫手獨立的作者身份,從而成為獨立的著作權主體呢?
筆者認為,雖然人工智能不是自然人,但它已然展現出區別于傳統意義上的“物”的特征,甚至通過對自然人語言思維、行為習慣的學習和模仿,在一定意義上正逼近人類的思維、認知與行為。在這一趨勢下,不能因為人工智能生成內容的主體不是自然人或法人,或基于當前弱人工智能階段的技術瓶頸,就全面否定其未來的可版權性。將人工智能生成內容納入傳統版權分析框架,實際上是一種“人工智能對設計版權的演繹作品”,人工智能之“智能”,將設計者之設計版權與智能作品上的版權區分開來。[3]對于現階段的人工智能生成內容,應在現有法律體系中明確各權利主體的權利范圍,為人工智能技術的研發、設計和實際應用更好地服務人類提供良好的法律環境。
盡管目前還處于弱人工智能時代,但世界上已有國家開始考慮在法律上為機器人預設其作為行為主體的經濟地位與社會地位,歐盟甚至立法賦予智能人以電子人格,承認未來的智能人具有行為能力與權利能力。按照我國目前的法律環境,給機器人寫作或其他人工智能技術施展的空間并不多。當算法出現了問題,目前的法律環境使它無法獨立為自己的行為承擔相應的法律后果。在現有討論中,有學者指出,編輯或出版商將成為算法輸出的責任人,但是算法的開發者也不能完全沒有責任,若算法規則存在錯誤,導致數據挖掘存在不準確或偏見,導致輸出的信息或數據有錯誤,那么也應當承擔部分法律責任。[4]可見,面對未來的人工智能生成內容,當前學界對人工智能身份歸屬的多種討論已然預示著不能簡單地將人類實體與法律實體當成“人工智能創作物”的主體。從算法程序的研發到算法程序的應用,從機器學習到算法決策,涉及的各主體包括設計算法的程序員、軟件公司、數據錄入者、人類作者等。在主體資格層面上,可考慮在圍繞機器記者的主體范圍內,思考如何對主體進行角色分配,并制定相應的責任配比。通過對多類主體資格的開放性探討,為特定條件下能夠在真實世界的環境中不受任何形式的外界控制而長時間運行人工智能“自主性”[5]研發預留空間,不失為一種思路。
總之,現階段可以將機器人寫稿內容納入到自然人或其所在機構的權責范圍,但長遠看它仍存在一系列的法律問題,特別是一旦機器人獨立寫稿且作品符合獨創性版權要求以后,如何認定作品和著作權人?筆者認為,法律應該為人和機器人劃出界限,在數據生成與作品生產的各個流程中,按各個主體進行責任分配,以此作為應對未來法律問題的基礎。或許未來要構建一個新的法律框架,以主體的法律邊界為基礎,認定機器若發生侵權可能性的行為所指向的對象、所承擔的責任者,判定機器帶來的損害及因果聯系,規定如何收集機器損害行為的證據等。
[本文為國家社科基金重大項目“人工智能時代的新聞倫理與法規”(項目編號:18ZDA308)的階段性研究成果]
參考文獻:
[1]項賢軍.人工智能創作物的著作權問題研究[J].現代商業,2018(29):160-161.
[2]Mittelstadt B D,Allo P,Taddeo M,et al.The Ethics of Algorithms:Mapping the Debate[J].3,2(2016-11-01),2016,In press(2).
[3]易繼明.人工智能創作物是作品嗎?[J].法律科學(西北政法大學學報),2017,35(05):137-147.
[4]Ombelet P J,Kuczerawy A,Valcke P.Employing Robot Journalists:Legal Implications,Considerations and Recommendations[C]// International Conference Companion on World Wide Web.International World Wide Web Conferences Steering Committee,2016.
[5]郭少飛.“電子人”法律主體論[J].東方法學,2018(3).
(林嘉琳為清華大學新聞學院博士生)
編校:王志昭