999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

挑戰與應對:機器翻譯的發展與翻譯權行使的未來

2021-08-03 09:50:30尹鋒林趙旖鑫
科技與法律 2021年3期
關鍵詞:深度學習人工智能

尹鋒林 趙旖鑫

摘? ? 要:20世紀30年代,法國科學家G.B.阿爾楚尼便提出用機器進行翻譯的設想。近一個世紀以來,機器翻譯實現了從規則驅動到統計驅動,再到神經網絡驅動的技術進步,人類目前可以較為準確地實現外文作品的語言轉換,授權他人翻譯、出版以獲取經濟回報這一翻譯權行使的基本模式因此面臨著重大挑戰。當語言轉換非限于個人使用目的時,智能翻譯機器的訓練者、所有者可能面臨著承擔間接侵權責任之指控。同時,智能翻譯機器的訓練將會不可避免地使用現有作品,并可能會借鑒體現于其中的獨創性表達,這一行為無法援引現行合理使用制度豁免之。從歷史經驗與利益平衡角度出發,版權補償金制度的借鑒有利于在新技術的發展與著作權的保護間找尋微妙的平衡。

關鍵詞:人工智能;機器翻譯;深度學習;著作權;翻譯權;翻譯作品

中圖分類號:D 926 ? 文獻標識碼:A? ? ? ? ? 文章編號: 2096-9783(2021)03-0045-10

引? ?言

人工智能的發展總體表現為從機械學習(Mechanical Learning)到機器學習(Machine Learning)的進步過程。機器翻譯伴隨現代信息處理技術而生,是計算機語言學下的一個重要分支[1],目前以神經網絡技術的驅動為主要發展方向。從規則驅動,到統計驅動,再到神經網絡驅動的機器翻譯,反映了深度學習算法對于人工智能技術的強大驅動力。機器翻譯為作品開辟了新的利用方式,然而這種新興的作品利用方式所帶來的利益授予給誰,在現行《著作權法》中卻尚無明確的答案。技術的進步總會使權利人深陷于權利被侵犯的擔憂之中,這一問題的消解依賴于技術趨勢的分析與權利脈絡的研究。作為《保護文學和藝術作品伯爾尼公約》所承認的第一項權利,翻譯權是將作品從一種語言文字轉換成另一種語言文字的權利,作者因此可以自行翻譯或授權他人在原作品的基礎上創作演繹作品。

機器翻譯的發展給著作權制度帶來兩大挑戰,分別體現于第一重的翻譯權與第二重的翻譯作品之上。作為機器翻譯的基礎——機器學習高度依賴于訓練數據集,將含有作品在內的數據集儲存于服務器、上傳到開源平臺或將非數字形式展現的作品轉換為數字形式,并將之以非人類閱讀的方式供機器翻譯系統進行學習和訓練,這樣的行為是否構成對翻譯作品或其原作品復制權、演繹權等權利的侵犯,是事關機器翻譯技術能否健康發展的重大問題。同時,機器翻譯的發展所催生的“個人翻譯”行為使得著作權人行使翻譯權的空間受到擠壓,如何平衡著作權人、機器翻譯系統開發商、機器翻譯系統使用者之間的利益,亦是一個值得深入研究的問題。立于著作權人、新技術培育者與社會公眾之間,《著作權法》將以何樣的回答消解上述困境?本文試對此問題進行分析和研究。

一、機器翻譯發展歷史

機器翻譯(Machine Translation)是指利用自然語言處理技術,由機器將某一語言文本或語音轉換為另一語言文本或語音,進而實現不同語種人群間交流的技術。不同于由翻譯記憶技術驅動的計算機輔助翻譯技術(Computer aided translation),機器翻譯的目標是由計算機獨立實現文本輸出任務,其發展因而表現為從規則驅動,到統計驅動,再到神經網絡驅動的進步過程。

(一)緣起:基于規則的機器翻譯

基于規則的機器翻譯(Rule-Based Machine Translation)的開發高度依賴于規則庫與語言資料庫的建構[2],其在20世紀90年代前引領著機器發展的主要研究方向。雙語語言學家需將已有的翻譯知識全部轉換為翻譯規則,然而,語言的翻譯規則是無法被窮盡的,面對海量的翻譯任務,語言學家定義規則的難度越來越高,非恰當定義的某個規則可能導致某一個或某幾個規則的變化。基于規則的機器翻譯因而呈現出開發成本高、開發周期長的特點,在面向具體場景應用時,該種翻譯技術常常會面臨“答非所問”的窘境。

(二)進步:統計機器翻譯

統計機器翻譯(Statistical Machine Translation)對機器翻譯進行了數學建模,谷歌翻譯首席科學家 Franz Josef Och曾言:“基于統計的谷歌翻譯需要構建非常大的語言模型,比人類歷史上任何人曾經構建的都要大。”[3]統計機器翻譯對于語料庫的讀取集中于模型建構的前端而非處理翻譯任務的過程中,因為雙語文本的轉換基于統計概率而非對于語料庫的機械依賴。

(三)發展:神經網絡機器翻譯

谷歌與蒙特利爾大學在2014年搭建出首個神經網絡翻譯模型,2015年,百度上線了首個互聯網機器翻譯系統,這標志著機器翻譯步入新的發展階段,深度學習算法(Deep Learning Algorithm)實現廣泛應用,而統計機器翻譯的地位迅速被取代。

神經網絡機器翻譯(Neural Machine Translation)通過算法模擬搭建人類大腦中的神經元結構,通過“編碼——解碼”的過程實現計算機對于目標語言的輸出,其核心在于擁有海量節點、具有自組織和自學習能力的深度神經網絡可直接從數據中學習,且能有效捕獲長距離依賴[4]。基于此,計算機能夠自動在海量語料中獲取語言特征與翻譯規則,機器翻譯因此逐漸克服了基于規則階段時窮盡翻譯規則之困境與統計階段時搭建龐大語料庫之所難。

(四)機器翻譯發展的趨勢與特征

從基于規則驅動、到統計驅動、再到神經網絡驅動,機器翻譯的開發周期不斷縮短,開發成本逐漸降低,這一進步反映了半個世紀以來深度學習算法在人工智能技術發展中所凸顯的強大作用。只要具備足夠復雜的網絡結構、難以想象的海量數據和高效的運算力,深度學習便能充分發揮出其強大的數據擬合能力。根據面向場景的不同,可以將機器翻譯技術發展的趨勢與特征總結為以下兩點:

第一,在簡單任務中,機器翻譯的準確度越來越高,人類角色在機器翻譯中的參與度越來越低。在機器翻譯的開發過程中,人類角色的參與主要集中于訓練階段。應用無監督學習(Unsupervised Learning)算法訓練時,算法工程師無需為數據“打標簽”1,只需將相關語料轉換成低維向量[5],智能翻譯機器便可自動識別特征、實現譯文輸出并將學習的經驗保存下來。通過給定輸入值與輸出值,智能翻譯機器可以擬合出某一函數表達式的系數,而這組函數將成為神經網絡里新的神經元。因此,神經網絡機器翻譯模型得以被不斷訓練,不斷學習新的規則。

目前,騰訊、百度等多家互聯網企業均已上線在線機器翻譯服務,其中,百度在線翻譯平臺已經能夠實現200余種語言的互譯,并支持拍照、手動輸入等多種形式的翻譯。借助這些網絡服務,人類基于出行、工作等需要時,可以在瞬時內得到一個較為準確的翻譯結果。

第二,在復雜任務中,機器翻譯的表現能力有待提升,其主要作為人類譯者的輔助工具出現。以百度在線翻譯平臺為例,用戶雖可以在瞬時間免費得到翻譯結果,然而,當用戶追求更高質量的翻譯文本時,其只能點擊“人工翻譯”按鈕載入到付費翻譯界面當中。

處理一些復雜的翻譯任務時,機器翻譯的發展還未達到一個完全理想化的水平。嚴復曾在《天演論》中提到:“譯事三難:信、達、雅。”目前,機器翻譯已經基本能夠達到“信”的標準,即在某些領域中保證翻譯內容的準確性;然而,要求其完全符合“達”(以接近母語的方式表達)和“雅”(追求文章本身的簡明優雅)兩個標準,還需等待一個奇點的到來。以文學作品為例,天馬行空的想象力、起承轉合的撰寫風格與極具特色的表達方式是其主要特點,不同形式的作品展現獨創性之方式有所不同[6]。由于“感知”能力的缺乏,智能翻譯機器還不能較為出色地完成文學作品的語言轉換。因此,完成一些復雜任務時,機器翻譯主要作為人類譯者或讀者的輔助工具出現。

二、翻譯權的發展與變遷

作為人類交流思想、傳播文化的重要工具,語言在社會發展中起著舉足輕重的作用。目前,世界上的現存語言已超7 000種,事實證明,翻譯人類語言比上個世紀的任何科學難題都更有挑戰性[7]。翻譯權的概念最早在《保護文學和藝術作品伯爾尼公約》中被確定下來,如今,授權他人翻譯并出版傳播其作品是當前著作權制度中作者行使翻譯權的基本模式。翻譯權的行使不僅是作者獲取經濟報酬的主要途徑,還是打破貿易壁壘、促進文化交流和傳播優質作品的重要渠道。

(一)國際公約中的翻譯權

1. 《保護文學和藝術作品伯爾尼公約》中的翻譯權

翻譯權是《保護文學和藝術作品伯爾尼公約》(Berne Convention for the Protection of Literary and Artistic Works)(下文簡稱為“《伯爾尼公約》”)所承認的第一項權利,1967年,被各國廣泛認可為“經濟權利之首”的復制權才被納入到《伯爾尼公約》。

19世紀,各國迫切需要打破文化貿易的壁壘,而事實上,作者通常并不會自行對作品進行翻譯。因此,在當時的文化背景下,國際條約對于翻譯權的承認就顯得尤為重要。1886年《伯爾尼公約》第五條2劃定翻譯權的保護期限為作品發表后的十年,并將翻譯權定義為自行或者授權他人對作者作品進行翻譯的權利;同時,第六條對于翻譯作品提供了保護,其享有與原作品同等的保護,這種保護不應帶有任何偏見。

后來,該公約幾經補充與修訂,翻譯權的相關內容也有所變化。1896年,公約成員國代表在巴黎舉行了一次增補公約內容的會議,將翻譯權的保護期限延長;1908年,《伯爾尼公約》進行第一次修訂,翻譯權的保護期限得以與復制權等其他權利的保護期限相統一3;1971年對公約進行修訂時,應發展中國家的強烈要求,《伯爾尼公約》附件中增加了對于翻譯行為的強制許可證條款4。1995年,世界知識產權組織在《關于伯爾尼公約議定書的備忘錄》中申明,翻譯的概念過去和現在都針對實際語言即人類語言[8],因此,翻譯權的概念僅限于人類所使用語言間的相互轉換。

《伯爾尼公約》作為一個整體,目的是在每個成員國中對與該國存在關聯的外國作者提供保護[9],這就要求其成員國按照公約之要求調整本國法律。以日本為例,雖然文學界人士一貫強調日語的特殊性及和西歐語之間的翻譯差異[10],但是,作為亞洲最早加入《伯爾尼公約》的國家,日本仍然需要主動修改其《著作權法》以履行成員國的義務。

2. 《世界版權公約》中的翻譯權

為協調《伯爾尼公約》成員國與非成員國之間的關系,鼓勵文學、科學與藝術的發展,在聯合國教育、科學及文化組織的推動下,《世界版權公約》(Universal Copyright Convention)(下文簡稱為《版權公約》)于1952年通過。同時,《版權公約》要求各成員國不作任何保留。

首先,《版權公約》明確提出對于翻譯權、復制權、廣播權及表演權四項經濟權利的保護。其次,《版權公約》第五條第(二)款之甲提出了對于翻譯權的限制措施:如果一部文字作品自首次出版算起七年期滿而翻譯權所有者或在其授權下尚未以該締約國通用語文出版譯本,該締約國任何國民都可從主管當局得到用該國通用語文翻譯該作品并出版譯本的非專有許可證。當然,該許可證的頒發只能用于教學、學習或研究5。

(二)我國《著作權法》中翻譯權的變遷

我國于1992年加入《伯爾尼公約》與《世界版權公約》。1990年9月7日,《中華人民共和國著作權法》(下文簡稱為“《著作權法》”)于第七屆全國人民代表大會常務委員會第十五次會議通過,其中,第十條提供了對于作者人身權和財產權的保護,復制、表演、播放、展覽等使用作品的權利被統一稱為“使用權與獲得報酬權”6。同時,第十二條提供了對于翻譯作品的保護,翻譯、注釋、改編、整理的行為被視作創作演繹作品的行為,相關行為應當尊重原作的著作權。這樣,翻譯的行為被規定于演繹行為之下,翻譯作品與改編作品等共稱為演繹作品。

2001年,《著作權法》進行第一次修正。其中,第十條采用列舉的立法方式,將著作權中的經濟權利分類為十二項權利,翻譯權作為一項“將作品從一種語言文字轉換成另一種語言文字的權利”被規定于第(十五)項當中。至此,我國《著作權法》對于翻譯權的保護框架基本被確定下來,2010年進行第二次修正、2020年進行第三次修正時,《著作權法》中翻譯權的原有條款被立法者保留下來。

因此,我國《著作權法》對于翻譯權的保護主要分為以下兩個維度:第一,著作權人的翻譯權受法律保護,著作權人可以自己翻譯或授權他人翻譯作品。第二,翻譯已有作品的行為會產生基于演繹作品的著作權,翻譯作品的獨創性在一定程度上受制于原作品的獨創性。譯者應尊重原作品的著作權,使用原作品需獲得原著作權人的許可,并向其支付報酬。同時,第三方使用翻譯作品時,需同時征求原作者與演繹作者的許可,并向二者支付報酬。

三、機器翻譯的訓練對于翻譯作品的使用

機器翻譯加快了世界一體化的進程,使人類遙不可及的夢想成為可能,但其也帶來了一些著作權難題。目前,機器翻譯技術以研究神經網絡方法最為盛行,具體之訓練依靠深度學習算法為之。神經網絡是模擬人腦搭建的類神經元結構,深度學習算法則是幫助機器實現智能的主要驅動力。

日本于2018年開始“大刀闊斧”地進行《著作權法》改革,允許互聯網及高科技企業直接使用作品而無需經作者同意7,這傳遞出一個信號:于機器學習而言,作品的自由使用存在著一些障礙;而于著作權人而言,機器對于作品的使用存在著“隱秘的風險”。

(一)機器翻譯的訓練過程中將不可避免地使用現有翻譯作品

機器翻譯的訓練目標是幫助計算機獨立、準確且快速地實現譯文輸出,其開發與改進需要學習海量數據。基于規則的和統計翻譯機器需要語言學家與算法工程師共同協力,將翻譯規則轉化為儲存在機器內部的語料庫,而神經網絡機器翻譯能夠自動識別輸入數據的特征并進行學習,通過學習經驗的累積實現翻譯文本的準確輸出。

2017年,由微軟開發的機器人小冰出版“詩集”《陽光失了玻璃窗》,據開發者所言,小冰的訓練量達到10 000次,其共學習了1920年來500余位現代詩人的作品8。人工智能的“創作”不是簡單的大數據組合,而是一種基于數學模型的再數據化輸出[11],因此,表達型人工智能的訓練將會不可避免地使用現有作品和其他文本。

然而,文字是人類可以理解的表示符號,為實現機器的自我學習,訓練者需將文本語句向量化并層層傳遞直至轉化為機器可以理解的機器語言,再經過多重傳導運算,最終生成譯文[12]。諸如小冰一類的詩歌創作型機器的訓練以學習詩歌作品為主要途徑,通過分析不同流派(作者)的不同表達方式,小冰得以在選定的參數下輸出類似風格的詩歌作品。智能翻譯機器以學習雙語或單語語料為主要路徑:理想狀態下,輸入雙語平行語料能夠在最短時間內實現訓練目標;以上語料匱乏時,以單語語料訓練機器也可以幫助其了解該種語言的表達規則與撰寫邏輯。

智能翻譯機器的訓練需要數以萬計的數據輔助之,且訓練數據以存在雙語形式為最佳。雖然著作權的保護只是公有領域中的幾座“孤島”[6],但僅僅從公有領域中抓取雙語訓練數據恐難以滿足其數量和質量要求,因此,許多人工智能公司選擇使用包含作品的訓練數據集,而這些數據本身可能又是利用爬蟲技術從其他數據庫中非法抓取的[11]。當這些公司未經權利人許可并支付報酬,將一篇中文文章與其英文譯文(或者其他平行語料)轉化為低維向量訓練機器學習時,這一行為可能會落入到《著作權法》的保護范圍中。

機器學習的過程主要表現為“輸入數據——機器分析——輸出結果”的過程,這一過程高度依賴訓練數據集與測試數據集。訓練過程中,包含某一翻譯作品(與其原作品)的訓練數據集可能被儲存于某人工智能公司的服務器中用以反復訓練一臺或多臺機器,同時,這一訓練數據集也可能被上傳到某一開源平臺中,這時,以上行為觸犯了復制權9的邊界。

即將于2021年6月1日實施的新《著作權法》第十條之(五)實現了復制權權利范圍的擴大,“數字化”這一方式被納入到復制權的保護范圍中10。有研究認為“數字化”是指依靠計算機技術把一定形式的信息輸入計算機系統并轉換成二進制數字編碼的技術[12]。總而言之,“數字化”是將人類語言轉換為機器語言并儲存在機器中的行為,當訓練者將非數字形式存在的作品轉換為以數字形式存在的作品并儲存在服務器當中時,其也應當面臨著侵犯復制權的指控。

同時,機器學習以模仿為主要手段,譯文的輸出以在訓練數據中抽取可供優化翻譯模型的特征為基礎,這一行為中抽取了原屬于翻譯作品的表達。翻譯作品的獨創性主要體現在譯詞的選擇、譯文的編排上,其獨創性在某種程度上受制于原作品的獨創性[13]。機器對于雙語語料的分析并非針對性體現于作品當中的思想,而是基于其表達。與人類利用參考文獻寫作文章的機理相同,海量數據的輸入也使得機器增長了新的知識并實現了知識增值,這些“知識”將轉化成為機器內部新的模型參數。

(二)現行合理使用制度難以包容此種行為

現行《著作權法》第二十二條以封閉列舉的方式將合理使用限定在十二種情形中,機器翻譯的訓練對于作品的使用行為并不包含在此范圍內。近年來,有法院主張對于封閉列舉立法例的突破11,這一聲音為新《著作權法》所回應。新《著作權法》第二十四條將原見于《中華人民共和國著作權法實施條例》(下文簡稱為《實施條例》)第二十九條12的內容移入,并擴大了合理使用制度適用的情形,第(十三)項“法律、行政法規規定的其他情形”作為一條封閉性兜底條款被引入。

然而,在“音樂噴泉”案中,北京知識產權法院明確表達了適用此類兜底條款之態度:“能否作為著作權法所稱的其他作品,必須由法律、行政法規規定,不能由其他規范性文件規定,以保證法制的統一。”13第二十四條之(十三)的設立試圖在新技術的發展與著作權保護間找尋平衡,因為合理使用的判斷標準產生變動的原因,是新技術背景下對作品全新利用方式的激勵[14]。但是,缺乏其他法律、行政法規的指引時,不能直接引用該條款進行合理使用的辯解。

不過,神經網絡技術具有不可解釋性,在人工智能系統輸入的數據和其輸出的結果之間,存在著無法洞悉的“隱層”,即“算法黑箱”[15]。因此,認定具體侵權行為時,僅從某一次或某幾次的譯文輸出判斷,無法推知機器學習了哪一部或哪幾部作品,更無法推知機器為何生成這一翻譯結果。這時,應要求訓練者提供原始訓練數據集。雖然機器翻譯技術的發展有其政治、軍事及文化意義,未經著作權人許可而對他人作品加以利用的行為卻不能因此得到《著作權法》的豁免,然而,基于人工智能訓練行為的非公開性,這種風險總是隱秘存在的。

四、機器翻譯的發展與翻譯權行使的挑戰

“Dreamwriter”案中,Dreamwriter系騰訊科技(北京)有限公司開發并授權給原告方深圳市騰訊計算機系統有限公司使用的智能新聞寫作軟件,該軟件可以自動撰寫股市財經綜述類文章,且原告的創作人員每年可在該軟件的協助下完成大約30萬篇作品。深圳市南山區人民法院否認了該軟件獨立為“創作”行為的正當性,但其認為,作為創作人員的工作助手,Dreamwriter參與撰寫的文章是具有獨創性的法人作品14。人工智能技術正不斷邁入到文學、藝術領域當中,雖然其“作者”地位并不為《著作權法》所包容,利用其進行創作卻已成為一種新的風尚。

神經網絡機器翻譯的開發成本低,運行速度快。由翻譯記憶技術驅動的計算機輔助翻譯技術與專業譯者的配合度更高,自動生成翻譯結果的機器翻譯則面向更多非專業譯者。目前,準確度不斷提升的機器翻譯對于翻譯權行使的挑戰主要有二。

(一)機器翻譯的普及打破了翻譯權行使的固有模式

知識產權的客體是無形的智力活動成果,它以信息的方式存在于那里,雖然其具有鮮明的地域性,但對于相關的智力活動成果的利用卻是沒有國界的[16],這為某一作品在世界范圍內的傳播提供了可能。然而,作品的廣泛傳播存在一個前提:該作品需被譯為多國語言,基于此,作者得以通過授權他人翻譯或自行翻譯(若其掌握該門語言的話)的方式行使翻譯權,并獲取經濟報酬。

當讀者對某一部外國作品產生興趣,其會產生閱讀該作品的文學性需求,這種需求的實現以將該部作品翻譯為本國通行語言為前提。神經網絡機器翻譯的普及與發展使讀者的私人翻譯行為成為可能。當某一讀者對于某部外國作品的需求僅限于了解其基本含義而非欣賞文學性、準確度更高的專業譯本時,其可以借助機器翻譯將部分或全部作品翻譯成其熟練使用的語言,當然,這一行為應基于個人欣賞或學習之目的。長久以往,讀者對于外國作品的本國譯本的需求相應下降,這時,著作權人行使翻譯權的空間相應縮小。即使作者仍通過翻譯權的行使在該國出版了該譯本,該譯本的銷量可能也會因機器翻譯的迅速普及而不甚理想。

(二)機器翻譯為侵權者提供了便利

繼續上文的假設,某一外文作品在某讀者所在國家內依據國際公約或雙邊條約享有著作權,某讀者非基于個人欣賞或學習之目的,未經著作權人許可,擅自借助機器翻譯實現了該外文作品的語言轉換以獲取非法收益時,這名讀者毋庸置疑應面臨侵犯著作權人翻譯權之指控,其應承擔直接侵權之責任。

無論基于合法或非法的目的,當用戶將需要翻譯的文本輸入至在線翻譯平臺中并點擊“翻譯”按鈕時,機器翻譯將在幾秒鐘之內生成翻譯結果。因此,當用戶未經許可翻譯他人作品時,機器只能別無選擇地繼續完成輔助工作。對于這一法律風險,以百度公司為首的機器翻譯服務提供商在《翻譯協議》中指明:“其對于鍵入內容和翻譯結果造成的侵權、糾紛、損失概不負責,亦不承擔任何法律責任。”15

當用戶基于未經許可的翻譯行為構成直接侵權時,智能翻譯機器實際上成為了直接侵權者的“侵權工具”,其訓練者或所有者開發新技術的行為客觀上為直接侵權者提供了侵權的便利,這一技術支持行為[17]可能面臨著承擔間接侵權責任中輔助侵權[18]之指控,這一行為無法通過以上的免責條款進行規避。面對浩如煙海般的“私人翻譯”行為,權利人直接起訴機器翻譯用戶是不明智的,因此,其有可能將訴訟的矛頭指向訓練者或所有者。這時,機器翻譯便面臨著美國“索尼”案中的尷尬處境。

作為本案的原告,環球影視公司和迪士尼公司就一系列電視節目享有版權。由于索尼公司生產的家用錄像機的購買者通過電視廣播錄制了原告享有版權的節目,1976年,二位原告在地方法院提起了針對被告索尼公司的訴訟,并向法院控告索尼公司售賣的錄像機構成輔助侵權。在該案的審判中,地方法院作出了有利于被告的判決,然而,上訴法院的判決則主要支持了原告的訴求。當案件進入美國最高法院的審理程序當中時,最高法院再次支持了被告的主張,認定改變觀看時間使用錄像機錄制電視節目的行為構成合理使用,而錄像機具有除侵權外的其他用途,被告的行為并沒有構成幫助侵權。“索尼”案認為:只要產品能夠具有一種潛在的“實質性非侵權用途”,產品的制造商和經銷商就無需承擔輔助侵權之責任16。

若按照“實質性非侵權用途”標準,機器翻譯的開發者或許無需承擔間接侵權之責任。然而,這一技術的發展與普及帶給著作權人的沖擊卻是切實存在的。間接侵權責任以直接侵權責任的成立為前提[19],“索尼”案中,改變觀看時間使用錄像機錄制電視節目的行為構成合理使用,然而,非基于個人欣賞、學習之目的,未經許可利用機器翻譯實現他人作品語言轉換的行為卻不具有適用合理使用進行抗辯的空間。

同時,“索尼”案中所確立的“實質性非侵權用途”標準為故意設計一種主要用途在于侵權, 卻具有至少“一種”“潛在”的合法用途的產品打開了方便之門[20],其正當性也有待一事一論的探討。事實上,本案中持不同觀點的法官曾發表這樣的言論:“可以認定被告構成幫助侵權,但是可以通過判給損害賠償金或權利金的方式維持被告的生產與售賣行為,這樣,購買者也可以繼續使用錄像機而不受打攪。”[21]

五、利益平衡視角下的風險應對路徑:版權補償金制度的借鑒

技術中立原則與利益平衡原則是《著作權法》立法始終應遵循的兩大原則。《著作權法》基于回應印刷技術的發展而產生,基于回應網絡技術的發展而變化,也將基于回應人工智能技術的發展而面臨挑戰。

(一)版權補償金制度產生于利益平衡的需要

上世紀六十年代,德國正面臨著這樣一個問題:伴隨著各種復制設備的普及,私人復制的成本愈發低廉,大量的私人復制作品涌現出來,這嚴重沖擊了正版作品銷售的市場。然而,依據當時德國的《著作權及鄰接權法》,個人復制行為并不具有非法性。因此,這樣一個問題被置于立法者眼前:當私人復制行為不具有法律上的可責性,卻又切實影響到作者的收益時,該采取何種措施來平衡二者之間的利益關系?

1965年,德國的《著作權及鄰接權法》吸收了1955年“Grunding Reporter”案與1964年“Personalawsweise”案中法院的基本做法,將版權補償金制度從立法的層面確定下來。由此,復制設備的生產商與進口商需要繳納不超過銷售額百分之五的補償金,該補償金的收取由著作權集體管理組織承擔。后續,伴隨著科技的發展,德國又將該制度進行了兩次革新,該制度的征收對象(復印設備等也被納入到征收對象中)不斷擴大,受益人范圍不斷被擴展(鄰接權人被納入到受益人范圍中),同時,制度開始對不同設備收取不同金額的版權補償金。

在美國,“索尼”案的判決雖然釋明了“幫助侵權”與“合理使用”的問題,但是,這一判決并沒有完全把握住新技術發展與著作權保護間的微妙關系。1990年,索尼公司再次陷入訴訟中,以作曲家Sammy Cahn為首的大量音樂版權人認為索尼公司生產的數字錄音機影響了作品的“潛在市場”17。這場訴訟雖因原告方Sammy Cahn的撤訴結案,卻在客觀上推動了《家庭錄音法》( Audio Home Recording Act of 1992)的通過,該法后成為《美國版權法》中的內容。《家庭錄音法》要求在數字錄音設備中設置控制復制行為的技術措施,并要求其制造、銷售商按照申報的銷售數量繳納版稅[6]。

試圖彌補合理使用偏差的版權補償金制度的導入,在某種程度上緩解了模擬復制技術條件下的權利人與使用人之間的緊張關系[22],復制設備的生產者可能并不攜有生產侵權工具的目的,消費者在購買設備時也并非都攜有使用該設備為侵權行為之目的,但是,為應對私人復制行為帶給著作權制度的沖擊,版權補償金制度所采取的“一刀切”設計符合利益平衡原則。一方面,私人復制行為仍具有合法性,但是,版權補償金最后都將轉換為設備的成本,該部分金額實際上被轉嫁到了購買產品的消費者身上,這在一定程度上約束了消費者的行為;另一方面,著作權人的潛在利益或許因私人復制行為受到影響,但是,該制度使其獲得應有的經濟補償,這在另一種維度上維護了其合法權益。

(二)應借鑒版權補償金制度建立我國的“人工智能稅”

版權補償金制度是數字技術時代下調和不同主體間利益沖突的重要路徑,隨著新一代科技革命[23]的到來,其還應被賦予更多的內涵。盡管許多歐洲國家都參考德國《著作權法及鄰接權法》建立了各具特色的版權補償金制度,但由于種種原因,我國《著作權法》中并未建立起這一制度。

文學藝術作品在本質上是流動的、無形的、共享的,且不會被消耗, 具有公共產品屬性[24]。神經網絡機器翻譯和其他人工智能技術在其訓練、商業性應用過程中對于作品的利用、翻譯行為對著作權人的潛在利益造成了影響,而這些行為卻總是隱秘發生的。新技術的發展與培育,使得著作權人的利益長期處于不安寧的狀態之中,某一作品被納入到機器的訓練數據集時,該作品的權利人往往難以發現或舉證這一侵權行為。同時,由于作品自由利用的障礙性,訓練人工智能模型時常會面臨數據稀缺問題。因此,應在人工智能時代下建立與我國國情相適應的版權補償金制度,可以稱之為“人工智能稅”。

人工智能的訓練者、所有者尋求作品等數據的開放獲取以實現相關模型的訓練與提升,著作權人則迫切希望智力成果能夠得到合法、理性的使用。因此,人工智能訓練者與所有者是該種版權稅的義務主體,著作權人相應作為受益主體,同時,該種版權稅應由我國的著作權集體管理組織進行征收。不過,在我國設立“人工智能稅”的前提是以下兩個問題的順利解決:

第一,加強著作權集體管理組織的建設。《著作權法》第八條確定了集體管理組織的非營利性特征18,該組織的目標應是通過使用費的代收取與維權訴訟行為保障著作權人合法利益的實現。在我國,基于制度環境與自利動機[25],著作權集體管理組織缺乏相應的市場基礎,目前,這一制度設計并未實現《著作權法》的預期目標。賦予著作權集體管理組織收取版權稅義務的前提應是相關組織具有一定的市場接受度,并且能最大化地維護著作權人利益的實現。

第二,確定一個合適的征收稅率。版權補償是一種折衷方案,賠償基于著作權法人的實際損失,而補償則基于法律的例外規定。因此,這一制度設計不應將更多的砝碼加于著作權的保護之上,而應在市場規律的指導下,確定一個折衷、合理的征收稅率。“人工智能稅”中的版權補償基于具體的開發、銷售行為,補償金額則以開發商、服務商的申報數量為主要計算基點。過高的稅率無疑是為新技術的發展增加了新的負擔,這一負擔不應重于單獨為作品的利用而付費的負擔,同時,過低的稅率無法彌補著作權人潛在市場受到擠壓而帶來的利益受損。

結? ?語

雖然,新技術的發展總能為人類帶來生產、生活方式上的變革,但革新中的“陣痛”應得到理性地分析與對待。智能翻譯機器的訓練需要海量的平行雙語語料,在深度學習中,其將會不可避免地復制、改編某部作品與其翻譯作品,這一行為無法為現行的合理使用制度所包容。同時,伴隨著神經網絡技術的普及與應用,當用戶基于合法或非法目的使用機器翻譯實現某部作品的語言轉換時,著作權人的潛在市場及利益會因此受到影響,其作品面臨著被擅自翻譯并利用的風險。

技術中立視角要求《著作權法》在新技術的發展與著作權的保護間尋求微妙的平衡。版權補償金制度的借鑒既可以掃清人工智能開發者使用作品進行深度學習的法律障礙,擴充其訓練數據集,又給予了深陷于擔憂權利被侵犯的不安寧情緒中的著作權人以合理補償,《著作權法》應朝著這一方向邁出步伐。應當認為,機器翻譯對于《著作權法》的挑戰尚不足以動搖法律的根基,但是,身處這一洪流時,《著作權法》應當基于利益平衡的信念發出聲音。

參考文獻:

[1] 黎亞飛,張瑞華.機器翻譯發展與現狀[J].中國輕工教育,2019(5):38-45.

[2] 侯強,侯瑞麗.機器翻譯方法研究與發展綜述[J].計算機工程與應用,2019,55(10):30-66.

[3] 斯介生,宋大我,李揚.大數據背景下的谷歌翻譯——現狀與挑戰[J].統計研究,2016,33(5):109-112

[4] 劉洋.神經機器翻譯前沿進展[J].計算機研究與發展,2017,54(6):1144-1149.

[5] 蔡圓媛,盧葦.基于低維語義向量模型的語義相似度度量[J].中國科學技術大學學報,2016,46(9):719-726.

[6] 李明德.美國知識產權法[M].北京:法律出版社,2014.

[7] Erik Ketzan. Rebuilding Babel: Copyright and the Future of Online Machine Translation[J].Tulane Journal of Technology and Intellectual Property,2007(205):206-234.

[8] 鄭敬蓉,陳波.圖書館館藏作品數字化的法律性質與立法完善[J].新世紀圖書館,2020(11):22-26.

[9] 喬治·庫曼托 ,鄭成思.國際私法與伯爾尼公約[J].法律科學(西北政法學院學報),1992(3):57-65.

[10] 李志紅.翻譯權在日本的變遷[J].出版發行研究,1992(6):56-59.

[11] 馬忠法,肖宇露.論人工智能學習創作的合理使用[J].山東科技大學學報(社會科學版),2020,22(5):32-47.

[12] 劉友華,魏遠山.機器學習的著作權侵權問題及其解決[J].華東政法大學學報,2019,22(2):68-79.

[13] 應明.數字化技術的發展對現行著作權制度帶來的新問題[J].知識產權,1994(6):7-13.

[14] Matthew Sag. The New Legal Landscape for Text Mining and Machine Learning[J]. Copyright Socy of the U.S.A.(2019)66:291-365.

[15] 徐小奔,楊依楠.論人工智能深度學習中著作權的合理使用[J].交大法學,2019(3):32-42.

[16] 徐鳳.人工智能算法黑箱的法律規制——以智能投顧為例展開[J].東方法學,2019(6):78-86.

[17] 李明德.知識產權法.[M].北京:法律出版社,2014.

[18] 劉文杰.信息網絡傳播行為的認定[J].法學研究,2016,38(3):122-139.

[19] 劉平.著作權“間接侵權”理論之檢討與展望[J].知識產權,2018(1):67-96.

[20] 羅斌.云計算環境下的著作權間接侵權規則探討——從“索尼案”到“Cablevision案”的適用原則變更[J].中國版權,2012(3):48-51.

[21] 王遷.“索尼案”二十年祭——回顧、反思與啟示[J].科技與法律,2004(4):59-68.

[22] 曹世華.論數字時代的版權補償金制度及其導入[J].法律科學.西北政法學院學報,2006(6):143-151.

[23] 張今.數字環境下的版權補償金制度[J].政法論壇,2010,28(1):80-87.

[24] 尹鋒林,肖尤丹.以人工智能為基礎的新科技革命對知識產權制度的挑戰與機遇[J].科學與社會,2018,8(4):23-33.

[25] 向波.著作權集體管理組織:市場功能、角色安排與定價問題[J].知識產權,2018(7):68-76.

Challenges and Solutions: the Development of Machine Translation and the Future of Translation Right

Yin Fenglin, Zhao Yixin

(School of Intellectual Property, University of Chinese Academy of Sciences, Beijing 100040, China)

Abstract: In 1930s, French scientist G.B. Artsouni proposed the idea of machine translation. In the past century, machine translation has achieved its progress from rule-Based machine translation to statistical machine translation, and then to neural machine translation. It can be foreseen that in the future, machine translation will perform a pivotal role in text translation, which will challenge the normal approach of exercising the translation right of the author, that is, to authorize others to translate the preexisting works to obtain the royalty. When the language conversion is not limited to purpose of personal use, the trainers and owners of machine translation may be charged with indirect infringement liability. At the same time, the training of intelligent translation machine will inevitably use a number of preexisting works, and may learn from the original expression embodied in them, which cannot be exempted by fair use. From the perspective of historical experience and balance of interests, the reference of copyright compensation system is helpful to find a delicate balance between the development of new technology and the protection of copyright.

Key words: artificial intelligence; machine translation; deep learning; copyright; translation right; translation works

猜你喜歡
深度學習人工智能
我校新增“人工智能”本科專業
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
基于深度卷積網絡的人臉年齡分析算法與實現
軟件工程(2016年8期)2016-10-25 15:47:34
主站蜘蛛池模板: 浮力影院国产第一页| 精品人妻一区无码视频| 国产乱子精品一区二区在线观看| 亚洲国产日韩视频观看| 丰满的少妇人妻无码区| 欧美午夜视频在线| 亚洲精品免费网站| 国产成人亚洲精品蜜芽影院| 内射人妻无码色AV天堂| 国产在线一区二区视频| 久久国产精品77777| 日韩毛片视频| 亚洲va欧美ⅴa国产va影院| 久久黄色视频影| 丁香婷婷久久| 久久久久久午夜精品| 伊在人亞洲香蕉精品區| 国产精品永久久久久| 日韩成人免费网站| 国产精品成人AⅤ在线一二三四| 全午夜免费一级毛片| 国内精品视频在线| 久久久久久尹人网香蕉| 在线视频亚洲欧美| 国产精品9| 欧美色丁香| 亚洲精品国产乱码不卡| 40岁成熟女人牲交片免费| 成人免费午间影院在线观看| 亚洲欧美天堂网| 蜜桃视频一区| 欧美19综合中文字幕| 91午夜福利在线观看精品| 尤物亚洲最大AV无码网站| 亚洲美女一区二区三区| 人人看人人鲁狠狠高清| 成人自拍视频在线观看| 亚洲综合经典在线一区二区| 91无码国产视频| 国产特级毛片aaaaaaa高清| 久久先锋资源| 日韩一区二区三免费高清| 亚洲视屏在线观看| 重口调教一区二区视频| 久久semm亚洲国产| 亚洲欧美日韩中文字幕一区二区三区| a级毛片网| 日韩AV手机在线观看蜜芽| 国产综合亚洲欧洲区精品无码| 欧美综合区自拍亚洲综合天堂 | 亚洲国产91人成在线| 欧美黑人欧美精品刺激| 欧美色图第一页| 欧美视频二区| 免费人成视网站在线不卡| 在线观看91精品国产剧情免费| 成人在线第一页| 久久精品视频亚洲| 国产女同自拍视频| 久久久噜噜噜| 91欧洲国产日韩在线人成| 久久99热这里只有精品免费看| 亚洲大尺度在线| 国产乱人伦AV在线A| 国产精品无码久久久久AV| 久久这里只有精品23| 制服丝袜 91视频| 国产精品无码影视久久久久久久 | 亚洲资源站av无码网址| 国产在线观看一区精品| 91精品视频网站| 亚洲男人的天堂网| 亚洲有无码中文网| 色偷偷综合网| 一级毛片视频免费| 亚洲嫩模喷白浆| 国产在线观看99| 97影院午夜在线观看视频| 欧美激情第一区| 国产激情无码一区二区三区免费| 国产欧美视频在线| 中国一级毛片免费观看|