999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

公共圖書館文本數據挖掘的著作權風險和出路

2023-06-25 18:06:35余祥聶建強
新世紀圖書館 2023年4期
關鍵詞:人工智能

余祥 聶建強

摘 要 圖書館文本數據挖掘存在侵犯著作權的風險,因此需要探索風險和出路。通過分類討論法將挖掘過程分為采集階段、輸出階段。采集構成侵權,根據輸出內容是否包含原作獨創性表達,使用行為分為“作品性使用”和“非作品性使用”,若“作品性使用”的輸出內容包含原作少量獨創性表達,屬于合理使用,“非作品性使用”不侵權。為規避挖掘的侵權風險,可設置著作權例外規則、建立版權補償機制、允許對未發表的作品實行“非作品性使用”。

關鍵詞 公共圖書館;人工智能;文本數據挖掘;著作權;合理使用;轉換性使用

分類號G258.2

DOI 10.16810/j.cnki.1672-514X.2023.04.005

Abstract Library text data mining has the risk of infringing copyright, so it is necessary to explore the risk and outlet. The mining process is divided into collection stage and output stage by classification discussion. Collection constitutes infringement, according to whether the output content contains original original creative expression, the use behavior is divided into “works use” and “non-works use”. If the output content of “works use” contains a small amount of original creative expression of original works, it is reasonable use, and “non-works use” does not infringe. In order to avoid the infringement risk of mining, copyright exception rules can be set up, copyright compensation mechanism can be established, and “non-published use” of unpublished works can be allowed.

Keywords Public library. Artificial intelligence. Text data mining. Copyright. Reasonable use. Transformative use.

0 引言

當前,通過人工智能文本數據挖掘(TDM)開展科研工作已成為一種必然趨勢。TDM可以從海量文本數據中提取所用的信息,然后通過邏輯推導從原始文本數據中總結規律和提煉規則。公共圖書館存儲海量的圖書文獻資源,實施TDM有天然的優勢,可以通過TDM來發掘有價值的內容,進而提高智能化管理的水平,提升公共文化服務水平。實踐中,圖書館借助TDM可以優化館藏資源采購建設、評估借閱服務效率,調整館員服務結構、向讀者提供個性化服務。雖然圖書館實施TDM有重要意義,但在TDM過程中存在著作權侵權風險,對文本數據的抽取、復制、傳輸等涉嫌侵權,致使公共服務與著作權之間產生沖突。雖然圖書館主張利用TDM進行信息采集和分析是用來更好地服務社會公眾,但版權方若堅持主張版權,則圖書館進行TDM就必須征求版權方許可。因此,如果不解決侵權問題,有關TDM的侵權糾紛未來或將頻發,所以有必要探索圖書館TDM過程中的著作權風險。

1 圖書館TDM在不同階段的侵權風險

TDM分為采集、輸出兩個階段。采集是指人工智能采集、輸入文本數據,并在機器中形成可被閱讀的復制件,輸出是指機器對文本數據進行處理并輸出內容。

1.1 采集階段的侵權風險

采集階段的法律風險體現在網絡爬取,其目的在于獲取源文本數據。人工智能通過網絡爬蟲爬取網絡書籍信息,比如電子書和文學網站,對于網站設置的版權保護裝置,爬蟲程序可以規避或破譯而深入挖掘,然后復制源文本數據,以此實現對文本數據的閱讀,進而實現數據訓練。人工智能通常對獲取的源文本數據進行數字化處理,并將數字信息按照一定模式編排,進而為輸出奠定基礎。未經權利人許可擅自抓取作品信息涉嫌侵犯復制權。文本數據采集的侵權判定如圖1所示。

TDM實現了從“人力閱讀”到“機器閱讀”,對大量作品信息進行采集意味著對大量作品進行復制,進而實施批量化“閱讀”[1]。如圖1所示,采集階段的“復制行為”可能涉及三類文本數據信息:第一類為正處于著作權保護期的作品;第二類為不構成作品的信息,即信息不屬于著作權意義上的作品;第三類為已過了著作權保護期的作品。人工智能在采集大量的文本數據前,不太可能全部獲得相關權利人的許可,否則會嚴重影響采集的效率,所以此類“復制”行為涉嫌侵犯復制權。那么這種“復制”是否屬于臨時復制?如果屬于,則豁免侵權,因為臨時復制屬于豁免侵權的行為。臨時復制實質上是短暫性的緩存,必須具備兩個要求,即復制的時間很短且沒有獨立的經濟價值,而文本數據采集很難滿足這兩個要求,因為被采集的信息在轉碼后會被機器長期存儲,機器將來仍可以再次讀取,信息也可以再現,此時復制已具備獨立的經濟價值。況且目前我國《著作權法》尚未將臨時復制列為豁免侵權的行為。那么此種復制能否適用合理使用呢?

在2020年新修改的《著作權法》中,合理使用條款仍限于十二種具體情形,之后以“法律、行政法規規定的其他情形”作為兜底條款。當前國內法律予以明確的合理使用的范圍有限,目前與采集行為初步符合的,只有該條款第一項或第六項,但仔細研究后發現并不完全符合。該條款第一項“為個人學習、研究或者欣賞,使用他人已經發表的作品”,該條款限定了使用主體,即用于個人,但圖書館進行文本數據采集屬于單位行為,而非個人活動,而且進行文本數據采集是為了社會公眾,具體來說是為了廣大讀者,并非為了個人,因此不符合該條規定情形。第六項“為學校課堂教學或者科學研究”必須為“少量復制”,且主體必須為“教學或者科研人員”,圖書館工作人員可視為科研人員,但其采集行為屬于大量甚至整體復制,因此圖書館進行采集與該條款第一項和第六項規定情形不符。綜上,圖書館進行文本數據采集在新修改的《著作權法》中無法找到合理使用條款作為豁免侵權的法律依據。所以,未經權利人授權的采集可能屬于侵權。

1.2 輸出階段的侵權風險

輸出階段,是對文本數據進行處理并輸出內容的過程。在此過程中,文本數據被深度開發,實現了知識的累積和價值增長,即知識增值。文本數據挖掘后產生的知識增值,可以被分為兩種[2]。第一種為“作品性使用”,是指輸出的內容包含原作品的獨創性表達,這類使用的目的通常為方便讀者檢索和閱讀或者保存、陳列圖書文獻。比如:圖書館將館內圖書封面做成縮略圖,將館藏圖書進行數字化掃描后制作成圖書檢索軟件,其主要目的在于方便讀者進行圖書檢索,讀者在搜索框輸入特定詞,可以知悉特定詞在書中出現的頻率,進而提高查找效率;為方便閱讀障礙者閱讀,圖書館會將原作品數字化掃描后轉換為無障礙閱讀格式文本;面對圖書文獻已損毀或瀕臨損毀、滅失等風險,圖書館會將紙質作品進行數字化掃描以便于存儲。第二種為“非作品性使用”,是指基于科研或信息管理目的而對既有作品進行深度分析,挖掘出全新的價值,輸出的內容不包含原作品的獨創性表達,重在從信息中尋找結論或規律以輔助決策。比如,通過TDM探尋圖書類型與圖書借閱量數據的關聯,預測采購何種類型書籍更受讀者歡迎,進而避免采購的圖書被閑置。

隨著信息技術的發展,大量的文本數據被創造出來,越來越多的網絡用戶接觸文本數據并使用,使得文本數據價值快速上漲,而知識增值行為的實質是基于新用途而不斷發掘文本數據的新價值。TDM中產生的知識增值是累積的,文本數據被不同使用者利用,不同使用者對文本數據有不同的使用需求,文本數據在不斷流通之中,其價值很難被開發殆盡。在使用文本數據時,使用者會考慮很多問題,如怎樣使用該文本數據,為了解決什么問題等。由此,圖書館的“非作品性使用”可分為以下幾種類型:第一種是文本數據的簡單再利用,如圖書館通過借閱圖書的登記數據來了解圖書利用率;第二種方式為文本數據的關聯,即對兩種以上數據進行關聯分析,進而得出結論,疊加重組后的數據價值會超過單一的數據價值,如將圖書借閱量和圖書館開放時間的數據組合起來,進行關聯分析,如果發現二者具有關聯性,那么組合后的數據就是數據的關聯;第三種是擴展文本數據用途,即擴展文本數據的其他用途,如圖書館中被經常借閱的現實題材的小說既可以用來了解讀者的閱讀偏好,也可以用來了解公眾目前所關注的現實問題;第四種是挖掘文本數據的算法價值,即在用戶進行網絡搜索時,平臺可以了解用戶檢索的全過程,如一些電商平臺設置“排名算法”,消費者搜索某商品的頻率越高,網站推薦欄目中該商品的排名越靠前。圖書館進行TDM,可以獲得讀者的習慣、偏好、特定需求,針對不同讀者提供個性化的信息服務,比如信息推送。

輸出階段的知識增值是基于原作品而產生,與原作品存在一定關聯,對于“作品性使用”來說,輸出內容中包含原作的獨創性表達,有可能涉及侵犯信息網絡傳播權和復制權;對于“非作品性使用”,輸出的內容中不包含原作的獨創性表達,不侵犯以上權利,但由于輸出內容源于原作品,是否侵權演繹性權利,這仍然是一個需要探討的問題。

(1)作品性使用。該類使用是指TDM后的輸出內容中包含作品的獨創性表達。未經作品版權人許可,輸出內容中出現作品獨創性表達會涉嫌侵權。為平衡版權人和社會公共利益,《著作權法》中第二十四條合理使用條款對著作權予以限制,可借鑒的條款為“為介紹、評論某一作品或者說明某一問題,在作品中適當引用他人已經發表的作品”,所以如果輸出內容包含原作少量的獨創性表達,那么符合該條款要求,可認定為合理使用,如果輸出內容包含原作大量的獨創性表達,需要考慮是否適用侵權豁免規則,如果不適用,則屬于侵權。基于無償向閱讀障礙者提供無障礙閱讀格式文本而對作品進行TDM所產生的復制適用侵權豁免規則,這基于《馬拉喀什條約》所規定,圖書館為陳列、保存需要對已損失或瀕臨毀損、滅失等情形下的紙質作品進行TDM所產生的復制適用侵權豁免規則。例如,某圖書館利用人工智能對大量圖書信息進行數據分析,生成圖書識別軟件,讀者使用軟件時通過掃描圖書封面可以獲得圖書目錄和序言。圖書目錄和序言相對于整本書籍來說,屬于原作少量的獨創性表達,所以該知識增值構成合理使用,但如果圖書大量章節被展現在圖書識別軟件中,又不屬于侵權豁免情形,則構成侵權。在王莘訴谷歌圖書館侵權案[3]中,法官判定被告谷歌圖書館構成侵權。該案中,被告未經原告許可對原告作品進行了電子化掃描,法官認為該復制行為會對權利人的經濟利益造成“現實”損害和“潛在”危險。

從轉換性使用角度,也可以判定該類型使用不構成侵權。轉換性使用產生于1994年美國“Campbell訴AcuffRose音樂公司”案[4],現在已成為判定合理使用的重要準則,該案件涉及對原作品的戲仿,進而引出“轉換性使用”的理念,轉換性使用不再局限于對原作品使用數量和性質的限制,而是在所采用的內容表達、使用目的等方面具有創新性。轉換性使用主要包含兩種類型,即內容上的轉換性使用和目的上的轉換性使用。前者是對原作品進行再創作,并形成了新的表達,比如對原圖片的風格、線條、大小、顏色、字體、形狀進行改變,或對原作進行戲仿、評價。數字時代讓使用者更加便捷地利用軟件對原作進行編輯,如果編輯后的圖片加入了大量獨創性部分,使得原圖片和編輯后的圖片有明顯區分,那么該二次創作行為則構成轉換性使用。實踐中,很多電影解說屬于對原作的二次演繹[5],構成轉換性使用,制作者從影視原作中剪輯很多片段后重組,然后加入大量獨創性的部分,比如解說詞、背景音樂、特效、文字字幕等,使解說作品與影視原作有明顯區別,此類行為仍可被視為轉換性使用。后者是指改變對原作品的使用目的,這種轉換性使用未對原作品進行任何再創作,只是對原作品進行了不同的功能利用,這不會沖擊原作品的市場利益,例如美國論文檢測系統Turnitin,檢測系統雖收錄了大量論文數據,但其收錄論文的目的在于檢測論文,并非將論文原樣呈現給讀者,因此屬于目的的轉換性使用。轉換性使用出現的根源在于權利人與大眾使用之間利益失衡,這反映了市場的失靈,轉換性使用是為了解決市場失靈和利益失衡的問題 [6]。國內司法實踐中也開始借鑒美國的轉換性使用理論。比如在黑貓警長海報案[7]中,法官認為被告海報中使用黑貓警長圖案并非為了單純彰顯圖案自身的藝術價值,使用的主要目的是為了說明問題,該圖案被使用時呈現了新的價值和功能,其藝術價值和功能產生了較高程度的轉換,由此可以看出法官在說理時借鑒了轉換性使用理論的理念。

內容上的轉換性使用不屬于侵權,因為對原作使用后的新作品已形成了新的獨創性表達,但目的上的轉換性使用并未對原作進行新的創作,該情形下使用原作之所以屬于合理使用,是因為有著獨特的理論依據。著作權所設立的目的是為了激勵作者創造創新,法律使作品權利人擁有專有權。若使用者未獲得合法授權而使用作品,則會損害權利人的版權利益,進而降低作者的創造熱情,這違背了知識產權的立法目的。所以對作品原有市場的保護是應當的,但是潛在市場是難以發現的市場[8]。對潛在市場的開發不應當由法律賦予著作權人所獨有,因為原作品作者在創立作品時未曾預料到潛在市場的存在。對潛在市場的開發不會抑制原作品權利人的創作積極性。如果對作品的使用顛覆了傳統的使用方式,開發出潛在的市場,就不會損害權利人原有的版權市場利益。目的上的轉換性使用實質上將市場劃分成了不同模塊,每個模塊有專屬的消費者群體,如果消費者存在于不同的市場模塊中,就不會損害原著作權人的市場利益。比如,翻譯機器人對大量的文字作品進行機器學習,從而產生了翻譯模型,用戶只要輸入語句,翻譯機器人能夠自動生成翻譯。該例子中翻譯機器人對大量的文字作品進行了二次使用,其受眾群體是對翻譯有需求的人,而原文字作品的受眾是閱讀原文字作品的讀者,兩個受眾群體分屬不同的市場模塊,相互之間不會產生競爭,翻譯機器人開發了一個潛在市場,不會削弱原文字作品作者的市場利益,因此構成合理使用。

在“作品性使用”中,如果輸出內容包含原作少量的獨創性表達,可被視為轉換性使用,具體來說屬于目的上的轉換性使用。目的轉換性使用是指在二次利用中未添加新的獨創性表達,僅改變對原作使用的用途。隨著技術不斷進步,作品會不斷涌現出新價值,如果由版權人享有原作全部的潛在價值,則會滋生壟斷,進而導致高昂的許可費,這會削弱市場的創新性,況且對作品的利用與使用者的個人素質緊密相關,所以,版權人對原作進行充分開發的可能性很小。由版權人享有原作的全部價值,不利于調動后續使用者的創造積極性,將對作品的后續開發產生負面影響。所以,如果對作品的再次開發創造了新的市場領域,那么該使用行為可被視為合理使用,這有利于對作品進行全方位利用。TDM是重組信息和發掘知識的過程[9]。圖書館借助TDM開發的圖書檢索軟件中,輸出的內容少量使用原作的獨創性表達,其目的在于方便讀者檢索,而非提供原作全部內容以供讀者觀看,這不會沖擊圖書銷售市場,圖書館轉換了使用目的,構成了目的轉換性使用。當然,如果輸出內容包括原作大量獨創性表達,那么將沖擊原作市場利益,如果不屬于侵權豁免情形,則構成侵權。轉換性使用是美國法院造法的產物[10],我國在對文本數據挖掘進行法律規制時,可借鑒其立法經驗,以促進圖書館文本數據挖掘事業的發展。

(2)非作品性使用。這類使用是指對采集的文本數據進行深度分析,以得出結論或預測趨勢,這彰顯了TDM在科研領域的重要價值[11]。例如,圖書館通過TDM分析讀者平均借閱期限信息,來設定圖書館借閱期限,避免讀者借閱逾期之事頻繁發生。又如,圖書館通過分析讀者的閱讀反饋和書評來判斷讀者對圖書館采購書籍的滿意度。再如,圖書館通過對大量暢銷書的內容進行TDM,來分析暢銷書寫作的風格。這類使用中,很多情況下其輸出結果源于原作,與原作有一定聯系,那么是否侵犯原作演繹性權利?演繹性權利可分為三種,即改編權、匯編權、翻譯權。對原作的演繹通常遵循原作品的主要內容,但改變其表達方式,比如將小說改編為劇本,將很多單篇詩歌匯編成詩集。演繹行為基本沿襲原作內容,但通過新形式對原作進行呈現,因此演繹權被稱為作品表達性使用的權利,演繹行為需要原作者的授權。“非作品性使用”的輸出內容不包含原作的獨創性表達,根據思想與表達二分法理論,此種利用并非復制或傳播原作品,也與演繹行為不符,所以此類行為不涉及侵權。此類行為屬于對原作品的深度信息挖掘,其挖掘依賴于圖書館的科研需求,挖掘后所形成的知識增值并未彰顯原作的獨創性表達,不會損害原作品的市場利益。比如,圖書館為了分析圖書封面設計與圖書借閱量之間的關系,使用人工智能對館藏圖書的封面和圖書借閱信息進行數據分析,生成分析報告。該分析報告并未彰顯圖書封面的獨創性表達,因此不涉及侵權。再比如,圖書館采取TDM對文獻的主題和在線瀏覽量進行統計和分析,生成研究報告。該報告分析文獻主題和在線瀏覽量之間的關系,其目的是用于館內的科學研究,報告中并未彰顯原文獻內容的獨創性表達,不會沖擊原文獻版權人的市場利益,所以不屬于侵權。綜上,圖書館TDM過程中的著作權侵權問題和判斷方法如表1所示。

2 針對采集階段的復制行為征收著作權許可費

上文已述,在TDM采集階段,復制作品信息涉嫌侵犯著作權,那么針對侵權行為是否可以向圖書館收取著作權許可費?如果可以征收許可費,這無疑有利于補償作品權利人的損失,從利益平衡角度來說,這對權利人更合理。

2.1 征收許可費的可行性

如果對使用者征收著作權許可費,將導致再創新的成本迅速攀升。如果征收許可費,面對海量的作品信息,圖書館在進行TDM之前難以完成與原作品權利人的一一授權,即便能完成授權,但面對巨額的使用成本,圖書館也難以承擔。圖書館作為公益機構,服務于社會公眾,由政府出資成立運營,如果巨額的使用成本由政府承擔,不僅極大增加了社會公共服務的成本,而且也不具有合理性,畢竟圖書館進行TDM并非基于商業目的,而且未從中獲得商業利益,其主要目的在于提高信息利用效率[12],以更好地服務社會公眾,況且TDM通過“爬蟲”程序復制作品信息,通常以高隱蔽、低成本方式實現,權利人難以追查TDM所使用的具體作品,這也不利于權利人維權和主張許可費。

從社會福利方面來說,如果采集文本數據需要支付許可費,等于圖書館有了選擇權,圖書館為了規避許可費,會對可供免費使用的作品信息進行挖掘。這會致使人工智能采集的作品信息具有選擇性,算法會出現偏差,輸入的信息越多,偏差越大,其最后輸出的效果也會大打折扣,比如生成的分析報告判斷失誤。在TDM之前,人類通過對信息進行分析來做出決策,但人類的分析與機器的分析明顯不同。人對作品的分析是閱讀、理解作品的過程,人通過分析作品既可以滿足主觀需求,即獲得新知識,也可以滿足客觀需求,即創造新知識。比如,學生閱讀書籍,在閱讀一本書后即使沒有寫作新作品,未產生知識增值,但是獲得了精神的享受,那么此次閱讀仍是有意義的,這也是讀者需要向作者支付費用的依據。但是機器的分析卻是單純執行算法的過程。目前人工智能尚不具有人類的思維和精神,因此不能認定為機器的分析實現了機器精神的享受。人工智能分析作品信息只是單純地利用原作品信息去創造新知識,即滿足客觀需求,無法滿足主觀需求。如果對TDM進行價值評價,只能評價其輸出內容,如果輸出內容違法或不具有科學性,那么該輸出內容無法被使用,不具有任何價值,此次TDM就是失敗的,這會導致社會資源的浪費。算法偏差不具有科學性,無疑會對決策造成負面影響,公眾也無法享受TDM帶來的便利。人工智能采集的作品信息量(X軸)與算法精準度(Y軸)之間的關系在圖2中有直觀展示。

表算法精準度,a線代表沒有版權許可費情形下人工智能TDM情況,b線代表存在版權許可費情形下人工智能TDM情況。a線中,算法精準度隨著采集的作品信息量的增長而快速上升,b線中,因為存在版權許可費,人工智能選擇采集無版權費的作品信息,這樣導致算法偏差,采集的作品信息量越多,算法精準度越低,雙方呈現反比例關系。

2.2 免征許可費的合理性

從以上分析可以看出,對復制行為征收許可費是不可行的,那么免收許可費是否合理?圖書館進行TDM是為了提高圖書館智能化程度和工作效率,并助力科研取得一系列突破性成果[13]。如果文本數據采集豁免侵權,圖書館可以大規模使用TDM技術,這一定程度上促進了社會進步。另外,針對文本數據采集階段的復制行為,豁免侵權雖無法律依據,但有學術理論證明其合理性,即“整體說”理論。該理論認為如果復制是一些合理使用情形的先決條件,那么此時復制可視為在先行為,合理使用可視為后行為,在先行為與后行為應作為一個統一體去對待,不應將在先行為單獨分開看待。也就是說,在未獲得權利人合法授權的情況下,如果為了后行為而實施了在先行為,該在先行為應被認定為后行為的必要組成。就TDM來說,前端的采集階段應與后端的輸出階段融為一體,若輸出階段并不侵權,則前端的采集階段也應豁免于侵權。前端行為屬于后端行為的準備階段,與后端行為緊密相關,若后端行為合法,準備階段的行為也合法,“整體說”理論為TDM構成合理使用提供了學術理論依據。

3 域外相關的法律解決措施

3.1 美國

對于TDM的版權侵權,美國沒有出臺正式的法律文件,而是在判例中認可其行為構成合理使用,以個案裁判的方式將TDM行為合法化。美國很多司法判例中確認TDM復制行為構成合理使用[14]。在這些案件中,其典型案例為“作家協會訴Google”案和“作家協會訴HathiTrust”案。在前一個案例中,Google 公司開展數字檢索服務,掃描圖書館的紙質書籍并將其數字化,通過TDM技術實現搜索與片段展示的目的,向讀者提供數字檢索服務。Google將掃描后的書籍的單個頁面分成若干部分,讀者鍵入關鍵詞后可以展示少量帶有關鍵詞的片段,這個過程中使用了TDM技術。2005年作家協會起訴Google侵權,之后雙方達成和解,但被法官否決。該案歷經初審和巡回法院審判,最終法院判決Google的行為構成合理使用,片段檢索不會對作品市場形成替代,不會實質損害版權人利益[15]。在后一個案例中,Hathitrust 是一家數字圖書館,讀者輸入關鍵詞后可對圖書館數據庫中的數字作品中實施檢索,檢索結果中會展現關鍵詞所在位置和每頁中關鍵詞出現的次數。巡回法院最終判定作為被告的HathiTrust數字圖書館采取TDM行為屬于合理使用[16]。以上案例中,法官引入轉換性使用的理論,結合四要素判定法分析TDM行為的合法性,最后判定被告TDM行為構成合理使用。美國司法界通過判例將TDM行為予以合法化,但這不適用于成文法國家。

3.2 歐盟

2016年,歐盟頒布《數字單一市場版權指令提案》,明確了基于科研目的的TDM 豁免侵權。2019年歐盟頒布了修改后的《數字單一市場版權指令》,規定了基于文本與數據挖掘目的的TDM豁免于侵權[17]。對于“基于科研目的的TDM版權例外”,歐盟設置了一些需要滿足的條件。一是采取TDM的主體須為科研機構和文化遺產機構。科研機構包含大學、研究中心等,文化遺產機構包含圖書館、博物館等。二是須以合法方式獲取作品內容,如果采取病毒入侵方式獲得內容或者獲取盜版材料,都不能豁免侵權。三是目的須基于科學研究。科學研究不僅指公益性的科學研究,研究機構承擔企業的研究項目,即商業性的研究也適用此規定。四是使用限于“復制”和“提取”。“改編”“翻譯”“匯編”是否豁免侵權,法律文件中未明確規定。五是TDM挖掘的信息須以安全方式存儲,即存儲挖掘的信息須采取技術措施,防止信息外泄,防止侵害權利人的合法權益。但是該例外規則僅適用于科研,不能適用于商業運營、公共管理機構決策等,而且TDM分析行為不能被納入《2001年版權指令》中臨時復制,而臨時復制屬于合理使用情形。所以后來設定了“基于文本與數據挖掘目的的TDM例外”條款。根據該條款規定,若權利人未禁止對相關信息進行使用,那么使用人可復制和提取通過合法渠道獲取的信息,使用人不限于科研機構,使用目的可以為商業使用,以促進信息傳播和科學文化再創新。

3.3 日本

2009年日本在版權法中加入了“為解析信息進行的復制等”著作權例外,依據此條款,使用計算機實施信息分析的行為適用該例外規則,這使得TDM行為合法化。該例外規則有以下特點: 一是適用客體廣泛,包括文本、影像、聲音等,但專用于信息解析的數據庫作品被排除;二是適用的分析方法廣泛,包括很多類數據分析方法,例如比較、分類等方法均被覆蓋;三是使用方法廣泛,包含復制和改編,即基于該作品生成的衍生作品的復制也可適用。但該例外規則也有短板,比如將用于信息解析的工具限定于計算機,這難以跟上時代發展,因為隨著技術進步,其他新的設備也可開展TDM[18],但總體來說,該規則有重要的進步意義,數據挖掘的合法化使人工智能產業得以蓬勃發展。2018 年,日本再次修訂《著作權法》,增設了“靈活的權利限制條款”[19],新條款實際上允許了高科技企業可以在未經權利人授權的情況下直接使用其作品,但不得明顯損害權利人利益,該項規定掃除了再創新的障礙,迎合了人工智能機器學習的需求。

從以上可以看出,在人工智能崛起的背景下,域外主要發達國家和地區已意識到TDM的重要性,開始不斷調整法律以促進TDM的發展。這些國家的著作權豁免規則各有差異,總體來說,有兩種立法思路:第一,在法律中設置TDM著作權例外規則;第二,在個案中判定TDM是否構成合理使用。

4 圖書館TDM行為的出路

4.1 法律層面:針對圖書館TDM設置著作權例外規則

版權困境根源于復制技術的進步,這雖降低了作品傳播的成本[20],但也帶來了侵權風險。隨著新技術的不斷發展,對作品的深度開發成為普遍趨勢,著作權由過去單一激勵作者轉變為激勵對作品的多樣性利用。人工智能的競爭力在于強大的信息分析能力[21],人工智能時代到來,TDM有廣闊的應用空間[22],很多國家對人工智能分析作品持寬容態度,將其認定為合理使用。鑒于域外國家的法律應對,設定豁免例外規則已成為必然趨勢。

我國目前《著作權法》雖沒有針對人工智能TDM設置侵權豁免條款,但2020年修改后的《著作權法》增加了針對合理使用的概括式條款,為人工智能TDM納入合理使用預留了空間。為推動人工智能產業的發展,我國可參照域外國家的法律,為TDM設定豁免規則以指導案件審判,避免法律適用的模糊性。人工智能將引領新的產業革命,文本數據也變得越來越重要,法律對文本數據的規制正從獨自占有轉向流通、深度開發轉變,所以須將利益平衡納入制度設計中[23],因此對人工智能TDM設置專門的侵權豁免規制很有必要,況且圖書館使用TDM并非基于商業目的,而是為了提高對信息的智能化管理,為社會公共利益所考慮,因此更有必要。但需要指出的是,豁免只適用于采集階段,主要是對復制的豁免,對輸出內容的侵權不能構成豁免,正如上文所述,如果圖書館使用TDM后的輸出內容包含大量原作的獨創性表達,則難以構成合理使用,屬于侵權。另外,針對圖書館進行TDM,有必要設立數據保護制度,法律可規定圖書館須采取技術保護措施防止TDM過程中作品信息被外泄,否則可能侵權,因為作品信息被外泄可能導致權利人作品在網絡快速傳播開來,這無疑損害了權利人的著作權。

4.2 經濟層面:針對作品版權人建立補償機制

圖書館TDM牽涉三方利益。一是圖書館TDM豁免侵權,二是版權人作品被使用應獲得一定收入,三是讀者可獲得技術進步所創造的紅利。上文已論述針對圖書館TDM不應征收許可費,但如果圖書館自由使用他人作品信息而無需提供任何補償,只迎合了圖書館公共服務的需求。對作品權利人來說,傳播技術增加了權利人獲得收益的渠道[24],作品在TDM中被使用,權利人理應獲得一定補償,這有利于維持三方利益平衡。權利人允許作品被TDM使用,解決了圖書館TDM要求許可的困境,作品權利人獲得一定補償,這可以激勵權利人繼續創作和出版,圖書館對權利人作品進行TDM,推動了圖書館信息管理水平的提高,進而更好地服務讀者,讀者也能從中分享科技進步帶來的紅利,這形成了一個利益共享局面[25]。

如上文所述,圖書館TDM的采集階段需要大量復制作品,而且針對“作品性使用”來說,其輸出內容中包含原作獨創性表達,一定程度上影響了原作市場利益。除此之外,圖書館作為公益性文化場所[26],有義務向殘障人士提供大量無障礙閱讀格式文本,這會沖擊原作的版權市場,從長遠看會抑制創作者的創作積極性[27]。在此情況下,圖書館可針對作品權利人建立補償機制。首先,針對作品被TDM使用的權利人,圖書館可為其提供VIP借閱服務以作為補償。某作者的作品被圖書館TDM使用,圖書館可向該作者發放VIP借閱卡,使其可以享有一系列特殊權利,比如免押金借閱、享有借閱圖書的優先權、享有更長的借期,除此之外,還可以優先參加圖書館舉辦的讀書會、行業交流會等館內活動。其次,針對作品被轉換為無障礙閱讀格式文本的權利人,政府可給予一定版權補償。2022年5月5日,《馬拉喀什條約》對我國生效,圖書館作為非營利實體,向閱讀障礙者無償提供無障礙閱讀文本的行為豁免侵權,但提供此類文本一定程度上影響原作的市場利益,而且無障礙閱讀文本尤其是有聲讀物存在被廣泛傳播的風險,所以給予原作權利人一定版權補償費是合理的。圖書館由政府授權成立,按照“誰設置、誰投入”的原則,由政府來承擔版權補償費更合理。此類版權補償費應遠低于目前市場上的著作權許可費,否則會加大政府財政負擔。如果無法找到原作品的版權人,可參考孤兒作品相關制度,圖書館向著作權行政管理部門或著作權集體管理組織等第三方機構備案使用情況,然后由政府將版權補償費提存至第三方機構,如果日后作品權利人向圖書館主張權利,則由第三方機構轉付版權補償費。

4.3 應用層面:允許圖書館對未發表的作品實行“非作品性使用”

傳統的合理使用只局限于已經發表的作品,對于未發表的作品,圖書館能否進行TDM?要解答這個問題,需要結合TDM的輸出內容來分析。對于“作品性使用”,其輸出內容包含了原作的獨創性表達,因此侵犯了權利人發表權,對于“非作品性使用”,其輸出內容不包含原作獨創性表達,因此并未侵犯發表權,原作者依然可以將作品發表。對未發表的作品進行“非作品性使用”具有重要意義,千百年來,常識和經驗是法律不斷發展的前提[28],前人撰寫但未發表的學術著作,還有其它未發表的作品具有重要的科研價值,比如未發表的旅行日記、文字手稿、繪畫作品等,這些資料有助于了解一位名人,或者揭開一段歷史事實,或者發掘重要遺址等。如果圖書館使用TDM對這些未發表的作品進行深度分析,有可能會輸出一些重要的科研結果,因為訓練數據的多寡決定了TDM輸出內容的質量[29],未發表的作品中也可能含有重要的科研信息,具有科研價值。比如,某地區存在一座已遭受嚴重破壞的古建筑,某收藏家收藏了記載該古建筑外貌特征的手稿并且對該手稿擁有版權,該收藏家并未將手稿發表,但將手稿復制件交付某圖書館收藏,該圖書館可以未經該收藏家許可使用TDM對手稿內容進行深度分析,然后將該古建筑進行圖像還原,因為手稿雖未發表,但為科學研究和文化保護而對該手稿進行TDM符合社會公共利益,此時對版權人權利進行一定限制是合理的。

5 結語

當前,TDM在圖書館中廣泛應用,這有利于提高圖書館智能管理水平。但TDM過程中,大量作品信息被復制,這涉嫌侵犯著作權,所以有必要分析著作權風險并探尋出路。TDM分為采集階段、輸出階段。采集階段涉及復制作品信息,這會侵犯復制權,在輸出階段,作品信息被處理后會產生知識增值,根據輸出內容是否包含原作獨創性表達,該知識增值可分為“作品性使用”和“非作品性使用”,對于“作品性使用”來說,如果輸出結果包含原作少量獨創性表達,則屬于合理使用,如果包含原作大量獨創性表達,又不屬于著作權例外情形,則屬于侵權。“非作品性使用”不涉及侵犯著作權。針對圖書館TDM行為,法律上可設立著作權例外規則,針對作品版權人可建立補償機制,為社會公共利益所考慮,可允許圖書館對未發表的作品進行“非作品性使用”。隨著人工智能的發展,TDM將在圖書館信息資源管理中發揮日益重要的作用,未來的研究將集中于版權補償機制的具體構建,比如版權許可費的設定,以實現版權人、圖書館、讀者三方利益平衡。

參考文獻:

吳漢東.人工智能生成作品的著作權法之問[J].中外法學,2020,32(3):653-673.

SOBEL B.Artificial intelligences fair use crisis[J].Columbia Journal of Law & the Arts,2017 (1): 45-98.

北大法寶.王莘訴北京谷翔信息技術有限公司等侵犯著作權糾紛案民事判決書[EB/OL].[2022-06-14].https://www.pkulaw.com/pfnl/a25051f3312b07f367503cea0c2c52ed2b4c49dd9d206508bdfb.html?keyword=%282011%29%E4%B8%80%E4%B8%AD%E6%B0%91%E5%88%9D%E5%AD%97%E7%AC%AC1321%E5%8F%B7#anchor-documentno.

黃匯,尹鵬旭.作品轉換性使用的規則重構及其適用邏輯[J].社會科學研究,2021(5):95-104.

羅祥.影視解說視頻合理使用的困境與出路:由首例“圖解電影”案引發的思考[J].科技與法律(中英文),2021(4):81-89.

謝琳.論著作權轉換性使用之非轉換性[J].學術研究,2017(9):61-67.

北大法寶.上海美術電影制片廠與浙江新影年代文化傳播有限公司等著作權侵權糾紛上訴案民事判決書[EB/OL].[2022-06-14]. https://www.pkulaw.com/pfnl/a25051f3312b07f3f41810a3df3b4a0da7a6b8d5169974f6bdfb.html?keyword=%282015%29%E6%B2%AA%E7%9F%A5%E6%B0%91%E7%BB%88%E5%AD%97%E7%AC%AC730%E5%8F%B7#anchor-documentno.

WordLII. American Geophysical Union, et al. v. Texaco Inc.60F. 3d913(2d Cir. 1994).[EB/OL].[2023-01-11].http://www.worldlii.org/us/cases/federal/USCA2/1995/843.html.

吳高,黃曉斌.人工智能時代文本與數據挖掘合理使用規則設計研究[J].圖書情報工作,2021,65(22):3-13.

熊琦.著作權轉換性使用的本土法釋義[J].法學家,2019(2):124-134.

趙力.文本與數據挖掘著作權合理使用的域外實踐與借鑒[J].圖書館,2022(3):63-69.

閆宇晨.我國智慧圖書館文本數據挖掘侵權風險與對策研究[J].國家圖書館學刊,2022,31(1):106-113.

賈引獅.人工智能技術發展對“發明人”角色的挑戰與應對[J]科技進步與對策,2019,36(3):98-105.

羅嬌,張曉林.支持文本與數據挖掘的著作權法律政策建議[J].中國圖書館學報,2018,44(3):21-34.

LexisNexis. Authors Gulid,Inc. v. Google, Inc.804F. 3d 202 (2nd Cir. 2015)[EB/OL].[2021-04-13].https://www.lexisnexis.com/.

LexisNexis. Authors Guild v. Hathitrust, 755F.3d.87(2nd Cir. 2014) [EB/OL].[2021-04-13].https: //www.lexisnexis.com/.

趙力.文本與數據挖掘著作權合理使用的域外實踐與借鑒[J].圖書館,2022(3):63-69.

吳高,黃曉斌.人工智能時代文本與數據挖掘合理使用規則設計研究[J].圖書情報工作,2021,65(22):3-13.

中國知識產權雜志.日本大尺度修改《著作權法》[EB/OL].[2023-01-13].http://www.ciplawyer.cn/rhbq/138657.jhtml?prid=185.

郭晶,王怡靜.美國電子書版權保護實踐及其對我國的啟示[J].科技與出版,2021(10):148-152.

王文敏,高軍.人工智能時代圖書館信息分析的著作權例外規則[J].圖書館論壇,2020,40(9):60-68.

周玲玲.歐盟文本與數據挖掘新策解析[J].圖書館建設,2017(7):19-24, 30.

陳全真.人工智能創作物的著作權歸屬:投資者對創作者的超越[J].哈爾濱工業大學學報:社會科學版,2019,21(6):26-32.

徐小奔,楊依楠.論人工智能深度學習中著作權的合理使用[J].交大法學,2019, 3(11):32-42.

王楷文.人工智能數據輸入與著作權合理使用[J].文獻與數據學報,2021(2):110-118.

袁麗華.東部地區地市級公共圖書館無障礙閱讀服務研究[J].新世紀圖書館,2021(3):91-96.

劉友華, 魏遠山.機器學習的著作權侵權問題及其解決[J].華東政法大學學報,2019,22(2):68-79.

袁建剛,王鈺.法學理論和定量分析的關系[J].燕山大學學報:哲學社會科學版,2010,11(4):80-82.

萬勇.人工智能時代著作權法合理使用制度的困境與出路[J].社會科學集刊,2021(5):93-102.

余 祥 武漢大學法學院博士研究生。 湖北武漢,430072。

聶建強 武漢大學法學院國際法研究所副所長,教授,博士生導師。 湖北武漢,430072。

(收稿日期:2023-01-03 編校:曹曉文,左靜遠)

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
基于人工智能的電力系統自動化控制
人工智能,來了
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
主站蜘蛛池模板: 婷婷六月色| 波多野结衣一区二区三区88| 婷婷亚洲天堂| 精品無碼一區在線觀看 | 国产精品hd在线播放| 免费看一级毛片波多结衣| 国产第二十一页| 久久亚洲美女精品国产精品| 99久久免费精品特色大片| 国产一级妓女av网站| 成年人视频一区二区| 中文字幕在线观看日本| 日韩欧美91| 国产在线视频福利资源站| 欧洲高清无码在线| 亚洲成在人线av品善网好看| 日韩无码白| 国产精品jizz在线观看软件| 国产1区2区在线观看| 国产三区二区| 欧美 国产 人人视频| 国产精品成人不卡在线观看| 亚洲人成网址| 国产清纯在线一区二区WWW| 亚洲视频影院| 久久婷婷五月综合97色| 91啦中文字幕| 国产欧美日韩精品第二区| 色哟哟国产精品| 日韩中文字幕免费在线观看| 欧美日韩专区| 波多野结衣中文字幕久久| 亚洲天堂免费在线视频| 日韩AV无码免费一二三区| 沈阳少妇高潮在线| 亚洲AV无码精品无码久久蜜桃| 日韩在线欧美在线| 99re精彩视频| 一本色道久久88| 国产精品林美惠子在线观看| 国产成人三级| 91丝袜乱伦| 国产亚洲精品97AA片在线播放| 亚洲日韩高清无码| 中文字幕永久在线观看| 色综合激情网| 欧美成人手机在线视频| 国产成a人片在线播放| 91福利免费视频| 最新亚洲人成无码网站欣赏网| 国产久操视频| 午夜免费小视频| 国产精品无码翘臀在线看纯欲| 成人综合在线观看| 国产99视频在线| 亚洲视频无码| 国产国语一级毛片在线视频| 2024av在线无码中文最新| 国产69精品久久久久孕妇大杂乱| 国产美女无遮挡免费视频| 国产女人爽到高潮的免费视频 | 在线国产你懂的| 成人在线观看一区| 亚洲综合18p| 一级毛片免费不卡在线| 五月天久久综合国产一区二区| 亚洲成a∧人片在线观看无码| 伊人五月丁香综合AⅤ| 亚洲高清中文字幕在线看不卡| 亚洲天堂视频网| 99在线视频网站| 精品国产自在现线看久久| 亚洲精品欧美重口| 一本色道久久88综合日韩精品| A级毛片无码久久精品免费| 国产免费久久精品99re丫丫一| 国产精品偷伦视频免费观看国产| 毛片基地美国正在播放亚洲 | 日本不卡在线播放| 91口爆吞精国产对白第三集| 99精品在线视频观看| 成人va亚洲va欧美天堂|