[摘要]文章認為,人工智能音樂作為人工智能生成物是否受到著作權法保護,必須對其獨創性進行分析,而人工智能依據程序與算法生成人工智能音樂,離不開用戶的情感與個性表達。有關主體判斷人工智能音樂是否具有獨創性,既要考量用戶是否與人工智能進行充分交互,表達自身的情感和個性,又要剝離其中屬于公有領域的思想部分,并對其中的旋律、和聲、節奏及歌詞等元素進行分析,從而判斷人工智能音樂是否充分體現用戶的情感和個性,達到著作權法意義上作品獨創性要求的最低限度的智力創造性。
[關鍵詞]人工智能音樂;獨創性;算法作曲
從旋律譜寫到模唱、編配和聲與配器,音樂創作往往涉及龐雜的樂理知識與繁復的樂器演奏技術,是一個呈現文化底蘊的漫長創作過程。然而目前,人工智能音樂的出現讓沒有經過專業訓練的普通人在較短時間內創作音樂成為可能。從20世紀90年代加州大學音樂學教授柯普寫出的第一個音樂智能程序“EMI”到如今的人工智能音樂生成器,人工智能音樂對傳統著作權法領域提出了嚴峻的挑戰。人工智能音樂是否構成著作權法意義上的作品,受到著作權法保護,這與作者、人工智能開發者、用戶之間權利義務與利益的平衡息息相關,亟待有關主體做出回應。
一、人工智能音樂概述
人工智能音樂受到著作權法保護的前提即人工智能音樂構成著作權法意義上的作品,而人工智能音樂是否具有獨創性直接決定其是否構成著作權法意義上的作品。基于此,文章對人工智能音樂的概念及其創作過程進行分析,探討人工智能音樂的獨創性認定。
(一)人工智能音樂定義
人工智能音樂有廣義和狹義之分。廣義的人工智能音樂指人工智能在音樂產業中的應用,包括但不限于人工智能作曲、音樂信息檢索、樂譜跟隨、智能混音等應用。狹義的人工智能音樂則指由人工智能創作的音樂。文章討論的人工智能音樂僅指狹義的人工智能音樂。
人工智能音樂的創作過程通常被稱為“算法作曲”。在人工智能音樂的創作過程中,人工智能開發者對人工智能設定算法并進行不斷的訓練,使人工智能從海量經過處理的音樂數據中推演出音樂創作的規律,再根據用戶的指令對曲風、調性、和聲等音樂元素不斷地進行迭代計算,最終生成用戶需要的音樂。
“算法作曲”之所以能夠實現,是因為音樂具有嚴密的邏輯體系,可以完成隨性的情感表達。古希臘數學家畢達哥拉斯指出:“音樂和算數是不可分割的,數字是打開整個精神世界和物質世界的鑰匙,而樂音和節奏體系既然按數字排列,就必然體現天地之和諧并與宇宙相對應。”[1]人工智能音樂將作曲與算法結合在一起,恰是印證了畢達哥拉斯的洞見。早在18世紀末,一種音樂骰子游戲盛行,據傳該骰子游戲由音樂大師莫扎特創作,是一種利用擲骰子的結果來決定音樂的寫作程序,它可以產生嚴格符合曲式結構、和聲布局和調性關系的莫扎特風格的小步舞曲和三重奏。此外,福克斯的對位法、勛伯格的十二音體系等早已成體系的作曲方法,被作為作曲規則映射到計算機算法中,有助于人工智能將音樂的程式化特征進行數字轉化,使“算法作曲”成為可能。
(二)人工智能音樂創作特點
人工智能音樂在本質上是人工智能對用于訓練的音樂樣本及其分布狀況進行建模,然后在模型中抽取新的樣本生成新的音樂。人工智能音樂的算法涵蓋范圍廣,其中較有影響力的算法主要如下。第一,語法表示。語法表示采用模式匹配來抽取被分析的具有特定風格音樂的短的音樂序列特征,并依據這些特征出現的頻率賦予相應權值,再使用擴充、轉移網絡來組織這些特征,生成在音樂風格上與被分析的音樂相近的新音樂[2]。第二,馬爾可夫鏈(Markov Chain,MC)。馬爾可夫鏈分析音樂邏輯,推測當某些音符出現時接下來的另一個音符出現的可能性,呈現一個隨機過程。1957年希勒和艾薩克森創作出世界上第一部完全由計算機生成的弦樂四重奏《伊利亞克組曲》[3],
該組曲就是由馬爾可夫鏈模型生成的。馬爾可夫鏈在分析前面音符邏輯排布的基礎上,推導出后面音符出現的可能性,這是一個純粹的數理邏輯遞推過程。依照這種算法生成的音樂既呈現統一程度較高的音樂風格,又存在較大的局限性。第三,人工神經網絡(Artificial Neural Network,ANN)。人工神經網絡是從信息處理角度出發通過模擬人的大腦對信息進行處理的一種數學模型,能夠按照不同的連接方式組成不同的網絡,并在此基礎上加上感知器和自適應線性元件等,利用反向傳播的誤差進行參數調整[4]。第四,遺傳算法(Genetic Algorithm,GA)。遺傳算法是一種使用適應性函數來演化樣本的全局優化算法,主要構造適應性函數,以此來評估及選擇系統生成的旋律[5]。換言之,遺傳算法模擬物種進化的過程,通過遺傳與突變進行反復的進化迭代,最終生成符合用戶需求的音樂。第五,遷移模型算法(Translatioinal Models)。遷移模型算法將其他種類的信息遷移為音樂信息。最常見的應用是由用戶上傳一張圖片,該算法則對這張圖片中的線條、色彩等信息進行識別,然后將相關信息轉換為相應的旋律、和聲、節奏等音樂元素,從而生成與圖片相符的音樂。
雖然人工智能音樂利用諸多算法實現創作的路徑不同,但是究其本質是人工智能從學習材料中找到音樂的規律,并利用算法根據這些規律來生成一些新的音樂。由此可見,在人工智能音樂的創作過程中,算法主要的作用是貫徹音樂背后的邏輯,為用戶提供符合樂理、創作要求的音樂,音樂的情感表達則依靠用戶給出的指令。需要注意的是,在人工智能音樂的創作過程中,若人工智能依照一些隨機數據并生成模仿,在一定程度上通過倒推、檢驗來進行篩選和修正,則難免陷入“猴子和打字機”的怪圈,使所創作的音樂難以具有一定的審美價值,更遑論構成具有獨創性的音樂。
然而在實際上,人工智能音樂并非完全由人工智能進行創作。人工智能音樂的創作過程離不開人工智能開發者的訓練,也離不開用戶發布的指令及其不斷地調試,既融入了用戶的情感色彩,也加入了用戶的獨特審美選擇,這在一定程度上使人工智能音樂具備獨創性成為可能。
二、人工智能音樂獨創性分析
在大陸法系下的著作權制度中,作者享有對作品的人身權利,因此大陸法系下的著作權制度對作品獨創性具有較為嚴格的判斷標準。德國教授烏爾里希·勒文海姆提出,作品要具備獨創性,必須包含以下特征:第一,必須有產生作品的創造性勞動;第二,體現人的智力、思想或情感的內容必須通過作品表達出來;第三,作品應體現作者的個性并打上其個性智力的烙印;第四,作品應具有一定的創作高度,它是著作權保護的下限[6]。在英美法系下的著作權制度中,作者對作品只享有財產權利,因此英美法系下的著作權制度對作品獨創性的判斷標準比大陸法系的更為寬松,然而其對作品獨創性的要求也經歷了從過去的“額頭流汗”標準到現在的“少量創造性”標準[7]。美國學者保羅·戈爾斯坦提出,對作品獨創性的認定應該依據以下標準:第一,作品由作者獨立完成而不是對其他任何作品的復制,這是區別這種特殊作品來源和歸屬的判斷標準;第二,作品必須體現作者在創作過程中所付出的最低限度的技巧、判斷、風格等勞動成果[8]。
現階段,我國著作權法對作品獨創性的認定主要包括“獨”和“創”兩個要求。作品獨創性中的“獨”指作者獨立創作,包括從無到有的創作和在他人基礎上的創作;作品獨創性中的“創”指作品應當具有最低限度的智力創造性[9]。
(一)獨立性
獨立性要求作者獨立創作作品,而非抄襲他人。然而,人工智能音樂的獨創性判斷涉及兩個問題:一是人工智能音樂是否應當被認定為由人工智能音樂軟件的用戶獨立創作?這牽涉人工智能充當什么角色或發揮什么功能等問題。二是如何確定人工智能音樂并非抄襲、剽竊的結果?這要確定人工智能音樂及其生成過程沒有侵犯在先作品的著作權。
在人工智能音樂的創作過程中,人工智能音樂是由用戶獨立創作完成,還是由用戶與人工智能共同創作完成?現階段,人工智能并未取得法律上的主體地位,顯然不能被視為著作權法意義上的創作主體。同時,人工智能的發展仍然與達特茅斯會議中所確定的強人工智能概念還有較大差距。換言之,當前,人工智能雖然在部分專業領域具有強大的功能,但是它作為一種精密的工具,并非真正具有智慧,且將在可預見的較長時間內暫時無法真正具有類人的智慧。故筆者認為,人工智能按照用戶發出的指令,經過各種調試,創作出人工智能音樂,它雖然可以彌補用戶專業性知識的缺乏,提高作曲的效率,但是歸根結底仍是根據用戶情感表達進行創作的工具。因此,在人工智能音樂的創作過程中,用戶創作符合作品獨創性中“獨”的要求,也就是用戶獨立創作的要求。
要確定人工智能音樂并非抄襲、剽竊的結果,有關主體必須判斷人工智能音樂是否侵犯在先作品的著作權。司法實踐對某音樂是否涉嫌著作權侵權通常采用“接觸加實質性相似”的判斷標準,即只有作者在創作某音樂時同時滿足接觸或可能接觸在先作品、某音樂與在先作品之間存在實質性相似,某音樂才能被認定為侵權。具體來說,在傳統的音樂創作領域中,若某音樂已經通過大眾媒體向不特定受眾進行傳播,且作者通過網絡、電視、報紙等大眾媒體有接觸或有可能接觸在先作品,那么即可推定作者在創作某音樂時接觸了在先作品。具體到人工智能音樂,一方面,人工智能在開發和訓練過程中會被喂養大量的音樂數據并形成相關訓練數據庫,且人工智能未必會像自然人一樣主動、偶然地接觸公有領域的音樂數據,故由人工智能舉證相關訓練數據庫是否存在在先作品具有一定的困難;另一方面,人工智能音樂創作取決于人工智能開發者的指令,若由人工智能開發者進行相關舉證,其有可能因自身的利益而否認人工智能訓練數據庫存在在先作品,亦有可能通過技術途徑論證創作音樂的人工智能無法接觸且沒有可能接觸在先作品,而其他主體無法越過人工智能開發者的否認找到實質性證據來證明人工智能接觸或有可能接觸在先作品。基于人工智能音樂所需要的音樂數據的廣泛性以及舉證的困難性,筆者建議,有關主體可以直接推定人工智能接觸或有可能接觸在先作品,除非人工智能開發者能夠舉證并未使用在先作品作為音樂數據喂養人工智能,人工智能也并未接觸或有可能接觸在先作品。在實質性相似方面,學界和業界一般認為若兩個音樂之間存在8小節以上的內容雷同即可被視為抄襲。然而這種觀點較為概括,且并未結合音樂的長度和內容相似程度進行具體的考量。需要注意的是,對人工智能音樂是否具有實質性相似,有關主體應當從受眾的角度做出判斷。例如,美國聯邦第二巡回上訴法院在1946年Arnstein v.Porter一案的判決中指出,判斷非法占用這一問題的合適標準,不是根據受過訓練的音樂專家對內容的評價分析,因為專家的證言缺乏證明力,只能用來幫助確定普通受眾的反應。可見,司法實踐對人工智能音樂實質性相似的判斷要結合受眾反饋、詞曲結構、和弦走向以及音樂用途等進行綜合分析。
(二)創造性
創造性要求作品體現作者獨特的個性,滿足最低限度的智力創造性。如果僅因工具過于智能就認為作品創作過程沒有創造性,無法體現作者的情感表達,這是不合理的。在人工智能音樂的創作過程中,盡管用戶只需要向人工智能給出指令即可完成音樂創作,也不能簡單地認為人工智能音樂沒有包含用戶的情感,沒有呈現個性表達。例如,在攝影作品創作中,攝影角度的選取、拍攝時機的把握等在一定程度上充分體現作者獨特的審美與智力創造。又例如,在“AI文生圖”著作權案中,北京互聯網法院認為原告通過提示詞對人物及其呈現方式等畫面元素進行設計,通過參數對畫面布局和構圖等進行設置,并不斷調整和修正,最終獲得涉案圖片,這體現原告的審美選擇和個性判斷。
然而,在人工智能音樂的創作過程中,用戶并非總是能夠符合作品獨創性中“創”的創造性要求。具體來說,用戶利用人工智能生成原創音樂與用戶利用人工智能為一段音樂編配節奏,兩者涉及的創造性顯然是不能一概而論的。因此,對人工智能音樂的創造性是否達到作品獨創性中“創”所要求的高度,有關主體要結合具體音樂元素進行分析。
三、人工智能音樂獨創性認定
結合前文所述,人工智能音樂融入了用戶的情感和個性表達,然而并非所有的人工智能音樂都能達到作品獨創性的標準。對人工智能音樂獨創性的認定,有關主體要考量用戶對人工智能是否做出足夠明確、足以表達其情感和個性的指令,并排除所生成音樂中屬于公有領域的思想及表達,分析其中的音樂元素,從而判斷人工智能音樂是否構成著作權法意義上的作品。
(一)用戶與人工智能的交互
人工智能音樂要體現用戶的情感與個性表達,用戶必須在與人工智能交互的過程中將情感與個性表達通過指令傳遞給人工智能,使人工智能根據指令創作出用戶所需要的音樂。因此,依據用戶與人工智能交互的程度不同,人工智能音樂的生成大致可以分為兩種情況進行討論。
第一,如果人工智能的頁面可交互指令過于簡單,或僅有簡單的選項,或用戶通過點擊即可“一鍵生成”,未充分賦予用戶更多表達情感和想法的空間,則用戶會被動地在有限的選項中進行選擇,難以在人工智能音樂的創作過程中體現自身情感,更無法通過人工智能音樂表達情感。換言之,用戶僅在有限的排列組合選擇中表達獨特情感與創作想法,這只能是一種“額頭流汗”的勞動,所生成的人工智能音樂也難以符合著作權法意義上的作品獨創性要求。
第二,如果人工智能為用戶提供自由表達情感和個性的空間,使用戶根據自身的需要選擇調性、節奏等元素,則更有可能生成符合著作權法意義上作品獨創性標準的人工智能音樂。具體而言,在人工智能音樂的創作過程中,如果用戶可以與人工智能進行關于音樂的較為復雜、有深度的交互,獲得更為多元化的創作可能,而非通過有限的選項進行簡單的選擇,那么可以認為用戶融入了自身的思想情感和創作意圖。例如,在人工智能音樂的創作過程中,如果用戶要想創作奇幻、悠遠、充滿希望的音樂,就可以通過人工智能對節奏、和弦走向、歌詞風格等各種參數進行設置,并不斷地進行調整和修改,以創作生成符合自身需求的多利亞調式音樂。在這一過程中,人工智能音樂無疑體現了用戶的情感和個性選擇,而人工智能更像是一個輔助用戶進行音樂創作和表達情感的工具。
(二)公有領域的保留
著作權法保護的是音樂的表達,而非音樂的思想。要對人工智能音樂的獨創性進行認定,有關主體必須對人工智能音樂構成元素的組織編排進行分析,剔除其中公有領域的思想部分。常見的音樂公有領域涉及作曲理論、范式以及已經超過著作權保護期限的作品等。
音樂創作需要依據樂理,通常會遵循一定的范式,而這些理論和創作范式即為音樂的思想部分,在進行音樂的獨創性認定時需要被剝離。早在11世紀,圭多達萊佐在《辯及微茫》中創造出最早的音高模型,即六聲音階體系。到15世紀,一種規律性的“節奏模式”在音樂中得到廣泛運用。從文藝復興到巴洛克時期,旋律的對位開始程式化。隨著復調技術的不斷發展和成熟,音樂向高度邏輯化的方向發展[10]。這些音樂中已成體系的創作原則、作曲范式、常用的和弦走向等均屬于思想部分。此外,古典音樂、民族音樂中已超過著作權法保護期的音樂素材也屬于公有領域的表達。也就是說,作者在進行音樂創作中使用這些表達并不構成侵權,且有關主體在判斷音樂獨創性時應當剔除這些表達。例如,S.H.E的《不想長大》因與莫扎特的《G小調第四十號交響曲》相似而廣受詬病,然而《G小調第四十號交響曲》已經超過著作權保護期并進入公有領域,故《不想長大》并未侵權。
具體到人工智能音樂,有關主體在判斷人工智能音樂是否具有獨創性時,要對人工智能音樂中公有領域的思想部分進行剔除。需要注意的是,在人工智能音樂的創作過程中,人工智能被投喂大量來自公有領域的音樂數據。例如,經典的和弦走向“F-G-Em-Am-Dm-G-C”由于悅耳動聽,被廣泛運用于流行歌曲創作,在人工智能音樂的創作過程中,用戶可以通過調試使人工智能生成海量的該和弦走向的音樂。又例如,人工智能被投喂某一音樂家的大量音樂數據,用戶可以通過人工智能生成模仿該音樂家的音樂,形成與該音樂家作曲風格類似的音樂。然而,人工智能音樂不能因風格與作曲相似就被認為只是簡單的復制和模仿而非獨立創作。具體來說,在人工智能音樂的創作過程中,人工智能普遍遵循或使用的范式屬于公有領域思想部分,而基于這些范式創作出來的內容雖存在一定的相似性,但也不應被認為人工智能音樂與在先作品存在實質性相似。
(三)人工智能音樂獨創性的認定元素
音樂創作需要對旋律、和弦走向、節奏、歌詞等元素進行編排。音樂可能包含一個或多個音樂元素,這些音樂元素對音樂的獨創性認定至關重要。基于此,筆者認為,人工智能音樂是否將用戶的情感與個性表達出來,達到“創”所要求的最低限度的智力創造性,有關主體要針對人工智能音樂的各個音樂元素進行分析。
第一,旋律是音樂中最顯著的元素,它由一定的音符、音符時值和音符順序組合而成。根據《美國傳統詞典》,旋律指“一種令人愉快的樂音組合或序列”,或者“將相互關聯的每一個單獨的音符按照一定的節奏組合在一起,使它們能夠表達一種特定的意境或思想”[11]。由此可見,旋律一般指音符的橫向排列。然而,雖然音符可以排列組合構成多個序列,但由于樂理等因素的限制,實際存在的能夠形成悅耳序列并構成旋律的音符組合是有一定局限性的。有關主體對音樂獨創性的認定通常聚焦于旋律,因為旋律比和聲、節奏等元素更易凸顯獨創性,是音樂獨創性的主要來源。人工智能音樂的旋律雖然并非由用戶直接譜寫,卻是人工智能根據用戶的指令而生成的,并經過用戶選擇或調試,故而人工智能音樂的旋律表達了用戶自身的情感,體現了用戶個性的選擇。需要指出的是,在同一和聲走向的音樂中,其旋律往往讓人聽起來較為相似,給人以類似的感受,但不應認為該旋律不具有獨創性。換言之,若人工智能音樂的旋律能夠區別于其他音樂,體現用戶獨特的情感和個性選擇,則應當被認定具有獨創性。
第二,和聲一般指音符的縱向排列。根據《美國傳統詞典》,和聲指“和弦的結構、進程和相互關系”[11]。由此可見,和聲包括和弦與和聲進程。如果將旋律比作音樂的骨干,那么和聲就是音樂的血肉,使旋律表達更加豐滿。在音樂創作過程中,旋律與和聲的先后并沒有絕對的規定,而取決于作者的創作習慣,但一般認為和聲是由旋律決定的,和聲是旋律的底層邏輯,先產生旋律,再編配和聲。在大多數音樂作品中,由于旋律的重要依附性,和聲在一定程度上被認為缺乏獨創性,然而在某些情況下,同樣的旋律盡管僅有有限的和弦排列,不同的作者也仍然會根據自身的情感編配和選擇不同的和聲。也就是說,每種對和弦的不同構造和處理,都體現作者獨特的個性選擇,如大三和弦較為明亮,小三和弦更為柔和,這些不同的和聲使音樂產生豐富的變化。因此,雖然單純的和聲作為音樂的構成元素并不存在所謂獨創性的問題,但是在某些情況下和聲的編排也體現獨創性。有關主體對人工智能音樂獨創性的認定,要在一定程度上聚焦用戶的情感是否通過對和弦的選擇來進行充分表達。
第三,節奏指不同長度和強度的音符序列組成的常規模式,即音的長短與強弱。在音樂中,節奏與旋律相輔相成,如流行音樂具有穩定的節奏,古典音樂的節奏則相對富于變化。此外,也有只有節奏而沒有旋律的音樂,如鼓的表演體現作者的情感表達,是對節奏進行創意性的編排。可以說,在某些特定情況下,節奏本身也可能具有獨創性。在人工智能音樂的創作過程中,若用戶使用人工智能創作一段只有節奏的音樂,該音樂不應被一概認定為不具有獨創性,也就是有關主體要考察該音樂是否體現了用戶的情感和個性,并區別于其他一般的節奏編排。
第四,歌詞通過文字的內涵、文字與音樂的融合來表達思想情感。歌詞并非音樂必備的元素,配有歌詞的音樂則由樂曲部分和歌詞部分共同組成,且這兩個部分一般可以分離。從這種意義上說,歌詞可以被視作相對獨立的作品。然而,在某些情況下,詞曲的創作渾然一體,不可分割,共同構成完整的音樂。因此,對人工智能音樂中歌詞獨創性的判斷,有關主體可以參照作品的獨創性進行認定。
四、結語
面對生成式人工智能發展的浪潮,有關主體應當給予積極的回應,以更好地平衡作者、人工智能開發者與用戶之間的利益。人工智能音樂包含旋律、和聲等諸多元素,相比人工智能生成的文字、繪畫,人工智能音樂獨創性的認定更為復雜。對人工智能音樂獨創性進行認定時,有關主體要考量用戶的情感與個性是否充分地與人工智能交互,并將人工智能音樂中屬于公有領域的思想及表達排除在外,分析旋律、和聲、節奏、歌詞等元素,從而判斷人工智能音樂是否充分體現用戶的情感和個性,達到著作權法意義上作品獨創性所要求的最低限度的智力創造性,最終助力人工智能音樂的發展和繁榮。
[參考文獻]
[1]格勞特,帕利斯卡.西方音樂史[M].6版.余志剛,譯.北京:人民音樂出版社,2010.
[2]鄭銀環,王嘉珺,郭威,等.基于特征旋律挖掘的二階馬爾可夫鏈在算法作曲中的研究與應用[J].計算機應用研究,2018(03):849-853.
[3]TANG L.Illiac Suite for String Quartet[EB/OL].(2014-02-17)[2024-10-15].https://lydiaswada.wordpress.com/2014/02/17/illiac-suite-for-string-quartet/.
[4]韓力群.人工神經網絡教程[M].北京:北京郵電大學出版社,2006.
[5]馮寅,周昌樂.算法作曲的研究進展[J].軟件學報,2006(02):209-215.
[6]吳漢東,曹新明,王毅,等.西方諸國著作權制度研究[M].北京:中國政法大學出版社,1998.
[7]王國柱.鄰接權客體判斷標準論[J].法律科學(西北政法大學學報),2018(05):163-172.
[8]戈爾斯坦.國際版權原則、法律與慣例[M].王文娟,譯.北京:中國勞動社會保障出版社,2003.
[9]王遷.知識產權法教程[M].7版.北京:中國人民大學出版社,2021.
[10]劉灝.人工智能與計算機作曲:前提、技術與問題[J].音樂藝術(上海音樂學院學報),2019(04):137-144.
[11]SOUKHANOV A H.The American Heritage Dictionary of the English Language[M].Boston: Houghton Mifflin Company,1992.