張豐艷 湯盛涵
成算法和大模型等技術的問世和不斷更新迭代, 計算機理解并解決問題的能力呈現指數級增長。從2010 年初深度學習的問世至今,人工智能已經走向以多模態技術、預訓練大模型為科技基礎的生成式人工智能(AIGC)時代(2.0 時代)。AIGC指通過人工智能訓練模型來生成全新的與訓練數據相似的內容,與1.0 時代只能對已有數據進行判斷和預測的分析式AI 相比,通用性和智能性更強的AIGC 在人們生活的各方面已經成為不可分割的一部分,同時也深深地嵌入音樂產業鏈的各個環節之中。音樂產業的每一次變革都與科技發展息息相關。2023 年5 月,“AI 孫燕姿”作為一位被調教出的人工智能歌手,受到了來自社會各界的廣泛關注和討論,AIGC 與音樂行業的結合仿佛向大家宣告了音樂產業另一個時代的來臨。
音樂產業可根據不同領域的發展特性分為核心層、關聯層和拓展層,在以往的相關研究中,較多將重點放在人工智能對音樂產業構架中單一層面的影響,而人工智能在音樂產業上中下游均發生著新范式的改變。在AIGC 快速沖擊現實的當下,音樂產業該以何種姿態來面對? 在音樂行業瞬息萬變的形勢之中,我們應該如何自處? 人工智能與音樂行業的結合又將導致何種問題和挑戰的出現? 這些都是亟須討論與解決的問題。
一、音樂產業中的人工智能
人工智能技術飛速發展,其對音樂產業鏈的各個環節都產生著潛移默化的影響。音樂產業的核心動力是音樂創作, 人工智能除了對音樂創作產生直接影響外,還重塑著音樂產業核心層、關聯層等領域的形態。通過研究音樂產業的上中下游,從供給端、傳播端和消費端分類總結人工智能的痕跡,可以宏觀展現人工智能對音樂行業的滲透與革新。
(一)多樣與民主:AIGC 與產業供給端
不管是今年5 月“出圈”的“AI 孫燕姿”還是歌手陳珊妮于3 月份發行且在AI 界和音樂界均引起熱烈討論的AI 音樂作品《教我如何做你的愛人》,以及4 月份國外匿名網友Ghostwriter 利用歌手Drake 和the9Weeknd 的聲音訓練AI 模型并生成歌曲《Heart on My Sleeve》的事件, 都傳遞出一個訊息:音樂產業的玩法已然更加多樣,且出現了新的音樂供給主體———虛擬歌手。而放眼國內外,除了歌手的聲音可以被人工智能復制與調教,音樂的創作者更是可以通過人工智能軟件在極短的時間內生成無數“全新”的、“不可預測”的音樂作品,這些軟件大多有著效率高、耗資少、門檻低的特點,在音樂產業供給端成就一派“民主化”的景象。
1.多樣化
“AI 孫燕姿”等代表了虛擬歌手的新興趨勢,這對音樂產業具有重要的意義。同樣,經求證,這種熱度極高的AI 翻唱背后依靠的是以歌聲轉換(Singing9Voice9Conversion,SVC)為基礎的生成式人工智能技術,通過將“現存音色”與“目標歌曲干聲”輸入訓練模型進行調教與音色轉換,最后產出現存音色的聲學作品。目前主流的音色轉換模型是“SO-VITS-SVC”, 其源于2021 年6 月出現的“VITS”開源項目。 “VITS”是韓國研究者提出的一種可以實現“文生音”的語音合成模型。作為發布于今年3 月份的改良版,“SO-VITS-SVC” 可以將原始音頻轉化成目標音色,同時也有著比“VITS”更低的應用門檻、更少的數據需求以及更快的轉化速度。AI 虛擬歌手的出現擴大了音樂創作的可能性,增加了音樂供給的多樣性,不僅可以為大眾的個人音樂興趣降低門檻,也可以通過二度創作來使音樂翻紅、增添新的生命力,甚至有著用現存音色合成數字生命,為人類心理撫慰作出貢獻的廣闊前景。
供給端的多樣化還體現在AIGC 與音樂創作結合的不可預測性上。不管是音色轉換模型,還是現有的其他生成式人工智能模型與軟件,AIGC 始終有著可解釋性較低的情況。這種類似黑箱操作的特點讓人類目前對AIGC 的信任度有所保留,但是也正是其導致了人類不可預測的音樂效果的產生。如Holly+Herndon 的專輯《PROTO》里的作品“Godmother”中經過AI 人聲訓練而變成Beatbox 的打擊樂聲一樣,這個有著奇異細節的聲響如同一個新的聲音景觀。“音色轉換模型是喜怒無常的,音質是不穩定的,它們對輸入的反應是不可預測的。”這種不可預測性提供了讓音樂創作者擺脫疲憊的音樂創作習慣的路徑,也讓多樣化和不落窠臼的音樂的出現變得更加有可能。
2.民主化
基于深度學習技術的人工智能的特點是收到的數據量越多、種類越豐富,規模就會越大,解決問題的能力也會越來越強。這種特點導致人工智能相關的軟件也百花齊放,且日漸完善。如美國音頻制作軟件iZotope 已經將AI 集成到他們的多功能混合工具Neutron<4 等產品中, 這個插件會監聽整個音頻,分析聲音之間的關系并提供自動混音,音樂創作者可以根據自己的需求進行不同方向的調整;有的AIGC 的工具則為一些工作程序提供了自動化的處理,如智能母帶處理公司LANDR 提供人工智能自動化的母帶處理,相比于外包或雇用專業母帶工程師可以大大縮減成本;甚至被稱作“創意助理”的AIVA 音樂生成模型, 用戶從12 種預設風格和作品參數中進行選擇就能免費生成一段古典樂或者交響樂作品。人工智能技術可以讓每個人都擁有自己的定制音樂工具箱,從像設置壓縮器這樣的細節到完成整個混音這樣的分散任務,AI 都可以勝任,成為普通人身邊的隨身音頻工程師,讓每個人都可以無需復雜的動手過程和學習程序便可以運用簡單的軟件獲得自己想要的作品。通過深度學習,AI 可以擅長各種技術任務,這些技術任務一直被視為工作中的重要組成部分。人工智能讓音樂產業供給端資金需求和應用門檻都變得更低的同時,又將工作效率變得更高。
(二)智能與虛擬:AIGC 與產業傳播端
人工智能對音樂產業傳播端的參與與革新首先體現在音樂信息的智能收集與分發上。一般來說,狹義的音樂信息是由一系列相互關聯且具有深遠含義的音樂符號構建而成, 它們能夠傳遞出一個完整的藝術信息;廣義的音樂信息涵蓋了如音樂媒介、音樂作品所有者以及歌迷的喜好等各種實際的數據。在收集音樂信息的過程中, 人工智能不僅可以采集如節奏、歌詞、音高等音頻特征的本體信息,也可以對音樂外在載體、用戶偏好信息等進行采集。
1.智能化
伴隨著AI 的進步,計算機變得有能力收集和提煉數字音樂平臺上的各類歌曲資訊, 例如歌曲評價、聽眾點贊次數以及用戶的喜好等。另外,音樂數據收集也包含了對音樂版權信息的自動跟蹤流程。利用區塊鏈技術和人工智能的融合,我們可以輕松地確定一首音樂作品的版權所有者,且能夠對音樂版權交易的行為以及信息的更改進行自動跟蹤。
音樂信息收集與分發的智能化將直接導致音樂流媒體平臺的智能化轉型。數字音樂流媒體平臺利用AI 算法,結合用戶的行為偏好和興趣意愿等因素,通過描繪和復制用戶的行為模式,實現了人群偏好的精確定位和歌曲的有針對性推送。例如,網易云音樂通過播放列表使用檢測及分析應用將播放列表中的每首歌曲按播放次數、跳過次數和保存次數進行細分,通過跟蹤音樂播放列表的整體情況分析音樂聽眾的年齡范圍、性別、地理區域,針對不同聽眾畫像推送針對性的音樂內容。此外,人工智能技術飛速發展的當下,智能化的數字音樂平臺正在逐步實現對傳統音樂傳播把關人的功能替代。通過數字音樂平臺的篩查和過濾機制,傳統的音樂傳播把關人得以擺脫繁瑣的數據搜集任務,這不僅減輕了他們的工作負擔,也提升了他們的專業水準和公正度,同時也防止了他們在做出決策或者處理信息時混入的個人審美偏好和自身的主觀想法。
2.虛擬化
人工智能對音樂產業傳播端的革新還體現在演出領域上。通過人工智能技術,虛擬偶像出現在了人們視野當中,并日益擴大其影響力。2021 年央視春節聯歡晚會上,中國首個虛擬歌手洛天依的亮相大幅提升了虛擬偶像的大眾認可度和接受度,《達拉崩吧》《權御天下》這些作品已經在眾多的網絡媒體上獲得了廣泛的觀看與推廣。除此之外,我們也可以看到諸如言和、樂正龍牙、征羽摩柯、墨清弦、樂正綾這樣的虛擬歌手,隨著開放AI 的發展也逐漸走進大眾視野。AIGC 發展至今,虛擬偶像領域的各方面發展都更加地成熟。2023 年,尼日利亞音樂制作人Eclipse/ Nkasi 和他的制作團隊利用ChatGPT 程序及其他人工智能工具, 僅用了三天時間和500 美元完成了一張含9 首曲目的專輯,而如果用傳統的專輯制作方式,需耗費長達3 個月的時間以及數千美元。Nkasi 團隊利用ChatGPT 自動生成歌詞和歌曲標題,音樂家自己負責修改部分歌詞以適應專輯主題, 團隊利用人工智能工具將Nkasi 錄制的人聲轉換為專輯中的“虛擬歌手”Mya/Blue 的聲音。從聲音技術操作的方面來說,虛擬偶像與虛擬歌手存在顯著區別:虛擬歌手更類似于“AI 變聲器”, 通過歌聲轉換技術(Singing/Voice/Conversion,SVC)來轉換音色;而虛擬偶像則是運用歌聲合成技術(Singing/Voice/Synthesis,SVS),通過采集大量的人類聲音樣本制作成音源庫,通過設定參數調用庫里的聲音,就可以產出人類歌唱的效果,“捏造”出新的聲音。對于處在音樂產業傳播端的演出行業來說, 虛擬偶像在IP 產業領域以及以廣告代言、周邊售賣、演唱會、直播活動為主的偶像產業領域都有著極大的發展潛力。
(三)音樂產業全鏈條融合:AIGC 與產業消費端
人工智能與音樂產業消費端的結合出現與生產端、傳播端融合的特性。隨著人工智能技術的深度應用, 音樂用戶不再像過去那樣被動地接受,而是自身都有機會成為創作者、傳播者、消費者,并基于人工智能可以一站式變現, 成為消費端的受益者。一方面,在人工智能技術驅動下音樂傳播效果得到進一步提升。在音樂文化的推廣過程中,用戶能夠借助于人機交互的方式, 充分利用自身的優勢,從而獲取和分享最新的資訊,并在這一過程中發揮出“意見領袖”的角色;另一方面,實時音樂用戶行為數據的智能化集取可有效實現對音樂內容的個性化定制生產,滿足用戶的個性化需求和建立用戶集結機制,使得用戶能夠更迅速、更直觀地了解自己的音樂文化圈子,從而有效地激發消費者的音樂需求,實現價值的轉化,推動音樂產業鏈的高效整合。
目前很多平臺上都出現了粉絲“自制”音樂的趨勢,且此類粉絲加工過的歌曲在網絡上出乎意料地受到短視頻的青睞。無論是對歌曲去除鼓、放慢或加快速度,還是添加混響等操作,都可以看出如今的消費者正變得更加大膽和積極地參與音樂消費,且消費已然成為創作的代名詞。除此之外,技術的增長也能起到推波助瀾的作用,如AIVA 和Boomy這些基于人工智能而運營的平臺, 不僅能讓用戶“在幾秒鐘內做出一首原創歌曲, 即使以前從未做過音樂”,更能直接與Spotify 進行聯動,讓使用者實現變現。像AIVA 和Boomy 這樣的工具只不過是未來發展的一個縮影,目前這些技術能夠替代人類勞動力的論調還難以立足,但是已經不可小覷。
二、顧慮與隱患
人工智能與音樂行業的結合給社會帶來了眾多驚喜,但未雨綢繆必不可少。AIGC 的蓬勃發展究竟是AIGC 為音樂產業新時代帶來的第一縷光輝,還是給音樂市場以至于國際相關行業敲響的警鐘?
(一)“AI繭房”導致音樂產業“金字塔”循環受困
創作成本更低的人工智能技術介入音樂創作,可能意味著今后給予音樂創作的資金支持更加有限,甚至造成嚴重的后果———業內大量使用“罐頭音樂”,讓更多音樂人才迫不得已離開音樂產業。產業的發展需要推陳出新,大量人才構成了金字塔厚重的底座,人才沒了,也很難出現金字塔尖的杰作。從短期來看, 靠此前沉淀下來的作品庫來訓練AI,AI 能創作出還可以聽的作品,音樂版權成本仿佛在降低;但從長期來看,人類的靈感才是成就人類文明的關鍵,音樂產業收入無法支撐最核心的創作人才的生存發展,會導致行業的創作人才流失,這是人類藝術杰作的損失。所以當法律在支持AI 發展的同時,也理應保護自然人的創作和收益,這樣才不會抑制人類的創作動力。浪潮創作人論壇的圓桌會議中,時蕭楠在“浪潮創作人論壇”的圓桌討論中認為:“知識產權的背后是對于行業的經濟邏輯的保護,要保護的是這個行業中的每個個體的創造性付出。”至于個人的創作被用作AI 訓練,是屬于合理使用范疇還是屬于侵權,各國也在討論中,美國甚至為此專門召開了聽證會。不過可以肯定的是人類的音樂領域經過漫長的沉淀和發展,目前音樂產業的語料庫還算充足,也可以憑由AI 的不可預測性來制造出短期內新鮮的音樂;但是音樂產業核心創作力的發展如果因為人工智能的便利而就此停頓,那么可以設想,音樂語料庫用盡的那一天,便是音樂產業循環崩塌的那一天———就如同被關在繭房中的人,如果再也不能呼吸到新鮮空氣,久而久之便會有窒息的風險。
(二)聲音克隆誘發版權問題與犯罪風險
AI 與音樂行業的結合還可能導致版權歸屬、倫理道德等原則性問題,誘發違法犯罪。人工智能可以通過技術十分方便地將聲音進行克隆和轉移,另作他用。如果將人聲克隆視為一種新的采樣形式,那么目前正在國際社會上出現的情況會讓人想起采樣文化根源上的不公正。幾十年來推動舞曲發展的世界聞名的采樣, 比如被采樣最多的音樂TOP10中排名第一的“Amen,Brother” 和排名第三的“Think”,這些鼓的演奏者從未因其作品的影響而獲得任何報酬⑥;而最近熱議的“AI 孫燕姿”也引發了大家對于版權歸屬和權利邊界的討論。如在5 月份的“第八屆音樂產業高端論壇”上,郭春飛律師便指出孫燕姿被侵犯的是“對聲音享有的人格權”,聲音人格權屬于民法典中規定的類似肖像權的一種保護方式; 索尼音樂娛樂全球數字業務總裁丹尼斯·科克在采訪中也表示了其對人工智能合成語音技術被大規模用于覆蓋歌曲和試圖取代藝術家的潛力而感到嚴重擔憂。不難想象,人工智能在處理人聲方面的技術也將面臨類似的侵犯人身權利的版權問題,且其問題只會隨著AIGC 對大眾的普及與技術門檻越來越低而變得日漸嚴重。
除了版權歸屬問題,聲音克隆也有誘發違法犯罪的風險: 人工智能控制聲音的能力逐漸增強,許多模擬人聲進行違法犯罪的情況需要著重關注,如電信詐騙等。目前音樂產業各方也有在行動起來,環球音樂曾多次強調生成式AI 的發展將引發的版權問題, 并在有人使用旗下藝人Drake 的聲音制作歌曲并走紅后, 第一時間要求平臺下架了歌曲;美國唱片業協會(RIAA)還聯合數十個音樂行業組織成立了新的行業聯盟“人類藝術運動”(Human6Artistry6Campaign), 監督AI 的使用和開發不侵犯到人類文化和藝術;2023 年11 月,YouTube 發布新規,要求創作者必須標注是否在視頻中使用生成式AI 工具,否則將對其進行處罰。同時,對于使用了生成式AI 工具創作的視頻,YouTube 會在平臺中添加明顯標簽以提示觀看的用戶。
總而言之,在產業界擁抱新技術并賦能內容創作的同時,我們需要加快理論和規則層面思考和回應的步伐,科學解決人工智能可能帶來的內容行業利益失衡問題,并在“AI 模型研發者”“目標音色歌手”和“被翻唱歌曲權利人”之間構建版權領域應有的智力勞動合理回報機制以及制定出臺相關嚴格的法律法規,以應對電子詐騙等違法犯罪分子層出不窮的手段。
三、滲透與接納:在人工智能與音樂產業之間
不論人工智能將帶來多么大的發展陣痛,人工智能和包括音樂產業在內的各行各業相結合是必然趨勢,只有適應潮流、擁抱時代,才能堅韌不拔,生生不息。
(一)人工智能的滲透與深度互嵌
人類趨利向好、尋求便利的本能促使著工業革命向前推動,由科技發展導致的生產力的發展也不會因為人們的恐懼和疑慮而停止。同時,我們也可以從前三次工業革命的歷史中窺見,新的技術出現確實會擠壓陳舊生產方式的生存空間,但是在生產力增加、產能過剩的情況下,人類也會不斷創造出新的職業來釋放產能。在騰訊研究院主辦的“仲夏六日談2023”嘉賓訪談中,中國社科院新聞與傳播研究所副研究員孫萍提出,在歷史脈絡當中,工作和技術之間是越來越綁定的關系,它們的深度互嵌是越來越緊密的。不同的時代有不同的技術變遷,而工作也會隨著技術的變遷出現不同的形態。如在巨型計算機的年代,很多“最早版本的軟件工程師”做的工作是拆卸安裝晶體管; 當計算機變得輕便化,就出現了打N銀<瞢_tN銂字員;等計算機能做的事情越來越多之后,就出現了office 軟件的使用者。
汽車的出現雖然淘汰了大多數馬夫, 但是也出現了職業司機; 當AIGC可以勝任音樂產業中許多人工角色的大部分工作,也相應會出現精通發布指令、調教人工智能混音、監測人工智能錄音等更需駕馭門檻,效率也更高的職業崗位。TME 企業發展高級總監王璇在采訪中表示,“如果看到效率和帶來的價值都顯著提升, 一定會有間接或者直接的商業應用場景產生。”技術對生活的滲透越來越深,并且在逐漸改變生活形態以及我們對于生活的某些想象。
(二)音樂產業的接納與積極擁抱
各大音樂平臺、唱片公司積極和人工智能技術相適應和結合,中國如今向著科技發展道路一路高歌猛進的態度也不容改變,如在今年9 月的新時代推動東北全面振興座談會上, 習近平總書記指出,要“積極培育未來產業,加快形成新質生產力,增強發展新動能”。新質生產力的提出,進一步為以科技創新推動產業創新、以產業升級構筑競爭優勢指明了方向。在國外,格萊美聲稱“音樂行業已在擔憂中接納AI 音樂”,格萊美主辦方CEO 兼總裁Harvey5Mason5Jr.曾在采訪中表示,“雖然對于AI 的未知影響有些猶豫和擔心,但我完全知道這必然會成為音樂行業、藝術圈乃至整個社會的一部分”。
不過,雖然人工智能可能會給我們帶來更驚喜的素材,人類的主觀能動性卻仍決定著生成的結果如何與他們的創作愿景相匹配。音樂人的創作需求和痛點始終是音樂科技發展的重要源頭,就像陳珊妮在發布AI 歌曲時感受到的那樣,“技術人員和產業實際工作者必須有聯結”, 不管AI 如何發展,都始終需要人類創作者去定義一個任務目標和終極的遠景。未來的音樂產業工作者需要以更高的視角和以全局的心態來觀察,如何在保持自己人類靈感和判斷力的同時,學習使用人工智能的工具為自己提供更大的便利。歷史大潮,浩浩湯湯,科技發展的齒輪不會停息,而避免被齒輪碾壓的最好方式便是擁抱潮流,接納時代。
陳積銀、賈超然《ChatGPT 技術對國家安全領域的挑戰與應對策略研究———基于傳播學的分析視角》,《青海社會科學》2023 年第3 期,第127 頁。
趙志安、胡舒雅薇《新圖景與新路徑:科技創新與融合時代的中國音樂產業———2020 第七屆音樂產業髙端論壇綜述》,《人民音樂》2021 年第2 期,第82 頁。
王鉉、雷沁穎《人工智能對中國音樂產業鏈的滲透與革新》,《現代傳播》2019 年第12 期,第131 頁。
尚影、韓超、吳克偉《基于分離對比學習的個性化語音合成》,《計算機工程與應用》2023 年第22 期,第159 頁。
曹建峰《邁向負責任AI:中國AI 治理趨勢與展望》,《上海師范大學學報(哲學社會科學版)》2023 年第4 期,第7 頁。
佟雪娜、楊倩莉《人工智能時代音樂傳播的變革與應對》,《傳媒》2021 年第17 期,第91 頁。
Yike9 Guo,Qifeng9 Liu,Jie9 Chen,Wei9 Xue,Henrik9 Jensen,Fernando9Rosas,Jeffrey9Shaw,Xing9Wu,Jiji9Zhang,Jianliang9Xu,《Pathway9 to9 Future9 Symbiotic9 Creativity》,arXiv:2209.02388[cs.AI],https://arxiv.org/abs/2209.02388,查詢時間:2023 年10 月13 日。
解學芳、賀雪玲《元宇宙視域下AI 虛擬偶像產業的技術可供性演變機理與革新路徑》,《藝術百家》2023年第1期,第49 頁。
趙大卓《如果AIGC 時代必將到來, 音樂人該做些什么? 》,載“新音樂產業觀察”公眾號,https://baijiahao.baidu.com/s?id=1776285173992179194&wfr=spider&for=pc,查詢時間:2023 年10 月11 日。
IFPI《2023年全球音樂報告》“人工智能正在定義它在音樂中的地位”,采訪參見第19 頁,查詢時間:2023 年10 月11日。
騰訊研究院《工作大變革———人工智能沖擊下的就業思考》, 載“騰訊研究院” 微信公眾號,https://mp.weixin.qq.com/s/l3fh6BENbEmxJ_canycy2g,查詢時間: 2023 年10 月11 日。
張辛欣、嚴賦憬《第一觀察|習近平總書記首次提到“新質生產力”》, 載人民網2023 年9 月12 日,http: //politics.people. com.cn/n1/2023/0912/c1001-40075615. html,查詢時間:2023 年10 月12 日。
萬翛《格萊美制定新規則,音樂行業正在接受AI? 》,載“音樂先聲” 微信公眾號,https://baijiahao.baidu.com/s?id=1769730428421780939&wfr=spider&for=pc,查詢時間:2023 年10 月11 日。
張豐艷中國傳媒大學音樂與錄音藝術學院教授
湯盛涵中國傳媒大學音樂與錄音藝術學院碩士研究生
(責任編輯張萌)