
早在20世紀,人類就開始探討計算機獨立制作音樂的可能性。1956年,在列哈倫·希勒(Lejaren Hiller)的研究室里,世界上第一首完全由計算機生成的音樂作品—弦樂四重奏《伊利亞克組曲》(Illiac Suite)誕生了。1995年,阿爾佩(Alpern)研發的EMI作曲系統也是較早的一個成熟的古典音樂作曲系統,該系統主要采用拼接的方式來創作再現已故作曲家音樂風格的作品,其中有類巴赫的創意曲、器樂協奏曲和組曲,還有類莫扎特的奏鳴曲以及類肖邦的夜曲。
隨著AI相關技術的發展和普及,近年來,越來越多的企業和機構開始研究這個科技與藝術結合的奇妙領域,各式各樣的作曲算法不斷涌現,不少虛擬音樂人嶄露頭角。筆者梳理如下。2016年,Google研發的機器學習項目馬真塔(Magenta studio)通過神經學習網絡創作出一首時長90秒的鋼琴曲。同年,Sony旗下的計算機科學實驗室(Computer Science Laboratories,簡稱Sony CSL)開發了Flow Machines平臺。Flow Machines利用馬爾科夫鏈分析數據庫中現存的歌曲,提取旋律及和弦的關鍵信息,利用這些關鍵信息作為變量來學習音樂風格,讓不同風格的歌曲相互轉換、融合,并加以優化,其代表作是一首披頭士音樂風格的歌曲《爸爸的汽車》(Daddys Car)。此外,Sony CSL還開發了一個名為“DeepBach(深度巴赫)”的神經網絡,利用巴赫創作的352部作品來訓練DeepBach,最終完成2 503首贊美詩的創作。
第一個正式獲得世界地位的AI虛擬作曲家則是2016年誕生的AIVA(Artificial Intelligence Virtual Artist)。AIVA通過讀取由莫扎特、巴赫和貝多芬等名家譜寫的15 000首曲子進行學習,利用深度學習技術,搭建體現它自己對音樂理解的數學模型,運用模型創作出完全原創的曲子。作為虛擬音樂人,AIVA已通過法國和盧森堡作曲家協會(SACEM)的合法注冊,成為該協會首位非人類會員,并擁有自己的署名版權。

今年2月,美國數字研究機構Space150模仿知名說唱歌手Travis Scott的人聲和音樂風格,做出了說唱機器人Travis Bott。這是一個關于AI創造性的實驗,研發團隊采用附加神經網絡技術(Additional Neural Network),創造出“Travis Scott味”的旋律和打擊樂伴奏,再將Travis Scott的歌詞輸入“文本生成器模型(Text Generator Model)”,得到了機器自動仿照Travis風格生成的歌詞。于是,Travis Bott完成了自己的創作—Jack Park Canny Dope Man。最后,研發團隊使用基于AI的人體圖像合成技術“Deepfake”,為這首歌拍攝了MV。就樂曲效果而言,Travis Bott對Travis Scott的模仿幾乎以假亂真,完全融匯了Travis Scott作品以及人物魅力最主要的外部特征。同時,該項目也進一步驗證了人工神經網絡技術(Artificial Neural Networks)的蓬勃發展,有助于探索未來AI在音樂中的應用價值。
現代AI作曲技術背后蘊含了多種算法模型的結合運用,包含人工神經網絡、馬爾科夫鏈及遺傳算法等。如AIVA和Travis Bott就使用了一種基于人工神經網絡的深度學習技術。
人工神經網絡是一種對生物神經的網絡行為特征進行模仿,開展分布式并行信息處理的算法數學模型。程序員必須搭建一個多層“神經網絡”,在多層的結構中分別加以編程,從而處理各種輸入和輸出點之間的信息。作品數據輸入后,人工神經網絡會找到眾多被輸入作品之間存在的規律,繼而形成對音樂旋律、節奏、音高、強弱變化的理解與學習。這種學習的主要目的是用來預測,并非就此生成作品。AI程序會帶著它對以上音樂風格的預測繼續運行,并將在前方遇到下一個驗證數據集。這個數據集會判定它的預測是否正確,正確與錯誤的回饋都將被AI記住。
在不斷地高速學習中,AI的預測能力就會越來越強,最終掌握程序員大數據歸總后的曲風,進而編寫出自己的曲子。人工神經網絡為從前的算法作曲提供了一種新的方式,其優勢在于能夠對音樂作品的全局性特征進行學習,但是需采用大量的樣本進行訓練。當下國內外有許多基于該種算法所形成的AI作曲系統,如LSTM神經網絡,可以確保所創作音樂的完整性。

除了人工神經網絡,馬爾科夫鏈(Markov Chain)也一直被廣泛地應用于算法作曲領域。馬爾科夫鏈是一種隨機選擇過程,主要用于產生一段具有一定風格的旋律。就像按照一個特定的標準人為構造制定的轉換表來依次選擇音符,計算并選擇下一個要出現音符的可能性。這種方法可以模擬作曲家創作音樂時的思維,來控制計算機生成相應的音樂作品,但是整部作品的曲式結構無法通過馬爾科夫鏈建模。遺傳算法(Genetic Algorithm)則是模仿生物進化過程的智能計算方法,使用適應性函數來演化樣本、優化全局。
其中,變異算子可以模擬人在其創作當中靈感的閃現,相當于留下最具代表性的作品來產生新的旋律。該算法的壁壘在于適應性函數的設計至今尚無統一標準。
