錢文琪,李子晉
(1.中國音樂學院,北京 100101;2.中央音樂學院,北京 100091)
近幾年來,計算機技術介入作曲領域的研究呈現出不斷加速、擴大的趨勢,眾所周知,音樂領域是極富有創造性的領域,音樂創作與計算機的結合迅速受到社會各領域廣泛關注。“算法”和“作曲”之所以可以結合形成一個新興的研究領域,兩者之間一定有邏輯關系將其聯結。追溯到很久之前,作曲本身其實就是一種嚴格的規則邏輯,從很早的簡單節奏及音高對應關系到巴洛克時期復調音樂中嚴格的邏輯對應,再到后來的十二音序列音樂,音樂中各種要素的隨機對應關系,算法始終貫穿在作曲過程之中。因此,可以將算法作曲認為是兩種不同領域的邏輯在當代的交叉碰撞。
現階段,在計算機領域,英文文獻中大部分學者更加偏向于“自動作曲”這個解釋,普遍認為算法作曲是使用算法創作音樂的技術,認為算法作曲這個術語通常用來表示無需人工干預進行的音樂創作過程。中文文獻中大部分學者更加偏向將算法作曲解釋為“計算機作曲”,在作曲的過程中,人盡可能少地干預音樂的生成,以實現計算機算法作曲的主導作用最大化。在音樂領域,中英文獻在算法作曲的釋義理解上則出現較大分歧。英文文獻中部分國外音樂家是希望形成完全自動化的作曲,但中文文獻中音樂家更加注重人在其中的干預作用,強調了人干預是必不可少的,甚至是有利于結果的最優化。
“算法作曲”就是“在算法輔助下的作曲”,算法作曲在計算機算法的支撐下,已經成為當代創作音樂的新趨勢,隨著各種算法的不斷更新完善,人們越來越依賴計算機的算法來進行音樂的創作,賦予計算機更多的權限,人們將更多的關注點逐漸移向算法。在計算機算法作曲系統中,人們擔任的角色只是規則制定者與反饋調試者。這種趨向“自動化創作”的方式雖然新穎,但是當作曲家將自己的靈感和情感輸入到計算機中,計算機是否能夠給予他們與之匹配的音樂才是至關緊要的。這種認知的差異性其實主要取決于人們對它的定位。直到現在,對“算法作曲”的理解還沒有一個統一的概念。
各領域對算法作曲認知的偏差,在很大程度上影響了算法作曲的研究內容和趨勢發展,但是僅基于個人的主觀判斷是不能夠得出結論的,而是需要通過客觀準確的數據來說話。文獻計量的方法應用領域十分廣泛,在近幾年呈現出與其他領域學科相結合的趨勢,通過這種方法可以提取到文章內容的核心要素。文獻計量法可以將文獻量、作者數、詞匯數作為研究對象對大量文獻進行量化分析,而后實現對相關研究領域的研究熱點的預測和評估。本文對國內外算法作曲發展趨勢、研究熱點進行定量考察,借助可視化文獻計量分析工具Citespace,通過發文量及詞頻分析中關鍵詞聚類、突現詞分析的方法確定算法作曲研究內容在不同發展階段的核心關鍵詞變動,以獲取其研究領域演變趨勢及熱點變化。
嚴格地說,與其它專著、研究報告等文獻相比,期刊論文更直接、客觀、嚴謹地反映了相關研究領域的研究課題和研究前沿。本文研究以中文學術期刊庫中國知網(CNKI)和美國科學信息研究所Web of science(WoS)核心合集數據庫為主要數據來源。其中,以“算法作曲”作為主題詞和關鍵詞為中國知網(CNKI)數據庫檢索式,檢索時間跨度為1955-2020年,時間切片為1,檢索文獻時間為2020年2月29日,統計結果時間為2020年3月1日,經過人工篩選,把顯然不屬于該領域的文獻剔除,并刪除重復文章。結果共檢索出相關文獻共63篇,將檢索出的論文題目、關鍵詞、作者、摘要等數據以Refworks的純文本格式導出,以備數據分析所用。
本文又以Web of science(WoS)為檢索平臺,選擇“Web of Science Core Collection”數據庫為樣本框,檢索策略設定為 TS=(Antibiotic*AND Soil),文獻類型設定為“Article”,檢索主題為“Algorithm composition”和“music”;OR 主題為“Computer Composition”和”music”;檢索時間跨度是1985-2019年,檢索時間為2020年2月29日,統計時間為2020年3月1日,經過人工篩選,對檢索結果逐條篩選,剔除不相關的非學術文章,并且刪除重復文獻,最終共得到相關有效文獻共295篇,將篩選過后的文獻保存為純文本格式導出,以備數據分析所用。
本文采用文獻計量法中的關鍵詞共現分析方法,關鍵詞共現可以分為幾個分析維度,分別為關鍵詞頻次(關鍵詞提取檢索所得論文中的高頻關鍵詞,以揭示算法作曲在不同發展階段的研究主題)、關鍵詞中心性(Betweenness Centrality)、關鍵詞聚類圖譜(可以反映聚類結構特征,表征識別聚類的性質,從特定聚類的標題、關鍵詞、摘要中抽取名詞短語,作為聚類標簽,更能清晰得出該研究領域的核心)、Time line圖譜(揭示聚類時間跨度、發展脈絡及研究進程)、Time zone圖譜(在時間層面展示關鍵詞關聯及研究領域知識演進)。
通過對中英文算法作曲相關文獻的發文量進行對比分析(如圖1)。首先看到的是明顯的發文量數量的差距,英文相關文獻發文總量大致為國內發文總量的2倍。中文相關文獻發表時間明顯晚于國外,之間相差近20年。首先,通過觀察發表論文的數量趨勢,兩者趨勢基本一致。英文相關文獻的數量分別在1995年、2005年、2015年出現高峰值,在1993年、2009年出現低峰值;而對比中文文獻,在2006年、2010年及2013年出現高峰值,在2008年、2012出現低峰值。可以得知,英文文獻幾乎每隔10年就會出現一個高峰值,而中文文獻幾乎每四年出現一個高峰值。由此可見,這種數量的發展趨勢是相同的。

圖1 國內外中英文算法作曲發文量散點對比圖
在科學研究中,關鍵詞通常可以表達一篇論文的研究核心內容,繼而可以表征出該領域的研究主題和發展動向[1]。因此,如果某一主題詞或關鍵詞在其領域文獻中出現次數較多,則可認為該關鍵詞或主題詞所表征的研究主題即為該領域的研究熱點。
聚類分析是機器學習的一個很重要的分支。聚類(Clustering),就是將相似度較高的團或簇聚成一組。聚類也是一種可視化樣式,它可以展示網絡的聚類分布概況。Citespace自動聚類的實現是依據譜聚類算法(Spectral Clustering,SC),聚類樣式中的聚類以不同顏色的節點來表示。譜聚類是從圖論中演化出來的算法,目前在聚類研究中得到了廣泛的應用,是一種新型聚類算法。其原理是基于聚類矩陣的相似性,然后利用圖分割形成聚類。
本文將所得中國知網(CNKI)文獻數據導入Citespace軟件進行關鍵詞共現分析,軟件時區選擇為1990年-2019年,時間切片(Slice length)為1,節點類型選擇“keyword”,TopN為50。經過參數篩選,關鍵詞共現圖譜中共出現關鍵詞141個,形成200條連線,密度為0.0203。此次研究中,CNKI數據的輪廓值S為0.5696,模塊值Q為0.8262,一般而言,Q的值在區間[0,1)內,Q≥0.3說明劃分出來的關鍵詞聚類是明確的[2];當S值在0.7時,聚類是高效率令人信服的,若在0.5以上,一般認為聚類是合理的,表明形成聚類的結構層次比較清晰,該方法的置信度較高且具有意義[3]。另外,筆者采用潛在語義索引算法(LSI)從施引文獻的關鍵詞(Keyword list)中提取名詞性術語對聚類進行命名。
同樣,本文將Web of science(WoS)核心合集數據庫中文獻數據導入Citespace軟件進行關鍵詞共詞分析,軟件時區選擇為1970年-2019年,時間跨度(Slice length)為1,節點類型選擇“keyword”,TopN為50。經過參數篩選,圖譜中共出現關鍵詞386個,形成836條連線,密度為0.0113。WOS數據的輪廓值S為0.7022,模塊值Q為0.6268,表明形成聚類的結構層次比較清晰。另外,筆者同樣采用相同語義索引算法(LSI)從施引文獻的關鍵詞(Keyword list)中提取名詞性術語對聚類進行命名。

圖2 中文文獻中“算法作曲”關鍵詞聚類知識圖譜

圖3 英文文獻中“算法作曲”關鍵詞聚類知識圖譜
從關鍵詞聚類視圖可以發現,中文文獻中該領域聚類分布較分散,每個聚類相關性較小;而外文文獻中該領域聚類分布密集,相關性較大。
本文將中英文算法作曲相關論文關鍵詞聚類進行對比得出表1(如下表)。中文文獻關鍵詞主要聚類分析結果有4個,分別是“人工智能”(聚類0)、“計算機音樂”(聚類1)、“適應度函數”(聚類2)、“計算機作曲”(聚類3);英文文獻關鍵詞主要聚類分析結果有5個。分別是“深度學習”(聚類0)、“教育”(聚類1)、“機器學習”(聚類2)、“算法作曲”聚類3)、“算法”(聚類4)。可見,中文文獻中算法作曲研究主要以算法為主要研究內容;而英文文獻中算法作曲研究內容涉及很多方面。

表1 中英文獻算法作曲關鍵詞聚類視圖對比表
此外,本文將文獻中算法作曲高頻中介中心性關鍵詞進行整理對照(如表2),可以看出,中文文獻中關于算法作曲的主要研究重點在于算法的研究,如“遺傳算法”、“神經網絡”、“機器學習”、“交互式遺傳算法”、“循環神經網絡”、“馬爾科夫鏈”等;而英文文獻以“evolutionary algorithm”(進化算法)為算法研究方向的主要內容,與此同時,還進行作曲本身要素的研究,如“結構”、“模型”、“作曲技法”等,另外還加入了主觀情感的影響因素研究。

表2 中英文獻算法作曲中介中心性關鍵詞匯總
關鍵詞時區視圖可以清晰地呈現算法作曲研究主要研究內容的變化以及研究前沿。在中文文獻中,前期的研究中幾乎都是算法相關的研究,如“隱馬爾科夫模型”、“遺傳算法”、“適應度函數”這些關鍵詞。在中期的研究階段,關鍵詞為“節奏”、“音樂創作”、“神經網絡”等,這表明研究重點雖沒有離開算法,但是加入了一些音樂創作相關的內容。目前,中文文獻中算法作曲的研究以“局部自動化”為研究前沿。
英文文獻中算法作曲關鍵詞時區視圖中可知前期出現“algorithm”、“music”、“composition”、“computer music”這些關鍵詞,這表明前期大部分的研究雖然是以算法為研究出發點,但主要研究內容是在音樂創作本體上。在研究中期,出現“machine learning”、“genetic algorithm”等關鍵詞,表明這個階段是以算法的研究為主。目前,英文文獻中算法作曲的研究以“emotion”、“education”、“evolutionary algorithm”為研究前沿。
通過對比中英文文獻中算法作曲關鍵詞突現視圖可以得出下表(表3),表中可以看出中文文獻中算法作曲在2005年之前的研究成果幾乎為空白,而英文文獻中在該領域已經開始有針對算法的研究,主要體現在交互遺傳算法和人工智能相關的算法研究;2005年-2010年這個階段中文文獻中算法作曲的研究內容開始集中在算法,而在此階段,英文文獻中相關研究已經開始強調計算機的輔助作用,甚至出現了計算機算法作曲應用于教育的研究;在2010年-2015年,這個階段,中文文獻中該領域從單一算法研究變為交互式編程語言的應用研究,與此同時,英文文獻中該領域已經開始了細胞自動機(CA)、生物反饋的相關算法研究來進行作曲;2015年-2019年這個階段,中文文獻中的研究沒有明顯的進展,研究內容上也沒有明顯的變化。這個階段的英文文獻中已經在算法作曲研究中加入了情感、主觀感知等影響因素的探索研究。

表3 中英文獻中算法作曲突現詞階段對比
本文通過運用文獻計量法,對比中英文算法作曲相關文獻,根據國內外算法作曲發展趨勢和研究熱點,演測其研究前沿并總結出以下結論:
(1)國內外研究進度趨勢大體相同。從發文量看,國內和國外發文量都是經過短暫的緩慢增長后出現三個明顯的峰值,且各峰值之間的年份間隔分布均勻,發展趨勢線條走勢大體相同,其原因可能在于國內外研究時代背景相同,兩者的發展始終存在密切的聯系。
(2)國內外研究熱點存差異。在算法的研究方面還處于尋找“最優解”的過程中,國內大多數研究偏重早期遺傳算法和神經網絡。且以遺傳算法為主流方向。目前,國外的多數研究側重深入研究進化算法輔助作曲,并且在找到“最優解”的情況下,加入了主觀情感因素的干擾性,這也是由于領域學科之間的教育方式的差異性,導致國內外在學科領域的融合度不同。在研究過程中,也會由于語言翻譯的問題,對于算法作曲的本身具有的邏輯性認知存在差異。
(3)國內外研究前沿趨于一致。通過時區圖譜的對比,也可以發現國內的研究前沿是局部自動化,而國外是自動作曲。局部自動化是需要人工干預的,而自動化的概念已經擴展為計算機技術代替人體力或者腦力的過程。目前,國內對于算法的探索研究不僅局限于遺傳算法,還進行了神經網絡等復雜算法的突破性實踐以及音樂風格情感方面的研究探索。
目前,算法作曲的相關算法經過多年的蛻變、演算、進化,已基本滿足該領域研究要求。與此同時,研究視角開始切換到作曲理論,即關注于作曲理論規則制定的科學性,如何讓一個音樂作品更具有可聽性。但是可以說,自動化是算法作曲發展的必然趨勢。