基于內容的音樂標示與特征提取研究

2019-01-06 03:39:33朱樂

藝術科技 2019年21期

朱樂

摘要：本文針對數字音樂資源中基于音樂內容的標示形式、檢索關鍵技術、音樂特征提取算法等問題進行研究，通過比較各種音樂內容標示方法的特點和優缺點，給出音樂內容特征提取算法。

關鍵詞：數字音樂;音樂旋律;音樂輪廓;音樂節奏

0 引言

在當今網絡時代，數字化音樂已成為音樂存在的主要方式。數字音樂比傳統的磁記錄音樂等能夠更好地利用現有的大量音樂資源，來滿足人們的娛樂、教育、商業等各類需求。由于每年都有大量的音樂作品產生，如何能夠有效地利用這些音樂資源尋找到需要的信息，就成為一項十分具有現實意義的工作。傳統情況下，人們是按照音樂的標識信息來查詢需要的音樂資料。例如，當人們需要查詢一首樂曲時，必須知道音樂的名稱，或是作曲者、演奏者等相關音樂標志信息，否則就得通過瀏覽整個數據庫來查找樂曲。音樂標識的信息具有復雜性，顯然，通過音樂標識信息來尋找資源方法的效率也是很低的。目前，基于內容分析的音樂表示逐漸得到了廣泛的重視，已經被證明是非常有效的音樂分類方法，而基于音樂內容的查詢方式是有效利用音樂資源的關鍵技術。

眾所周知，音樂旋律是利用調式關系和節奏以及節拍關系組合起來的，通過具有獨立性的許多音的單聲部進行。從某種意義上講，音樂的主要特征就是旋律。旋律體現了音樂的全部思想或主要思想，它被認為是音樂的基礎和靈魂。旋律的一個簡單的定義是單調的連續的音階序列。目前的技術所考慮的旋律是簡單的，是很容易哼唱的，比如流行音樂、鄉村音樂中的旋律。一般意義上，旋律是音調和節奏的組合。有關文獻對音樂的記憶特性進行了研究，Dowling指出，旋律的輪廓比對精確的旋律更易于記憶。旋律的輪廓是指旋律音調的起伏的整體形狀，即相鄰音符的起伏。假定音樂的輪廓和音階是分開存儲在我們的大腦中的，而旋律的輪廓是主要的、印象深刻的部分。相同的旋律輪廓可以映射到不同的音階上。Edworthy在文獻中也提出了類似的觀點。

基于上述觀點，有以下幾種音樂內容的標示方法：基于節奏、基于音樂輪廓、基于音樂旋律以及綜合方法。這些方法都可以進行基于內容的查詢，各有利弊。

1 基于內容的音樂標示方法

1.1 基于音樂輪廓的標示法

眾所周知，音調高低對于旋律表示是一種很重要的信息。一般情況下，研究者利用3層（+/-/0）方法來表達音樂旋律的輪廓。符號“+”表示現有音符與前面音符相比，音調提高;符號“-”表示現有音符與他前面音符相比，音調減小;符號“0”表示現有音符與它前面音符相比，音調不變。例如，旋律422143325可用符號0-0-+-0-+表示。旋律的音調輪廓描述了相對音調的變化，但是它忽略了音樂的節奏信息，也忽略了音調的精確變化，因此旋律的音調輪廓表示方法丟失了很多重要信息。這種表示方法比較簡單，雖然能夠減少搜索空間，但搜索精度不高。在對某個大型數據庫進行檢索時，可能查找到過多的檢索結果，冗余信息量大，不利于精確得到需要的結果。為了提高檢索準確性，則需要輸入較長的標識信息，此時要求用戶對歌曲有更多的記憶長度。

1.2 基于節奏的標示法

音樂是聲音在時間上的藝術。任何聲音在時間上都具有一定的長度，節奏就是音樂的時間標示。無論是古典音樂還是通俗音樂，都通過一定的節奏來標示。利用節奏來標示音樂內容的方法，將忽略音樂音調特性。與基于音樂輪廓的內容標示方法相比，基于節奏的標示較為復雜。不同的樂曲可能具有相同的節奏，因此，利用此方法仍不能精確檢索需要的結果。同時，這個方法在音樂內容標示中忽略了音樂旋律的根本特性：音調特性。

1.3 基于主題的標示法

在一段音樂旋律中，相同的旋律主題可能反復出現，利用旋律主題的重復特性來標示音樂可以提高標示的精簡程度，減小信息存儲量和檢索時需要的數據量。由于音樂旋律的主題是復雜多樣的，從一首樂曲中自動提取出旋律主題非常困難。旋律主題的發展還有許多其他特性，例如變化、擴展、緊縮，將影響旋律主題的標示。

1.4 綜合標示法

以上3種方法從不同的方面對音樂內容進行了標示，但是反映的特性單一，在實際檢索時效果不盡理想，采用旋律綜合表示法可相應解決上述問題。

所謂旋律的綜合標示法是利用“T、P、B”來表示旋律，T表示樂曲的時間記號，它是可變的;P表示基音輪廓量，它的取值范圍依賴于輪廓等級數，例如0、-、+、-=、++;B的第一個值標示第一個音符的位置，B中的值隨著音符的變化而逐步增加。

2 音樂特征提取算法

一般情況下，可以從兩種音樂格式中提取旋律，一是聲音音樂數據，主要是指基于波形形式的WAV、MP4，另一種格式是符號音樂數據，如樂譜和MID。從復雜的多聲部波形音樂數據中自動提取各個聲部信息是很復雜的，目前還沒有很好的方法解決這個問題。在大部分情況下，數字音樂資源是對符號音樂數據即MIDI格式的音樂進行處理。MIDI文件絕大多數包含一個獨立的單聲部音軌。這些音軌有著特定的名字，如Melody、Vocal、Lead、String。MIDI的整體抽取操作是基于音軌特征來實現的。具體而言，首先要選擇含有Melody、Vocal、Lead和String的音軌作為主要音軌，如果沒有包含上述名字的音軌則將第一個音軌作為主要音軌。判斷第一個音軌的條件是滿足音符數大于某一值，從主要音軌中獲取音調序列，然后對音調序列進行處理，以獲得最終特征。

基于以上的分析，下面提出了提取音樂特征的算法，見圖1。

3 結語

本文主要研究了數字音樂資源中基于內容的音樂檢索關鍵技術、音樂內容的標示形式、基于特征的提取算法等問題，并且通過比較各種音樂內容標示方法的特點和優缺點，給出了筆者的音樂內容特征提取算法。

參考文獻：

[1] 張晶.基于Web的音樂哼唱檢索關鍵技術研究[D].西北大學，2008.

[2] 高為杰·陳丹布.曲式分析基礎教程[M].北京：高等教育出版社，2009.

[3] 孫儷.哼唱檢索中特征提取研究[D].北京郵電大學，2012.

[4] 劉亞瓊.淺析歌曲旋律與音樂形象的關系——旋律線的探索[J].中國體衛藝教育論壇，2008（08）.

藝術科技2019年21期

藝術科技的其它文章: 群眾文化活動的時代價值及其管理研究; 移動新媒體新聞標題語言編輯特征探究; 中國設計道路探索; 淺析設計中藝術與技術的關系; 在音樂教育中培養學生的家國情懷; 20世紀初城市音樂與當代音樂教育發展思路探索