999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于支持向量機(jī)(SVM)的音樂情感分類

2017-04-14 13:11:49陳維華
軟件工程 2016年12期

摘 要:如今數(shù)字化信息對(duì)人們的生活產(chǎn)生了巨大的影響,對(duì)于愛好音樂的人們來說大量的歌曲信息如果進(jìn)行有效的分類,如何對(duì)這些音樂進(jìn)行分類,從而進(jìn)行有效的信息檢索是信息處理領(lǐng)域的研究熱點(diǎn)。通過對(duì)音樂的樂理知識(shí)的深入分析,能夠有效的提取出反應(yīng)音樂情感的特征向量,運(yùn)用支持向量機(jī)(SVM)實(shí)現(xiàn)了對(duì)音樂的情感分類。實(shí)驗(yàn)結(jié)果表明,所運(yùn)用的分類方法準(zhǔn)確有效。

關(guān)鍵詞:支持向量機(jī);MIDI文件;音樂情感分類

中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A

1 引言(Introduction)

音樂作為大眾娛樂主要方式之一,不僅為大眾提供美妙的聽覺享受,同時(shí)其本身也具有豐富的情感內(nèi)涵,具有很強(qiáng)的情感調(diào)節(jié)功能,滿足聽眾的情感需求。目前很多大型音樂網(wǎng)站都需要高效的檢索和推薦功能,而音樂情感則是音樂檢索與推薦工作的重要依據(jù)之一。目前音樂的感情多數(shù)是根據(jù)聽眾或者專家對(duì)于音樂的評(píng)價(jià)作為感情標(biāo)簽,其工作量相當(dāng)大,而且不同認(rèn)知水平的人對(duì)于同一段音樂有不同的評(píng)價(jià)。隨著計(jì)算機(jī)與人工智能技術(shù)的發(fā)展,音樂感情的自動(dòng)識(shí)別成為國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)問題之一。

現(xiàn)有的音樂情感研究模型,可分為基于文本關(guān)鍵詞模型和基于音頻參數(shù)模型兩種。David Torres等人[1]根據(jù)樂曲的歌詞信息,識(shí)別樂曲的情感類型。Yuan-Yuan shi等人[2]通過構(gòu)建一個(gè)調(diào)制頻譜分析系統(tǒng),從壓縮的音樂文件中提取節(jié)奏信息,通過分析音樂節(jié)奏的變化實(shí)現(xiàn)對(duì)音樂感情的分類。M.wang等人[3]通過提取音樂的頻譜信息,利用支持向量機(jī)實(shí)現(xiàn)對(duì)于音樂情感的分類。Cyril Laurier和Perfeto Herrera等人利用音樂波形文件的頻譜特征,利用支持向量機(jī)實(shí)現(xiàn)音樂的情感分類。

本文從樂譜創(chuàng)作的角度出發(fā),以音樂網(wǎng)站音樂推薦系統(tǒng)對(duì)于音樂情感需求為背景,提出通過對(duì)音樂的MIDI文件解析得到音樂的感情特征組成六維感情特征向量,利用支持向量機(jī)(SVM)實(shí)現(xiàn)對(duì)音樂表達(dá)的情感進(jìn)行具體分類。

2 Thayer情感模型(Thayer emotion model)

目前,對(duì)于音樂情感分類所采用的模型主要包括Thayer情感模型、威廉.馮特情感模型、Hevner情感模型、Russell情感模型和Plutchik情感模型等,其中Thayer情感模型是二維情感模型[4]縱坐標(biāo)表示的是能量維度,從“平靜的”到“活力的”變化,反映的是主體的情感活躍程度,橫坐標(biāo)表示的是壓力維度,從“消極”到“積極”的變化,反映了主體的主觀感受,從而將音樂情感劃分為具有代表性的四類:興奮的、憤怒的、悲傷的和放松的。如圖1所示為Thayer情感模型采用的能量維度和壓力維度與樂理理論所對(duì)應(yīng)的情感表達(dá)方式具有較好的對(duì)應(yīng)關(guān)系,因此本文將采用Thayer情感模型,利用支持向量機(jī)將樂曲的表達(dá)情感分為四類。

MIDI文件是音樂文件的一種存儲(chǔ)形式,它以字節(jié)的形式對(duì)樂曲進(jìn)行描述,使用數(shù)字編碼描述樂譜的基本特征[4]。多數(shù)MIDI文件都是多音軌文件,其中的主旋律和伴奏旋律都分布在不同的音軌上,通常將主旋律所在的音軌稱之為主音軌,其包含了音樂的主要情感信息。因此通過分析主音軌的情感就可以識(shí)別出該段音樂所表達(dá)的感情。目前比較成熟的主旋律提取方法是根據(jù)信息熵理論定義音軌特征的熵值,然后由MIDI文件的音軌信息熵和其他重要特征組成特征向量構(gòu)建隨機(jī)森林分類器,進(jìn)而提取MIDI文件的主旋律。實(shí)驗(yàn)證明,該方法的正確率達(dá)到93%以上。

音樂是音符的有機(jī)組合,其不同的組合形式不同的旋律,表達(dá)不同的情感。每個(gè)音符都有自身的音高、音長(zhǎng)和音強(qiáng)等信息,但每首音樂并不是由單個(gè)的音符所表達(dá),而是通過不同的音符之間的組合表達(dá)旋律,抒發(fā)感情。因此音樂的旋律、節(jié)奏也是感情表達(dá)的重要方面。因此,本文通過對(duì)MIDI文件的解析,可以得到的基本數(shù)據(jù)信息包括音高、音長(zhǎng)、音強(qiáng)和節(jié)拍等信息,本文分別定義為、、和。

音樂是由不同的音符組合在一起,其組合規(guī)律形成自身的特點(diǎn),表達(dá)著各種感情。包括音程、旋律、節(jié)奏等高層次的音樂特征。因此本文定義如下表達(dá)音樂情感的向量空間。

音高:音高是音樂的基本要素之一,其高低及其變化是音樂內(nèi)容和感情的表達(dá)的重要方式。本文分別定義音高均值和音高方差表示樂曲的音高水平和音高變化:

音高均值定義為:

(1)

其中,n表示樂段音符的個(gè)數(shù),表示音符的音高。

音高變化定義為:

(2)

音強(qiáng):音樂的強(qiáng)度是音樂表達(dá)感情的重要方式之一。通過音強(qiáng)的變化可以進(jìn)一步加強(qiáng)和豐富音樂的情感。本文用音強(qiáng)均值和音強(qiáng)方差來衡量音樂的音強(qiáng)及音強(qiáng)變化:

音強(qiáng)均值定義為:

(3)

音強(qiáng)變化定義為:

(4)

旋律:旋律是由連續(xù)音符以特定的順序組織起來形成的,它是音樂情感重要的表現(xiàn)手段之一,反映了音樂的走向信息。通常包括時(shí)間信息和走向信息。因此本文用根音的時(shí)值作為時(shí)間信息,前后的音高的差值作為走向信息,定義如下:

(5)

節(jié)奏:節(jié)奏是音樂中規(guī)律性出現(xiàn)的強(qiáng)弱和長(zhǎng)短的現(xiàn)象,是音樂情感的重要表現(xiàn)手段。本文用緊張性和穩(wěn)定性兩個(gè)特征來表征音樂的節(jié)奏,具體定義如下:

(6)

(7)

因此,對(duì)于任何一段樂曲,都可以找到一個(gè)7維的向量表示其感情特征。

4 支持向量機(jī)理論(Support vector machine theory)

支持向量機(jī)是統(tǒng)計(jì)學(xué)習(xí)理論發(fā)展的產(chǎn)物,針對(duì)有限樣本情況,建立了一套完整、規(guī)范的基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)理論和方法,大大減少了算法設(shè)計(jì)的隨意性,被廣泛的應(yīng)用于模式識(shí)別、函數(shù)逼近、概率密度估計(jì)、降維等領(lǐng)域。

4.1 線性支持向量機(jī)

4.1.1 兩類線性可分的情況

設(shè)訓(xùn)練樣本輸入為,=1,,;,對(duì)應(yīng)的輸出為,其中+1和-1則代表兩分類的類別標(biāo)識(shí),則存在分類的超平面,其方程可表達(dá)為。為保證所有樣本能夠分類正確且存在分類間隔,須滿足如下約束條件:

(8)

在約束條件(1)下,最小化函數(shù)為:

(9)

采用拉格朗日(Lagrange)乘數(shù)法求解該具有線性約束的二次規(guī)劃問題。引入(Lagrange)乘子,得到對(duì)偶的最優(yōu)化問題

(10)

如果為最優(yōu)解,那么

(11)

根據(jù)庫恩-塔克(Karush-Kuhn-Tucher,KKT)條件可知,當(dāng)Lagrange乘子與約束條件的乘積等于0時(shí),在最優(yōu)點(diǎn),即

(12)

對(duì)于多數(shù)樣本的值為0,不為0的則對(duì)應(yīng)于支持向量,相應(yīng)的學(xué)習(xí)方法稱為支持向量機(jī)(SVM)。

最優(yōu)化分類函數(shù)為

(13)

其泛化能力最強(qiáng),為符號(hào)函數(shù),則為支持向量個(gè)數(shù)。

4.1.2 兩類線性不可分的情況

引入一個(gè)松弛項(xiàng),表示樣本距支持平面的偏差。則廣義最優(yōu)化分類面可表示成如下優(yōu)化問題:

(14)

為懲罰函數(shù),表示對(duì)錯(cuò)誤分類樣本的懲罰程度,與線性可分情況相似,可求得的最優(yōu)化問題為

(15)

最優(yōu)分類函數(shù)為

(16)

4.2 非線性支持向量機(jī)

對(duì)于非線性分類超平面,支持向量機(jī)(SVM)的核心思想是:通過非線性變化將輸入空間中的樣本變換到一個(gè)高維特征空間中,進(jìn)而在新的空間中求得最佳線性分類面進(jìn)行分類。而這種非線性變換是通過定義適當(dāng)?shù)膬?nèi)積函數(shù)——核函數(shù)(Kernel Function)實(shí)現(xiàn)的。

假設(shè)有非線性映射:將輸入空間的樣本映射到高維特征空間中,當(dāng)在特征空間中構(gòu)造最優(yōu)超平面時(shí),訓(xùn)練算法僅使用特征空間中的點(diǎn)積,即。所以若能找到一個(gè)函數(shù),使,則在高維空間中不需要知道變換的形式,只需進(jìn)行相應(yīng)的內(nèi)積運(yùn)算即可。

由Mercer理論可知,令為內(nèi)積函數(shù)的核函數(shù),則相應(yīng)的關(guān)于二次規(guī)劃問題變?yōu)?/p>

5.1 M-ary分類方法

支持向量機(jī)方法的提出是針對(duì)二分類問題,將二分類拓展為多分類是一段時(shí)間內(nèi)支持向量機(jī)算法研究的重要方向之一,假設(shè)多分類問題有個(gè)類別,訓(xùn)練樣本為,其中,實(shí)現(xiàn)SVM的多分類問題主要方法有四種方法,其中M-ary多分類方法具有結(jié)構(gòu)簡(jiǎn)單,使用的分類器最少等優(yōu)點(diǎn),因此本文采用M-ary算法實(shí)現(xiàn)對(duì)音樂情感的分類。本文支持向量機(jī)(SVM)采用徑向基函數(shù)作為核函數(shù),核函數(shù),,取,。

將興奮和激動(dòng)的情感分為第一類,將憤怒和焦慮的情感分為第二類,將悲傷枯燥的情感分為第三類,放松安詳?shù)那楦蟹譃榈谒念悺R驗(yàn)椋。詫?shí)現(xiàn)本文的分類由兩個(gè)SVM分類器即可。第一個(gè)分類器,類別一、三相對(duì)應(yīng)的樣本記為+1,類別二、四相對(duì)應(yīng)的樣本記為-1;對(duì)于第二個(gè)分類器,類別一、四記為+1,類別二、三記為-1。通過標(biāo)記結(jié)果的組合(+1,+1)、(+1,-1)、(-1,+1)、(-1,-1)四類,實(shí)現(xiàn)對(duì)樣本的分類。

5.2 數(shù)據(jù)預(yù)處理

實(shí)驗(yàn)選取200首多音軌文件,包括80首港臺(tái)歌曲、120首大陸歌曲,然后由兩名專業(yè)教師和三名音樂專業(yè)的學(xué)生對(duì)每首音樂每段表達(dá)的感情進(jìn)行標(biāo)注。共制作表達(dá)不同感情的音樂段240段。然后利用方法六對(duì)200首音樂提取主音軌,生成如圖2所示的文本文件。將240段音樂文件制作成對(duì)應(yīng)的MIDI文本文件作為實(shí)驗(yàn)素材,如圖2所示。

5.3 實(shí)驗(yàn)結(jié)果與分析

實(shí)驗(yàn)選取240段音樂素材中分別表達(dá)四類情感的樂段各20段共80段作為訓(xùn)練樣本,其余的160段作為測(cè)試樣本。首先用80段訓(xùn)練樣本對(duì)支持向量機(jī)進(jìn)行訓(xùn)練,然后對(duì)支持向量機(jī)進(jìn)行學(xué)習(xí)和訓(xùn)練。實(shí)驗(yàn)采用matlab7.0進(jìn)行仿真,分類結(jié)果如表1所示。

通過仿真實(shí)驗(yàn)結(jié)果表明,該方法取得了較為理想的識(shí)別結(jié)果,出現(xiàn)誤判的原因主要是本身樂段所表達(dá)的情感不是很明確,專家給的情感類型也并不同意,因此產(chǎn)生了誤判。同時(shí)又部分實(shí)驗(yàn)樣本樂段情感明確,出現(xiàn)誤判。

6 結(jié)論(Conclusion)

樂曲的情感識(shí)別對(duì)于音樂的自動(dòng)化制作、音樂工業(yè)化應(yīng)用、音樂的檢索和推薦都具有重要意義。本文通過對(duì)于對(duì)MIDI文件的解析,提取出能夠表現(xiàn)音樂音高及變化、音強(qiáng)及變化、旋律、節(jié)奏等能夠表達(dá)音樂情感的7個(gè)向量,通過對(duì)支持向量機(jī)的訓(xùn)練,進(jìn)而實(shí)現(xiàn)了對(duì)于MIDI音樂文件的情感分類,實(shí)驗(yàn)證明了該方法的有效性,誤差可以控制在合理的范圍之內(nèi)。下步工作將主要針對(duì)復(fù)雜的音樂,尤其是具有復(fù)合性音樂情感的音樂作品,如何進(jìn)行音樂情感的分類與識(shí)別。

參考文獻(xiàn)(References)

[1] David Torres,et al.Identifying Words that are Musically Meaningful[J].University of California,San Diego.Austrian Computer Society,2009:143-152.

[2] Yuan-Yuan Shi,et al.A Temp of Feature Via Modulation Spectrum Analysis and its Application to Music Emotion Classification[C].Presented at IEEE International Conference on Multimedia and Expo(ICME 2006),Toronto,CANADA,2006:247-253.

[3] M.Wang,N.Zhang,H.Zhu.User-adaptive Music Emotion Recognition[J].New York,NY,10016-5997,United States,2004:201-209.

[4] R.Thayer.The Biopsychology of Mood and Arousal[M].Oxford University Press,1989:62-69.

[5] 趙健諭.音樂情感識(shí)別方法的研究[M].遼寧:遼寧大學(xué),2011:

22.

[6] 葛廣英.基于SVM的車型檢測(cè)和識(shí)別算法[J].計(jì)算機(jī)工程,

2007(06):11-14.

[7] 肖建華.智能模式識(shí)別方法[M].廣州:華南理工大學(xué)出版社,

1998:18-22.

作者簡(jiǎn)介:

陳維華(1978-),女,碩士,副教授.研究領(lǐng)域:計(jì)算機(jī)應(yīng)用,

信息系統(tǒng).

主站蜘蛛池模板: 人妻精品久久久无码区色视| 国产偷倩视频| 波多野结衣二区| 精品国产福利在线| 久久综合婷婷| 国产午夜福利片在线观看| 久久久久无码精品国产免费| 国产清纯在线一区二区WWW| 亚洲视频影院| 欧美日韩一区二区三区四区在线观看 | 国产精品免费p区| 色天天综合久久久久综合片| 久久中文字幕av不卡一区二区| 久久国产精品娇妻素人| 日韩国产一区二区三区无码| 日韩精品免费一线在线观看| 国产丰满成熟女性性满足视频| 日本人妻丰满熟妇区| 91年精品国产福利线观看久久 | 特级毛片免费视频| 欧美在线黄| 女人毛片a级大学毛片免费| 欧美日韩北条麻妃一区二区| 亚洲欧美成人综合| 国产精品网址你懂的| 秋霞国产在线| 国模私拍一区二区| 欧洲高清无码在线| 久草视频福利在线观看| 日韩第一页在线| 国产美女在线免费观看| 亚洲美女一区| 国产区网址| 国产精品30p| 无码精品国产dvd在线观看9久| 中文字幕在线看| 欧美专区日韩专区| 亚洲第一精品福利| 精品自窥自偷在线看| 国产福利一区二区在线观看| 国产精品亚洲一区二区三区z| 91精品视频在线播放| 亚洲天堂网视频| 狠狠做深爱婷婷综合一区| 91精品aⅴ无码中文字字幕蜜桃| 亚洲色图在线观看| 扒开粉嫩的小缝隙喷白浆视频| 亚洲欧洲自拍拍偷午夜色无码| 97se亚洲综合| 亚洲精品777| 精品国产欧美精品v| 亚洲欧美不卡中文字幕| 国产亚洲欧美日韩在线一区二区三区| 97视频在线观看免费视频| 青青热久免费精品视频6| 日韩欧美中文字幕在线韩免费| 日本一本在线视频| 又黄又湿又爽的视频| 99久久精品美女高潮喷水| 免费a在线观看播放| 午夜国产小视频| 精品乱码久久久久久久| 亚洲精品制服丝袜二区| 亚洲色图综合在线| 人妻21p大胆| 国产91丝袜在线观看| 中文字幕无码电影| 国产美女视频黄a视频全免费网站| 九色综合视频网| 色综合天天视频在线观看| 亚洲男人的天堂网| 免费在线看黄网址| 精品国产成人高清在线| 蜜臀AVWWW国产天堂| 永久免费无码成人网站| 亚洲永久色| 欧美性猛交一区二区三区| 成人免费一级片| 久久6免费视频| 亚洲国产精品一区二区高清无码久久| 欧美成人区| 国产在线97|