【摘要】:本文運用實驗語音學和線性統計的研究方法,對藏語拉薩話的連續語音情感在四種基本情感模式下的基頻、能量和時長、進行了定量的分析和比較,發現這些聲學參數存在正相關的關系,且負性情感的基頻、能量和時長都要大于正性情感,并得出了藏語拉薩話情感語音的聲學特征模式。
【關鍵詞】:藏語拉薩話;情感語音;聲學特征
一、引言
語言是人類最重要的交際工具,同時也是情感表達的主要介質。本文以藏語拉薩話為研究對象,運用線性統計的方法通過提取該語言語音情感的聲學特性,同漢語普通話一樣,藏語拉薩話也屬于有調語言[1][2]。本文主要通過考察聲音的振動頻率-基頻(F0)和音強特征-能量以及時長來研究藏語拉薩話的情感語音特征。
二、情感語音特征采集
在實驗中采用通過設置情景誘導語音的方式。本文主要考察高興、驚奇、悲傷和中性這4種不同情感下藏語拉薩話的聲學特征。錄音軟件用 Cool Edit Pro2.0,采樣率為 22050hz,單聲道,16位采樣精度。實驗選取了四位比較擅長情感表達的拉薩藏族大學生錄音,兩男兩女,年齡都在20歲左右。在語料設計中,共考慮了4類情感,分別是高興、驚奇、悲傷和中性。每種情感有 50 句語料。
三、數據分析
目前對情感語音的研究,分析的聲學指標主要集中在基頻、能量、時長、元音共振峰等方面。我們主要分析的聲學參數有以下幾個方面,并分別對各個聲學參數進行了數據統計分析。
(一)基頻參數分析
由于藏語拉薩話也是一種有聲調語言,聲調的變化可以傳達諸多信息,對話語表達有著很大的作用。而聲調特征主要通過基頻的變化模式來表現。
考慮到男女發音器官等生理上的差別,我們通過對不同情感的所有文本進行平均,對男女表達不同情感的基頻做了數據統計分析。
從表3.1和3.2可以看出,女生的基頻要明顯高于男生,女生的四種情感的平均基頻范圍是343.1Hz到539.9Hz ,男生四種情感的平均基頻范圍是144.1Hz到265.3Hz 。從生理角度來說這主要是因為女生的聲帶相比男生細而長,因此其聲音頻率要比男生高。此外,無論是男生還是女生,驚奇狀態的基頻值要高于其它情感類型,高興情感次之。
(二)能量參數分析
能量是語音的另外一個重要特征,其中蘊含有豐富的情感信息,它也會隨說話者所處情感狀態的不同而發生變化。語音的能量特征的統計信息,可作為判斷情感變化的顯著依據。
圖3.1是關于同一文本語句在不同情感狀態下的平均能量分布情況,從中可以看出,和中性情感狀態相比,悲傷的分貝值較小,即能量水平較低,而高興和驚奇的能量較高。從性別角度出發,還可以發現男女生在表達同一種情感時表現出了明顯的性別差異性,可以很好地解釋語音感知中男生聲音要比女生聲音穩重,聽起來更有力度的發聲現象。
(三)時長參數分析
語音時長的相關特征也包含了情感韻律信息。本文統計了相同文本的語句在不同情感狀態下的時間構造特征,包括各類情感發音持續時間的長短和對應的平靜發音持續時間長度的比值。其中,悲傷狀態所用時長最長,其次是高興、中性和驚奇。進而得出負性情感的時長要明顯大于正性情感。同時這種量化的結果也正好驗證了悲傷時低緩、高興時輕快的聽覺感知。
四、總結
藏語拉薩話的情感語音和基頻、能量、時長等這些聲學參數存在正相關的關系。且負性情感的基頻、能量和時長都要大于正性情感,結果呈現出明顯的性別差異性。雖然藏語拉薩話和漢語同屬漢藏語系且都具備聲調,但是與漢語普通話情感語音的語音模式相比,在表達相同的情感狀態時,藏語拉薩話的能量值和基頻值要比漢語大;語速也比漢語要快,呈現出了明顯的具有民族個性的聲學模式。
本文通過對藏語拉薩話語音情感的統計分析,總結出藏語拉薩話不同情感狀態下的基頻、能量和時長特性。運用實驗手段解釋了許多日常的語音感知現象,充分驗證了傳統語言學的相關理論問題。同時也為少數民族語言語音學的研究提供了聲學模型,進而從跨文化的視角拓展了情感認知的研究領域。
參考文獻:
[1]孔江平,藏語拉薩話聲調感知研究[J],民族語文,1995,3.
[2] 鄭玉玲,藏語方言語音量化分析,民族語文,1998,5.