數字音頻技術實驗教學改革研究

2014-03-25 09:01:08高玲

實驗技術與管理 2014年3期

高玲

(哈爾濱師范大學傳媒學院，黑龍江哈爾濱 150080)

一直以來，影視傳媒專業的學科屬性與行業的科技化發展決定著其人才培養，不但要有扎實的理論知識，還要有較強的設備操作與技術創新等實踐能力[1]。這促使作為培養影視傳媒人才基本實踐能力的數字音頻技術實驗教學，要不斷適應影視傳媒行業科技發展及人才需求的趨勢，進行教學資源上的更新優化與教學實踐上的創新發展。當前，為滿足培養高水平影視媒體人才的需求，高校紛紛對影視傳媒專業的實驗設備進行了升級、換代，建立了設備配置先進、系統完善的綜合化影視媒體實驗教學實驗中心，為提升數字音頻技術實驗教學的質量奠定了基礎[2]。但從現有數字音頻技術實驗教學現狀來看，教學硬件設施的日趨完善與教學內容創新不足的發展差異，不但影響了學生專業知識的綜合運用與創新發展，也無法滿足影視傳媒行業對創新型人才的需求。因此，結合影視傳媒行業對人才的需求特征，提出基于語音編碼下的實驗教學改革思路,對語音編碼的聽覺場景分析、韻律認知和音頻合成在數字音頻技術實驗教學中的應用進行了研究與實踐探索。

1 影視傳媒行業人才需求特征與數字音頻技術實驗教學存在的不足

1.1 影視傳媒行業人才需求特征

數字音頻技術是對數字化音頻文件進行編輯、編碼、解析等工作的統稱，是影視傳媒行業人才所要掌握的基本技能之一。隨著數字媒體技術的飛速發展，在聲音信息分析和媒體處理理論的深入以及市場對消費類聲音質量的趨高要求，使當代影視媒體行業對數字化的聲音信息處理的需求不斷提升,而這種數字化聲音信息處理過程，是以數字融合的方式將不同音效整合在一個交互式的整體信息文件中[3]。此時的音頻文件的數據量是非常大的，要實時處理和傳輸這些龐大的數據，就必須對數據信息進行編碼壓縮，但由于數字化音頻數據具有大數據量、集成性、實時性、非解釋性、非結構性等特性，在數據模型的選擇、數據庫管理、數據的編碼和數據創編等方面需要考慮許多新的特點和要求，否則就會因數據編輯的不正確，造成合成、壓縮和傳輸解壓后的音頻數據出現失真現象，影響聲音的播放效果。此外，由于當前音頻數據不同格式的標準不一(表1)，使得音頻文件在格式轉換中存在的誤差,必須由專業人員重新進行分析、識別與合成。因此，導致當前影視傳媒行業對人才的需求以必須掌握數字音頻技術為基礎。

表1 不同數字音頻格式

1.2 數字音頻技術實驗教學存在的不足

數字音頻技術實驗教學，是影視傳媒專業培養學生對音頻信號處理基本概念、基本方法和基本理論的一門基礎性核心實驗課程。課程主要包括對音頻信號的產生與感知原理、聲道模型參數的估計方法、矢量量化的原理及算法、音頻信號時域處理的手段、語音壓縮編碼的常用算法、實現手段，語音識別的發展狀況和基本原理、聲道模型的參數估計以及語音壓縮編碼的算法等內容[4]。學生通過該課程的學習，可以掌握多媒體系統結構和多媒體技術的分析與設計，了解語音信號的各種編碼方法和音頻合稱、聽覺分析的原理，提高認知語音信號的特點與編輯語音信號的操作能力，對于培養學生數字音頻技術應用的創新意識、實際解決問題的能力以及知識綜合運用能力具有非常重要的作用。

當前，高校為了提高學生數字音頻技術的實踐能力，通過完善教學儀器、建設綜合新多媒體實驗平臺和影視傳媒實驗中心等，盡可能覆蓋數字音頻編解碼標準、信道糾錯編碼、數字調制通信技術等教學實踐操作范圍，為提高學生的音頻信號處理水平、拓寬思維境界、發展創新能力，提供了良好的實驗教學環境[5-9]。但音頻信號處理實驗教學當前仍存在一些問題，主要表現為：

(1) 教學過程主要是對儀器和軟件編輯功能的學習與操作，忽視了音頻技術基礎理論在實踐中的指導作用；

(2) 教學內容大多是針對特定音頻文件的編、解碼，缺乏對音頻文件聲音調節、降噪、合成等發揮學生創新思維的編輯教學；

(3) 影視傳媒專業的實驗教學本身就是一種藝術創作過程，而教學中教師和教學管理者往往忽略了這一點，形成實驗教學機械式的重復過程，使本應具有的藝術文化內涵嚴重缺失。

這說明，實驗教學質量的提升不僅要靠硬件(儀器、設備)的現代化，還要靠軟件(教學內容)與行業的發展和需求接軌。這種僅限于硬件的提升而忽視課程教學內涵和行業需求的教學過程，是無法培養出影視傳媒行業所需的創新型人才的，因此，必須不斷地完善當前數字音頻技術實驗教學所存在的不足之處，就是要豐富課程的教學內容、提升文化內涵和發展學生的創新能力與思維，達到培養影視傳媒人才基本能力的目標。

2 數字音頻技術實驗教學改革思路

語音編碼下的數字音頻技術實驗教學改革，就是以影視傳媒行業對人才需求的基本特征和培養學生數字音頻技術應用的創新意識、實際解決問題的能力以及知識綜合運用能力為導向，以對語音編碼技術中的聽覺場景分析、韻律認知和音頻合成在實驗教學中的應用研究與實踐探索，建立以認知結構為基礎、以語音編碼為過程、以思維創新為特征的實驗教學改革思路(見圖1)。

圖1 基于語音編碼下的數字音頻技術實驗教學改革思路

學習是學習者神經系統中發生的各種過程的復合，是學習者對來自環境的信息進行內在的認知加工的過程[10]。語音編碼以聽覺場景分析、韻律認知和音頻合成的技能操作，形成基于信息創編下的對語音物理信號的識別、分析、認知、加工；通過理論結合實踐的復合學習過程，使學習者的神經中樞系統對來自外界環境的刺激形成穩定的記憶過程，使學習者在認知結構和輸入的信息之間，建立起相互聯系、相互配合的新認知結構特征。這種新結構以不斷納入新的信息對音頻進行編、解碼和文件合成，是建立在認知結構下體現個人思維創新特征的信息加工過程，是使學習者的學習層次得到逐級發展和提高、實現理論知識與技能融合的創造性實踐。

把對影視傳媒人才基礎能力的培養，融合在對語音文件的個性化創編之中，通過將不同的音頻素材組合成為高質量的語音效果，彰顯學生對數字語音技術的理解、數字媒體技術的文化內涵和系統化的具有影視媒體專業素養的智能行為。

3 語音編碼技術在數字音頻技術實驗教學中的應用

語音編碼就是對模擬的語音信號進行編碼，將模擬信號轉化成數字信號，從而降低傳輸碼率并進行數字傳輸的過程[11]。隨著數字媒體信息技術的發展，壓縮語音信號的傳輸帶寬、增加信道的傳輸速率，一直是人們追求的目標，而語音編碼在實現這一目標的過程中，通過技術上的處理和加工使語音信號的比特數目最小、音效達到最佳[12]。雖然數字音頻技術實驗教學中也包含音頻信號時域處理的手段、音頻壓縮編碼的教學內容，但在音頻降噪、分析、識別和編譯上的處理能力還不能滿足對高品質影視音效藝術的追求和影視媒體行業發展的需求，因此，將語音編碼應用于數字音頻技術實驗教學之中，就是要充分發揮語音編碼在聽覺場景分析、韻律認知和音頻合成3個方面的技術優勢。以音頻編輯的創新思維和技能操作，把對影視傳媒人才基礎能力的培養，融合在對語音文件的個性化創編之中(見圖2)。

圖2 語音數據認知思維編、解碼流程圖

3.1 聽覺場景分析

聽覺場景分析是用來分析、研究聽覺系統如何對外界刺激進行組織加工，找出能夠使聲譜成分組合到一起，或使它們分離成獨立的聽覺流或表象的聲學特征，并把不同聲音感覺元素分配到相應組別中的聲音信息加工過程[13]。它延伸了傳統聽覺理論主要從生理學角度解釋人的聽覺過程，以格式塔原則的初級分析和圖式為基礎的知覺組織應用于解答、展示人聽覺信息的加工過程和特征。在豐富聽覺組織理論的同時，使之在實踐分析中更加易于操作和實際應用。

在數字音頻技術實驗教學中，以格式塔原則為基礎的聲頻初級分析通過序列整合，幫助引導學生把具有相似特征或時間接近的音知覺從復雜的環境聲中突出出來，并按時間出現的順序納入一個知覺流，然后按低音、高音和頻率的變化關系排列成新的順序，并構成一個新的序列。此時該序列能否產生曲調則取決于音之間的頻率關系，當2組音的頻域相同時曲調將消失，但如果2組分別在2個沒有重疊的頻率范圍內，則曲調便被聽成一個獨立的流。以圖式為基礎的知覺組織，是把環境中特定的聲音信號存入記憶中形成的認知圖式，這是一個自上而下的信息加工過程，知識和注意在這一加工過程中起著重要作用。學生在學習中以有意注意對信息的選擇進行控制，其學習任務一旦要求注意，參與圖式就會出現。其圖式形成的過程就是學生獲得刺激知識的過程，同時學生也可以利用獲得的知識對刺激的變化趨勢進行預測。讓學生在理論學習→實踐刺激→技能提升→認知形成的學習中，不斷提升數字音頻技術的實踐能力。

3.2 韻律認知

韻律是自然口語的共同特征，它通過對比組合音段信息使說話者的意圖得到較好的表達和理解[10]。韻律決定了語言的自然度，對于提高語音合成的自然度和識別語音的準確性來說是至關重要的。因此，韻律認知日益受到語言學界和語言工程學界的重視。因此，在對語音流文件的分析中提高對音段信息和韻律信息的認知，有助于豐富音色，掌握語音流文件的韻律特征。

漢語韻律是復雜的，在音頻文件中語音的韻律特征主要包括重音、語調和韻律結構。這種段特征以音高對比和音長對比的形式由語勢重音配合而成，并通過信息聚焦了實施超語法的功能語義。因此，學生在對音頻文件的韻律認知中，應首先從語言的樹型關系出發，按照表達的需要，利用有聲形態有限的分解度來安排節奏重音，以多層疊的節奏單元和語勢重音、節奏重音分別調節音域的高音線和低音線；其次，把語調構造各部分的音域特征綜合在一起，通過韻律結構中的韻律詞、韻律詞組和韻律短語區分不同的語調類型，以表達人在不同語境下的不同韻律特征；第三，以對語音信號中具有語言學功能的韻律特征進行韻律標注，實現其韻律特征的定性描寫。這就要求學生在學習中要牢記漢語的語音規范，通過對音頻數據的不斷實踐提升韻律認知能力，完善數字音頻技術技能。

3.3 音頻合成

音頻合成是直接利用泛音，按照一定的諧波規律得到的音高素材直接運用的過程[14]。它主要是通過聲音的合成、還原與創新來實現對聲本體的研究，使合成聲音不再由武斷的規則、死板的結構來體現，按照聲音的本質屬性去組合聲音，把聲音的合成過程變成藝術的體驗、創作，以數字媒體技術與聲音本質的透視、解析、合成，實現科學與藝術的高度融合。

目前，雖然音頻合成編碼通常用計算機和專用合成軟件來實現，但音頻信號具有以下的特點：

(1) 音頻信號是時間的連續媒體，對時序性要求很高，如果在合成時間上有25 ms的延遲，人就會感到斷續；

(2) 人接收聲音有2個通道，計算機模擬自然聲音也應有2個通道；

(3) 語音信號不僅僅是聲音的載體，同時還攜帶了情感的意向，這決定著音頻合成編碼實際上就是一個藝術創作的過程，是建立在特定的參數模型之上對聲音的藝術描述，所以多媒體系統中的語音要包含語意等其他信息。

這些特點要求學生在學習中，首先要以自我的實踐，逐步認識并掌握如共振峰合成、LPC合成、PSOLA拼接合成、LMA聲道模型等不同音頻編碼技術在合成上的優缺點，實現在音頻合成創作中通過多種技術的有機結合，或將一種技術的優點運用到另一種技術上，克服單一技術存在的不足；其次，在音頻文件的編輯與合成過程中，需要對聲音文件進行多種特殊效果處理，如靜噪、淡入淡出、往返放音、交換聲道及聲音移位等，在這繁雜的操作中，教師應隨時指導學生，幫助學生建立正確的操作程序和技能規范，防止因不正確的操作行為導致的音頻合成失敗；第三，在音頻合成編碼中要以藝術的美感解析、選擇、組合音頻素材，以對音樂旋律、音域、音調的認知，把選擇的素材在頭腦中串聯起來，通過想象空間的構化形成獨具個性的音樂創意，讓學生的聲音創造力不僅體現在對現代音頻合成設備的操作技能與應用能力上，更以不斷完善對聲音藝術的認知實現藝術的文化修養與聲音藝術的文化表達。

4 結束語

影視傳媒行業人才必須掌握數字音頻技術的需求特征，因此對影視傳媒專業實驗教學提出了更高的要求，其數字音頻技術實驗環節必須要更加重視對學生基礎能力的培養。基于語音編碼下的實驗教學改革思路，就是以影視傳媒行業人才需求為特征，通過豐富課程內容與方法，讓新一代的影視傳媒人才能夠以扎實的基本功迎接社會的挑戰。

[1] 于海礁.關于媒體廣告實驗室建設的探索與思考[J].實驗技術與管理，2012，29(8)：185-187.

[2] 楊壽堂，王軼群.音視頻基礎課教學實驗室評估的實踐與探索[J].實驗技術與管理，2007，24(10)：157-160.

[3] 高俊，黃濱，周江波.數字融合視角下的體育文化創新[J].體育學刊，2013，20(2)：15-18.

[4] 殷海兵，李茜，洪波，等.“數字視音頻技術”課程體系改革探索[J].科技信息，2010(30)：43-44.

[5] 劉玉清，杜瑩.新聞傳播教學全媒體實驗平臺建設探討[J].實驗技術與管理，2012，29(11)：169-173.

[6] 楊晟.試析新聞傳播類專業實驗教學理念創新[J].實驗技術與管理，2009，26(7)：136-138.

[7] 楊壽堂.虛擬演播室系統分析及應用[J].實驗技術與管理，2005，22(12)：83-86，96.

[8] 馬靜巖.我國高等院校影視傳媒專業實驗教學改革研究[J].實驗技術與管理，2013，30(4)：166-168，189.

[9] 徐曉風，施長君，陶亞兵，等.國家級藝術實驗教學示范中心建設的探索與實踐[J].實驗技術與管理，2011，28(7)：7-9，31.

[10] 史忠植.智能科學[M].北京：清華大學出版社，2006：104,253.

[11] 沈靜，阮若林.音頻信號的感知編碼技術研究[J].咸寧學院學報，2007，27(3)：75-77.

[12] 楊晟.試析新聞傳播類專業實驗教學理念創新[J].實驗技術與管理，2009，26(7)：136-138.

[13] Godsmark D,Brown J.A black board architecture for computational auditory scene analysis[J].Speech communication，1999(27)：353-366.

[14] Murail,Tristan.The Revolution of Complex Sounds [J].Joshua Cody，translated.Contemporary Music Review, 2005, 24(2/3):121-135.