范凌云 周婧
摘 要: 音階識別方法不能結合樂音的物理和音樂特性,造成樂音處理信號量雜亂無序。針對該問題,通過復音音高確定轉錄音符集合,引入頻譜圖、譜平滑性和調和性估計建立HMM模型。分析對比實驗結果表明,HMM模型可以完成樂音物理與音樂特性結合,改善樂音處理信號量雜亂無序現象。
關鍵詞: 音階識別; 合理性模式; 校對方法; HMM模型; 譜平滑性; 樂音處理
中圖分類號: TN781?34; TP277 文獻標識碼: A 文章編號: 1004?373X(2018)08?0160?03
Abstract: In the musical scale recognition method, physical and musical features of the musical tone cannot be combined, which causes randomness of music tone processing signals. To resolve this problem, the notes set is determined and transcribed by using complex tone pitches. Diagram of spectrum and estimation of spectrum smoothness and harmonicity are introduced to construct the HMM model. The analysis results of comparison experiment show that the HMM model can complete the combination of musical tones′ physical and musical features, and improve the randomness phenomenon of music tone processing signals.
Keywords: musical scale recognition; rationality pattern; proofreading method; HMM model; spectrum smoothness; music tone processing
應用專業的語音識別軟件,并結合計算機的專業分析,是現有音樂識別方法的主要校對形式。但由于操作手段上的局限性,這種方法不能很好地結合樂音的物理特性和音樂特性,這也使樂音處理信號量顯得十分雜亂無序[1?2]。本文針對上述問題,通過RFTI復音音高合理性識別,應用頻率域和時間域對音符進行識別的方法,建立了復音音高的音階合理性識別方法。并基于此方法,獲取ISTFT和頻譜圖,引用譜平滑性和調和性估計,建立HMM模型。由實驗對比可知,本文所提出的HMM模型可完成樂音物理與音樂特性結合,改善樂音處理信號量雜亂無序現象。
1.1 用頻率域和時間域確定轉錄音符
首先,根據式(1)確定符合描述特征的音符譜峰,再將這些音符譜峰按照峰類別的不同進行分類,最后確立可通過頻率域和時間域進行轉錄的音符集合。令瞬時頻率與中心頻率的差值[RTFIr(t,?)]滿足譜峰選擇分類方法,則有:
1.2 RTFI復音音高合理性識別
RTFI復音音高合理性識別原理是一種基于頻率的時頻分析工具,通常情況下,該原理定義一個函數的頻率指數衰減因子,從濾波共鳴系統中衰減映射[5?6]。為了保證該原理的穩定性,引入諧振濾波器的脈沖響應用[I]表示,則:
上述步驟完成了可轉錄音符集合的確定,這也為后續過程音符的抓取提供了方便。為了更好地對音樂音階的合理性模式進行識別校對[3],還需按照如下方法,搭建HMM音階識別模型。
2.1 STFT和頻譜圖的獲取
2.2 譜平滑性和調和性估計
通過循環的方式,找出上述頻譜圖中的基音和泛音,再將基音進行存儲,并從頻譜圖中將此部分聲音消除。對于剩余部分的聲音信號來說,依然對其進行上述循環處理,這樣就可以完成對聲音信號的譜平滑性和調和性估計[9]。其主要工作原理如圖1所示。
2.3 應用HMM模型完成音階的校對
HMM音階識別模型,描述頻譜圖觀察情況與真實情況之間的關系,該模型解決了傳統模型信號不穩定的問題,又利用統計學理論解決了各信號段之間的轉化問題。對于HMM模型來說,不僅可體現音階的瞬時變化,也可以利用這種動態的變化,促使音階在短時間內達到平穩狀態。
本文以專業表演用的立式鋼琴作為實驗對象,分別彈奏do~si,7個單獨的音階,并應用HMM模型和普通模型,對這7個音階進行識別校對,具體實驗過程如下。
3.1 實驗參數設置
實驗參數設置如表1所示。
3.2 音階物理特性檢測對比
在彈奏do~si七個音階的過程中,分別應用HMM模型與普通模型,對各個音階的物理特性進行檢測,檢測結果如圖2所示。
圖2中位于標準曲線上的各點,從下到上依次代表do~si。通過觀察可以發現,運用HMM模式進行檢測的結果,均勻分布與標準曲線兩側,且各檢測結果與標準曲線的距離基本保持一致。而運用普通模型進行檢測的結果,下半部分與標準曲線距離遠,上半部分與標準曲線距離近,且各檢測結果與標準曲線距離也都不相同。應用普通模型對音階進行音樂特性檢測所得圖像,不會與其物理特性檢測圖像具有明顯的對稱關系,而所設計HMM模型可更好地表達音階物理特性。
3.3 音階音樂特性檢測對比
在記錄上述物理特性檢測結果的基礎上,再次彈奏do~si這7個音階,分別應用HMM模型與普通模型,對各個音階的音樂特性進行檢測,檢測結果如圖3所示。
通過觀察可以發現,運用HMM模式進行檢測的結果,均勻分布與標準曲線兩側,且各檢測結果與標準曲線的距離基本保持一致。而運用普通模型進行檢測的結果,上半部分與標準曲線距離遠,下半部分與標準曲線距離近,且各檢測結果與標準曲線的距離也都不相同。因此,本文所設計的HMM模型可以更好地表達音階的音樂特性。
本文通過復音音高確定轉錄音符集合,又在此基礎上,引入頻譜圖、譜平滑性和調和性估計,并根據此建立了HMM音階檢測模型[10]。通過本文設計的分析對比試驗,證明HMM模型確實能夠完成樂音物理與音樂特性結合,改善樂音處理信號量雜亂無序現象。
參考文獻
[1] 張世超,陳琦,呂杰.基于DPP的自動音符切分識別研究[J].電子產品世界,2016,23(5):28?30.
ZHANG Shichao, CHEN Qi, L? Jie. The study of automatic notes segmentation and recognition based on DPP [J]. Qutlook of electronic technology, 2016, 23(5): 28?30.
[2] 崔瑋.改進的D?S證據理論在海上目標融合識別模型中的應用[J].艦船科學技術,2017(8):109?111.
CUI Wei. The application of improved D?S proof theory in the model of sea target fusion recognition [J]. Ship science and technology, 2017(8): 109?111.
[3] 石云波,楊志才,曹慧亮,等.高量程加速度計動態線性校準系統[J].光學精密工程,2016,24(2):381?389.
SHI Yunbo, YANG Zhicai, CAO Huiliang, et al. Dynamic linearity calibration system for accelerometers with high measurement range [J]. Optics and precision engineering, 2016, 24(2): 381?389.
[4] 黃鵬,王青,俞慈君,等.飛機附件數字化校準系統的開發與應用[J].計算機集成制造系統,2015,21(12):3271?3281.
HUANG Peng, WANG Qing, YU Cijun, et al. Development and implementation for digital alignment system of aircraft accessories [J]. Computer integrated manufacturing systems, 2015, 21(12): 3271?3281.
[5] 王楊,劉以安,張強.改進的D?S證據理論在戰場目標識別中的應用[J].彈箭與制導學報,2015(2):156?158.
WANG Yang, LIU Yian, ZHANG Qiang. Application of target identification in battlefield based on improved D?S evidence theory [J]. Journal of projectiles, rockets, missiles and guidance, 2015(2): 156?158.
[6] 馬云彤.數字出版時代電子化校對模式探討[J].中國科技期刊研究,2015,26(12):1282?1288.
MA Yuntong. Electronic proofreading modes in the digital publishing era [J]. Chinese journal of scientific and technical periodicals, 2015, 26(12): 1282?1288.
[7] 由睿.用“音符評價法”輔助音樂教學:淺談低學段五線譜學習方法[J].中國音樂教育,2015(2):35?37.
YOU Rui. Stave learning method for the pre?schools [J]. China music education, 2015(2): 35?37.
[8] 崔立紅,趙維寧,顏昌翔.高斯光束與諧振腔基模模式光路諧振匹配的分析與校準[J].物理學報,2015,64(22):206?214.
CUI Lihong, ZHAO Weining, YAN Changxiang. Analysis and alignment of the light path of Gauss beam matched to the fundamental mode of an optical resonator [J]. Acta physica sinica, 2015, 64(22): 206?214.
[9] 周蘇娟,趙斌,孟江,等.基于BP神經網絡和遺傳算法優化茺蔚子水蘇堿提取工藝的研究[J].廣州中醫藥大學學報,2015(4):735?738.
ZHOU Sujuan, ZHAO Bin, MENG Jiang, et al. Optimization of preparation technology of stachydrine in fructus leonuri based on back?propagation neural network and genetic algorithm [J]. Journal of Guangzhou University of Traditional Chinese Medicine, 2015(4): 735?738.
[10] 普布旦增,關白.基于統計的藏文音節字校對系統開發研究[J].西藏大學學報,2015,30(1):74?78.
PUBU Danzeng, GUAN bai. Development of proofreading Tibetan syllables word system based on statistics [J]. Journal of Tibet University, 2015, 30(1): 74?78.