蔣正鋒 李海強



摘? 要:針對新工科視域下工程專業對學生具有扎實理論基礎,較強的實驗實踐操作能力,強烈工程創新意識的需求,探索抽象理論模型與具象實驗相結合的教學模式。設計隱馬爾科夫模型的實驗中,內容涵蓋了數學與統計學、聲學與語言學、計算機與人工智能等多學科交叉的知識,通過逐步優化多參數融合的隱馬爾科夫模型實驗,鍛煉了學生理論與實踐相結合,分析和解決復雜問題的能力,也解決了學生參與工程實踐與科研實踐的難題,將知識系統化、工程化、科研化,實現了新工科的培養理念。
關鍵詞:隱馬爾科夫模型;新工科;語音識別
中圖分類號:G642? ? ? ? 文獻標志碼:A? ? ? ? ? 文章編號:2096-000X(2021)21-0089-05
Abstract: In view of the needs of engineering majors in the field of new engineering, students have a solid theoretical foundation, strong experimental practice and engineering innovation consciousness, this paper explores a teaching mode that combines abstract theoretical models with concrete experiments. In the experiment of designing the hidden Markov model, the content covers the interdisciplinary knowledge of mathematics and statistics, acoustics and linguistics, computer and artificial intelligence. The Hidden Markov Model experiment with the gradual optimization of multi-parameter fusion exercises students' ability to combine theory and practice, to analyze and solve complex problems, also solves the problem of students participating in engineering practice and scientific research practice, systemizing, engineering, thus systematizing, engineering and scientific research knowledge and realizing the cultivation concept of new engineering.
Keywords: Hidden Markov Model; new engineering; speech recognition
為推動我國高等工程教育與產業發展更加緊密聯系,需對我國現階段的工程教育進行深入的改革和創新。2017年2月18日,教育部在復旦大學組織召開的工程教育戰略研討會議,開啟了我國新工科教育的探討,會議形成了《新工科建設復旦共識》文件[1-3]。隨著新一輪科技和產業革命驅動而形成與發展的新型經濟,對我國的高等教育形成了新的挑戰[4]。而第四次工業革命的浪潮即將來臨,“互聯網+”、“一帶一路”倡議和“中國制造2025”等對我國高等教育改革發展提出新的要求,傳統類工科專業面臨著新的機遇和挑戰。教育部在2017年2月20日發布的《教育部高等教育司關于開展新工科研究與實踐的通知》指出,新型經濟的出現,對我國工程科技人員提出適應新型經濟的要求,從而需對我國高等工程教育進行改革。2017年4月8日在天津大學舉行了“新工科”建設的研討會,會后教育部發布了“新工科”建設行動綱領“天大行動”,行動綱領指明了“新工科”建設目標:“到2020年,探索并形成適應新技術,新產業和新經濟發展的‘新工科模式;到2030年,將構建完善的具有中國特色、有力地支持新型創新和發展的世界一流工程高等教育體系;到2050年形成具有中國特色、引領全球工程教育,建設成為世界工程創新中心和人才高地的工程教育強國”。為適應新經濟和新產業發展的需要,加強新型經濟與工程教育的聯系,我國工程教育面臨一場挑戰與機遇并存的改革。加快新工科建設,培養能面向未來,具有扎實的理論基礎,較強的實踐動手能力,強烈工程創新意識的科技人才,適應和引領新經濟的發展[3-4]。針對綜合性復雜的隱馬爾科夫模型設計實驗,在掌握HTK(Hidden Markov Model Toolkit)的體系結構與語音識別的基本原理基礎上,引入多參數融合對馬爾可夫模型逐步優化的科研教學方法。使用HTK搭建一個基于隱馬爾科夫模型的離散數字語音識別系統,融合了數學與統計學、聲學與語言學、計算機與人工智能等多學科前沿技術。通過MFCC(Mel Frequency Cepstral Coefficents)特征參數的維度、音節和聲韻母聲學模型、高斯混合分量個數等多參數的不同融合,逐步優化隱馬爾科夫模型,鍛煉了學生的實踐能力和科研能力。以隱馬爾科夫模型設計實驗為紐帶,將所學知識系統化、工程化、科研化,實現了新工科的培養理念。
一、預備知識
(一)HMM在語音識別領域的地位
二十世紀八十年代時, 語音識別的重點放在大詞匯量、非特定人和連續語音上,識別算法從基于標準模板轉到基于統計模型的方法。語音具有時變性和短暫的平穩性,而隱馬爾可夫模型能描述語音的這種特性,從而在語音識別領域引入馬爾可夫模型構建聲學模型[5-6]。隨后其他的語音建模如HMM/VQ、HMM/高斯混合和HMM/人工神經網絡模型在語音識別上取得突破性的進展,隨后HMM成為深度學習出現之前傳統語音識別技術中的主流技術[7-8]。回顧語音識別技術從實驗室走向應用的發展過程,其中探索淺層神經網絡、深度人工神經網絡在語音識別中的應用繼續了多年,效果不理想,直到深度學習技術[8-9]在機器學習中的成功應用才引起各個領域學者們的關注。基于深度學習[10]的語音識別研究逐漸成為熱點[11]。雖深度學習技術已引入語音識別領域,但傳統大部分語音識別系統還是基于HMM的。