鄧爽 姜軍 楊鳳志 沈家輝 王崇德
摘 要:隨著西藏旅游業和現代化的迅猛發展,越來越多的游客和求學者奔赴西藏,學習藏語,探索藏文化,便捷化的語音練習扮演著重要的角色。尤其,現在互聯網Android技術已經相當成熟,我們根據它的平臺特點,為藏語口語練習項目提供了一套切實可行的方案,目的在于實現藏語發音練習系統的智能化、便利化和時尚化,最重要的是,能為喜愛藏語的大學生們提供學習藏語和攻克藏語一級的機會。
關鍵詞:藏語發音練習 Android 移動學習
中圖分類號:TP311 文獻標識碼:A 文章編號:1003-9082(2018)08-000-02
一、研究背景及現狀
隨著西藏旅游業和現代化的迅猛發展,越來越多的內地學子趕赴西藏求學,探索西藏文化;所以,藏語就是溝通這之間的橋梁;我們的目的就是通過便攜、普遍的移動Android設備減輕大學生學習藏語的困難,使內地同學能盡快的掌握藏語一級,說出純正的藏語。
目前已存在很多類似的軟件系統,例如有道藏語(豪華版)、掌中藏語等等,技術已經相當的成熟,但是專門針對大學生藏文一級和提升模塊的Android版藏語讀音校園應用軟件并沒有出現。所以,我們設計了校園應用藏語讀音練習軟件。
二、功能模塊的介紹與設計
1.Android平臺
Android平臺[1]是目前應用最廣泛的開放源代碼操作系統之一,它的出現為移動互聯網的蓬勃發展提供了有力的技術和環境支持。它最開始是被AndyRubin研發出的,為了應用于手機等移動設備;后來,被實力雄厚的Google公司收購注資。漸漸地,Android平臺開始蔓延到其他各個領域,比如說平板電腦,游戲機,電視等等。
Android系統如今占很大的市場份額的大部分原因是因為它技術的優越性,用Linux開發,包括應用程序層、應用程序框架層、系統運行庫層和Linux內核層,所有的程序都采用JAVA語言來編寫。
2.Eclipse
該系統我們選擇的開發環境是Eclipse[2]。Eclipse是一個開放源代碼,它的優勢在于擁有Java開發工具(也叫JDK),而且自身還附帶了其他一些標準插件集;它的擴展能力較強,比其他的開發平臺來說更具靈活性。Eclipse的結構體系不太復雜,是服務和框架體系,用途在于可經過多數插件構建開發環境。
3.語音信號的相關處理
在整個模塊中,對語音信號的處理尤為重要。氣流激勵聲道同時產生了語音信號,也就是聲帶的運動產生了語音信號,我們在進行預處理[3]時,要從以下幾個方面進行。
數字化處理[4]主要是用計算機將信號進行分析和處理,變為離散的數字信號。該項目我們使用的Android系統移動手機自帶的有語音信號輸入裝置和音頻處理芯片,能夠對語音信號進行相關采樣量化等一系列處理。該項目選擇了16位量化位數。
預加重處理主要是解決在實際應用中語音信號由于受到聲門和周圍輻射的影響,在高頻部分發生衰減的問題。經過預加重處理,可以增強高頻區域的信號,使頻譜變得平坦,方便我們對參數進行分析。這是預加重的傳遞函數和加重后的信號S2(n):
a表示預加重系數,其值約為1,該項目取0.98。
分幀加窗處理,分幀指的是將信號分成許多小段,每一段稱為一幀,在局部,每幀可以看作平穩的信號,利于分析處理;加窗是將不連續信號變得連續,我們選用的是漢明窗函數:
語音部分的處理還有一個很重要的方面,即特征參數的選取,在這里將識別性能和可靠性的問題放在首位考慮,我們選取MFCC[5]作為特征參數。
4.B/S構架的Android端體系統結構
整個結構由表現層,功能服務層和數據訪問層構成。表現層主要是用于用戶客戶端的連接;功能服務層分為“基礎”,“詞組”,“句子”三大模塊;數據訪問層是由文字和語音共同組成的材料庫搭建,材料庫使用SQLITE數據庫存儲。
三、軟件的分析與設計
1.I/O模塊設計
針對該項目而言,語音的I/O模塊設計[6]也就是語音的錄制和播放是關鍵部分,采用的Android移動系統自帶的有耳麥,就我們這個項目的語音錄制和播放來說,能有很好的效果,所以,最終選擇了Android手機自帶的耳麥作為語音錄制和播放的裝置。經過性能的對比,我們選用了AudioRecord類和AudioTrack類的方法分別對語音信號進行錄制和播放。最終的系統音頻格式是:采樣聲道是單聲道,采樣位數為16位,采樣頻率是8000Hz。
2.軟件的體系結構圖
這是整個軟件的體系結構圖,進入初始界面后,有三個選項卡,選擇“基礎”,“詞組”,“句子”任意鍵進入學習。軟件的制作最開始要進行文字和語音的搜集;接著梳理JAVA整體構架;然后將文字信息與讀音信息編號對應存入數據庫中;再基于B/S的客戶端進行編寫;最后進行軟件的測試,改進等等。
3.用戶界面設計
點擊這款APP,進入藏語讀音校園應用練習軟件,會顯示本款軟件的主界面,如圖2。在整個主界面上面,根據藏語練習的基本要求,我們一共設置了三欄顯示,分別是:“基礎”類、“詞組”類和“句子”類。
4.軟件實現
如圖3進入的是基礎練習界面,分為元音和輔音界面,點擊播放鍵,聲音將自動播放,我們可以跟讀練習并記憶藏語基礎;點擊停止鍵,聲音停止。
圖4顯示的是藏文書每一課的詞組,為日常單詞,選擇需要學習的課程,點擊進入,切換播放和停止鍵。
圖5是每一課的句子,在藏文考試中,關于句子的考察比分很重,這就要求我們熟練的掌握藏文書中的大部分日常用語;點擊進入“句子”界面后,選擇相應的部分練習。
該校園應用藏語讀音練習軟件的集成開發環境為Eclipse,而且該系統在真機上調試運行是相當迅速的,整個系統的開發運行環境為:
PC操作系統:WindowsXP(32bit) 音頻輸入:抗噪聲麥克風
平臺軟件環境:AndroidOS5.0 編程語言:Java
開發組件:JDK6;Eclipse3.6(Helios);AndroidSDK1.6
四、總結與展望
1.總結
本文系統平臺是Android智能類的手機,工作難點在于對語音內容的正確提取,還有特征參數的選取。根據此前對系統進行的開發,現在將大概的工作成果和研究內容作如下闡釋:
(1)主要分析了Android系統的一些基本結構體系、特性、應用程序原理和工作機制等等。為了確定該系統的優越性和開發的可行性,我們對Android系統的特征經過了十分激烈的分析討論。
(2)著眼系統特點,對系統識別算法進行了相關設計;探究語音技術識別理論,為Android系統校園應用藏語發音練習系統提供了一套可行的設計方案。
(3)我們在系統設計方案的基礎之上,實現了系統相關算法及軟件交互界面,而且在android移動端,Android4.0平臺上運行實現。經過多次測試,系統中的發音評價和發音糾正部分效果良好,預期的基本功能實現。
2.展望
為了提高系統的抗噪聲能力,還需要進一步研究和改進語音端點檢測算法。優化相關算法,減少內存占有量,提高系統運行效率和反應速度。完善優化交互界面,增加發音元素的數量,增加系統的實用價值。
參考文獻
[1]王朔.基于Android平臺的智能英語發音訓練系統的設計與實現[D].南京郵電大學,2013.
[2]周宇,尹生強,王冬青等.基于Eclipse和Android系統的App開發平臺搭建研究[J].青島大學學報(工程技術版),2016,31(03):49-53.
[3]王璐.基于模塊化的語音信號預處理實現[D].大連理工大學,2009.
[4]陳演平.語音信號的數字化噪聲抑制技術[J].電子技術應用,2002(10):76-79.
[5]卓嘎,姜軍,邊巴旺堆.基于Matlab的藏語語音MFCC參數提取研究[J].西藏大學學報(自然科學版),2017,32(01):58-62.
[6]馬獲蕾,湯海鳳.Android系統中SQLite數據庫的研究[J].電腦知識與技術,2013,9(28):6243-6245+6256.
作者簡介:鄧爽(1995-),女,四川綿陽,本科,學生,主要研究領域通信技術。
姜軍(1980-),男,四川遂寧,副教授,碩士,主要研究方向數字水印技術,數字圖形圖像處理,通信技術等等。