999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

Petri網在留學生漢語語音評價系統中的應用

2016-05-09 09:47:26陳展
現代語文 2016年3期

摘 要:本文介紹了Petri網在留學生漢語語音評價系統中的應用實例,提出了該系統的形式化的定義和語音評價過程的執行規則,結合漢語發音評價體系的特點,利用Petri網實現了留學生漢語語音評價的基本過程,降低了時間成本,提高了留學生漢語語音評價的效率。

關鍵詞:Petri網 漢語語音評價 形式化 語音信號

一、引言

漢語發音在留學生漢語學習及交流中起著舉足輕重的作用,語音評價是第二語言習得過程中的基礎內容和重要環節,而漢語發音數據則是語音評價的主體和前提,是語音庫的重要來源。如何對留學生的發音做出科學、有效的評價,一直是語音評價研究的熱點。近年來,隨著信息技術的不斷發展,國內對漢語語音識別、語音評價系統做了大量研究,主要成果如下:袁毅、吳晨[1]提出了柔性可擴展體系結構非特定人語音識別系統的框架模型,驗證了在該模型指導下所開發出的語音識別系統的實用性和穩定性;施偉[2]提出了對外漢語教學中的發音自動評價系統,通過分析輸入語音數據,提取語音特征并與參考標準進行匹配比較,由評分機制根據相似程度大小給出相應的評價;潘志松等[3]提出了Petri網原理在語音識別中的基礎應用方法,并以簡單實例加以研證。

以上研究均采用了不用的技術和方法來實現漢語語音數據評價過程,產生了一系列的應用結果,取得了一些進步和成果。本文在前人研究的基礎上,提出了一種用Petri網實現留學生漢語語音數據識別、評價及偏誤分析的方法,大大降低了漢語語音數據評價成本,提高了評價過程的效率和留學生習得漢語語音的效率,使語音評價過程具有一定的兼容性、擴展性和適應性,符合當代漢語語音數據評價發展的特點及要求。

二、Petri網與留學生漢語語音評價體系

(一)Petri網簡介

Petri網起源于1962年Carl Adam Petri的博士論文,它是一種可以用網狀圖形表示的系統模型,其概念是在尊重自然規律的前提下定義的,以確保以其為模型描述的系統都是可以實現的[4]。Petri網有豐富的系統描述手段和系統行為分析技術,最初主要應用于系統的建模、分布式系統的設計、并行處理等領域,經過50多年的研究發展,Petri網理論日益完善,被廣泛應用于實現各類流程和系統行為過程問題。

按研究對象(過程),Petri網的模型可分為網、網系統、庫所/變遷系統、高級網系統等模型系統,每類模型均有不同的層次結構。本文涉及到的是高級網系統中的有色自控系統[5],它的一個庫所中可以包含多種資源(漢語語音信號),一個變遷代表一種流動關系,涵蓋因資源差異而發生的不同變化和特征。

Petri網最基本的構成單元為:庫所(Place)圓形節點(下文以S代替),變遷(Transition)方形節點(下文以P代替);有向弧(Connection)是庫所和變遷之間的有向弧;托肯(Token)是庫所中的動態對象(如為完成某個語音輸入的識別或備份需要調用到的資源個數),可以從一個庫所移動到另一個庫所。Petri網的運行規則視具體情況而定,但基本規則是:有向弧是有方向的;兩個庫所或變遷之間不允許有庫所;庫所可以擁有任意數量的托肯。

(二)留學生漢語語音評價體系

留學生漢語語音評價體系[6][7]是根據留學生發音特征和漢語發音偏誤建立的一個衡量和評價漢語語音習得程度和發音質量高低的智能化系統,使留學生能利用該系統對發音進行測評,該系統可在第一時間反饋漢語發音評價結果、錯誤類型和改進建議,能有效地提高留學生漢語發音的正確率,使其能更好地掌握漢語發音。

根據留學生漢語發音特點以及現有語音識別技術,漢語語音評價體系由語音識別層、語音評價層及偏誤分析層三大功能模塊構成,在每一個功能模塊下又設有子模塊,如圖1所示。三個主要功能模塊之間相互依存、相互影響和相互作用,通過聯動和反饋機制不斷地在其間傳遞語音及語音評價信息,構成了一個完備的漢語語音評價體系。

(三)評價測試

項目組利用矢量化編碼VQF技術[8]進行漢語語音數據采集,通過對普通的漢語語音評價實現方案和基于Petri網的語音評價實現方案做出了測試和對比,結果如圖2所示。

假設L為留學生漢語發音習得等級,它是一個五元組L=(L1,L2,L3,L4,H),其中:L1為元音習得等級,L2為輔音習得等級,L3為聲調習得等級,L4為語調習得等級,H為權重因子[7],F為基頻參數。L值越高,證明發音偏誤率越低,發音更加接近標準,發音質量高;L值越低,證明發音偏誤率越高,發音偏離標準,發音質量低。圖2中L1為普通的漢語語音評價實現方案對應的語音評價等級,L2為利用Petri網實現方案對應的語音評價等級;右側測試數據則為某個漢字發音單元(本研究僅限于單音節詞)在兩種方案下得出的等級值。由圖可知,L2實現方案較為合理,大體上符合漢語發音規律,評價值接近預設的漢語發音習得等級值(L)。

(四)留學生漢語語音評價體系與Petri網的關系

從理論意義上講,二者在形式上是一一對應的關系,只是涵蓋的內容不同,Petri網及網系統發生記錄也是語音評價體系的執行結果。經過以上測試可發現:以Petri網為工具能有效實現留學生漢語語音評價系統的模型化,以網絡圖形方式描述語音評價系統模塊之間的關系和語音評價的全過程,從而使抽象的語音評價過程具體化。此外,Petri網語音執行記錄還能有效地反饋發音偏誤、缺陷和系統異常情況,有利于針對某一個(組)語音的分析和處理,為整個留學生漢語語音系統的運行提供有效的支持和保障。

三、Petri網在漢語語音識別系統中的應用

Petri網是研究和模擬漢語語音評價并行發生,依次發生和循環發生最理想的工具,與其他智能化系統一樣,留學生漢語語音評價系統有一套完備的實現程序,系統中各模塊間通過聯動機制有機地聯系在一起,這是利用Petri網對其形式化描述的物質基礎。下面是一個用Petri網來描述留學生漢語語音評價系統中語音識別層的實例。

(一)圖形化的漢語語音識別過程

語音識別層由語音信號輸入模塊、預處理模塊、特征提取模塊及標準語音數據庫構成,如圖1所示,當某個語音信號產生時,語音信號輸入模塊首先將語音轉換為計算機能讀取的數字信號,隨后通過預處理模塊分辨出語音信號及非語音信號。經預處理后的音頻數據一方面會被傳送到標準語音庫進行備份,另一方面作為特征提取模塊的輸入數據。

將以上漢語語音識別過程以Petri網描述如下:

S1、S2、S3、S4為不同狀態下的漢語語音信號;P1為語音識別功能模塊,P2為預處理功能模塊,P3為特征提取功能模塊;s0為經預處理后的音頻數據;p0為標準語音庫和偏誤語音庫之間的聯動功能模塊。

圖3是對一個典型的形式化的語音識別過程:漢語語音在處理過程中移動,每個處理環節再調用相關的函數及算法,直至語音識別過程結束。顯然,語音處理環節對應著Petri網系統中的變遷元素“T”,而不同狀態下的漢語語音數據則對應庫所元素“S”。圖3是整個漢語語音評價過程中截取出來的一個語音識別片段∑s,其中庫所中的黑點個數代表該種語音識別資源的個數,箭頭代表系統中資源流動的方向,弧上的數字代表語音處理需要調用到的資源的個數,也稱為權值,沒有數字的弧,其權值為1。例如,語音識別環節P1需要輸入1個漢語語音,調用1個語音識別資源后完成識別,S2中語音資源個數顯然少于預處理需要調用的資源總數,就上模型片段而言,不能繼續進行語音數據的預處理,P2將等待系統具備充分的資源數后,方可執行。另一方面,s0中已經有足夠資源對識別后的語音進行備份和比對,從而p0過程得以進行。

當語音識別系統中存在資源競爭時,經常出現以下情況:某個語音在識別后備份到標準語音庫中,占用到一定的資源個數,與此同時,偏誤分析功能模塊也要調用標準語音庫中的數據或資源進行比對,資源情況不滿足既定操作,即語音識別層和偏誤分析層在同時對標準語音庫和偏誤語音庫中的資源進行調用時存在資源競爭現象,有向弧上的權值不允許操作繼續,語音識別系統將會反饋異常處理記錄,系統將重新分配現有資源,尋求其他途徑解決沖突。

就漢語語音資源來說,存放它們的庫所S(語音信號)具有語音庫存貯數據的性質,它只能存放一定種類的語音資源,并且有一定的數量限制。但S和語音庫又不完全一樣,語音庫在語音評價網系統中有固定的位置,而S在網中的位置毫無意義,不管它們處于何種位置,語音識別系統(網)的含義是不變的。

(二)基于Petri網的留學生漢語語音評價網系統

1.留學生漢語語音評價網系統的形式化定義

結合留學生漢語語音評價過程與Petri網中有色自控系統的特點和性質,可得出∑:

∑=(S,P;F,W,R)為留學生漢語語音評價網系統的條件是:

(1)(S,P;F)為有向網,它為∑的基本網;

(2)W:S×P∪P×S→{0,1,2…}∪S,且W(x,y)≠0,當且僅當(x,y)∈F,也成為∑的語音權函數;

(3)R:S→{0,1,2…}為∑的資源標記。

該定義假設每個語音信號(S)的容量為無窮(因為考慮到本文設計的語音評價系統對象是無窮盡的漢語語音數據,故做上述假設),有向弧的權值可以作為庫所名,定義中(S;P;F)可映射到留學生漢語語音評價的各個環節。例如:W(x,y)=sn,則可從庫所畫一個以小圓圈為箭頭的有向弧指向弧(x,y),如圖3所示。

由于該網系統沒有可變的權值,故設S={s0,s1,s2…sn},P={p0,p1,p2…pn},由∑的權函數W可產生模糊矩陣R,R的第i行第j列的矩陣元素即W(pj,si)-W(si,pj),可依此計算出所需資源標記(個數)。

2.留學生漢語語音評價網系統的運行規則

(1)映射R:S→{0,1,2…}為∑的資源標記;

(2)表示R下的權值函數Wr定義為:(x,y)∈S×P∪P×S;

若W(x,y)S,則Wr(x,y)=W(x,y);若W(x,y)=s′∧s′∈S,則Wr(x,y)=R(s′);

(3)變遷p∈P滿足R的發生權,即R[p>的條件是:s∈S:R(s)≥Wr(s,p),且有s∈S,使Wr(s,p)>0,則p至少有一個輸入權值;

(4)若R[p>,則p可以發生,后繼標識R′(s)為R′(s)=R(s)+Wr(p,s)-Wr(s,p),有R[p>R

以上就是留學生漢語語音評價網系統的運行規則,權函數Wr隨著標識R的改變而改變,體現了該系統的缺陷跟蹤能力和語音修正能力。從嚴格意義上講,“∑”只是語音評價系統中各子系統的總和,運行規則里也指出了“p”的輸入弧上的權值必須大于0方可執行,以避免無中生有的變遷發生,如只要有語音信號,語音評價系統中有無語音數據都可完成語音評價,這種情況是不允許的。

根據定義和運行規則,可對照圖3,∑s中語音識別過程P1、特征提取過程P3均可發生,假若S2(識別后的語音)中沒有足夠的托肯,預處理過程P2永遠都不會發生,則語音評價系統中的語音輸入識別功能無法完成,這也將造成之后語音評價系統功能的紊亂和終止。從另外一方面看,Wr函數體現了語音評價過程的自我修正和反饋意見功能,可針對因資源競爭,產生死鎖而造成系統癱瘓、運行異常等情況做出反應,并重新配置語音處理資源,使系統在第一時間里回復正常運行,保證了該系統智能、穩定和高效的特點。

3.語音評價結果

本研究前期預測效果顯著,項目組利用以上方法對測試漢語語音評價系統以來的所有漢語語音評價記錄做了相關統計。抽樣調查中,95%的留學生參與了語音評價的各個環節,語音評價系統成功識別漢語語音數據共計15891條(按單個音節計算),其中有效數據13936條,占87.69%。

在執行語音評價的指令中,同時執行多條語音處理指令稱為指令并行。圖4中的并行度是指在語音評價關系網中,指令并行執行的最大條數。經測算,該留學生漢語語音評價系統在完成所有語音處理指令和不出現異常的情況下,各模塊語音指令總數為:分割與對比功能模塊,124條;發音評價功能模塊,298條;習得等級測評功能模塊,21條;聯動模塊,9條。根據上表數據,可見本文設計的留學生漢語語音評價系統中的指令并行程度較高,大大提高了語音處理和評價的速度,降低了時間成本,有利于在同一時間處理和分析多條漢語語音數據。

4.語音數據的保存

為建立留學生漢語標準語音庫和偏誤語音庫,為語音識別、對比研究奠定數據技術基礎,為最大程度的保證語音評價的準確性和擴展性,應做好標準漢語語音的采集和偏誤語音的收集。項目組在對產生的每一個漢語語音(或多個語音)評價結果后都要對其進行備存和入庫管理,這是Petri網技術做不到的。

四、結語

人類處于一個信息技術迅猛發展的時代,語言學和計算機科學越來越緊密地結合在一起,這也是當今跨學科發展的必然結果。對于研究人員來說,留學生漢語語音評價是由一系列復雜的活動組成的,對其進行形式化的定義不僅需要將語言學和計算機技術基礎理論和實踐經驗相結合,還需進行大量的測試和技術研發。本文介紹的基于Petri網的留學生漢語語音評價系統實現方法只是語音評價技術中的一種,以期能夠給業內人士提供有效參考。

(本文是云南省社科規劃辦項目“基于東盟國家語言政策的云南漢語國際推廣策略研究——以GMS五國為例”,[項目編號:KKSK201335026];云南省教育廳本科教學質量與教學改革工程項目“東南亞語種人才培養示范點”[項目編號:10968258]。)

參考文獻:

[1]袁毅,吳晨.柔性可擴展體系結構非特定人語音識別系統[J].計算機應用研究,2006,(12):203-206.

[2]施偉,謝湘.一種基于語音識別的漢語發音評價系統[A].第七屆中文信息處理國際會議[C].2007,32-36.

[3]潘志松,王全來,陳哲.Petri網理論及其在語音識別中的應用[J].電子技術學院學報,1998,(1):21-26.

[4]袁崇義.Petri網原理與應用[M].北京:電子工業出版社,2005:1-2.

[5]吳亞雄.基于高級Petri網的電網故障診斷[D].廣州:華南理工大學碩士學位論文,2015,11-21.

[6]CHEN ZHAN,etc.A Study on the Architecture of Chinese Phonetic Evaluating System Based on the Chinese Pronunciation

of Thai Students[A].The 9th Cross-Strait Academic Conference.[C].2014,(10):528-529.

[7]陳展.基于老撾留學生發音特征的漢語語音評價體系研究[J].現代語文(語言研究版),2015,(3):81-82.

[8]陳展.基于微格矢量編碼與缺陷跟蹤的漢語語音數據采集研究[J].價值工程,2016,(1):149-151.

(陳展 云南昆明 昆明理工大學國際學院 650093)

主站蜘蛛池模板: 免费在线一区| 亚洲精品第一页不卡| 国产成人三级| 亚洲乱码视频| www.youjizz.com久久| 日日碰狠狠添天天爽| 久草网视频在线| 国产福利在线观看精品| 在线观看亚洲精品福利片| 国产成人盗摄精品| 国产免费网址| 国产精品无码影视久久久久久久| 国产日本欧美亚洲精品视| 亚洲香蕉在线| 亚洲国产成人综合精品2020 | 国产免费福利网站| 97人人模人人爽人人喊小说| 性视频久久| 欧美日韩精品一区二区视频| 色综合天天视频在线观看| 国产精品第| 九色免费视频| 亚洲精品男人天堂| 午夜人性色福利无码视频在线观看| 天堂在线www网亚洲| 亚洲国产精品日韩av专区| 色天天综合久久久久综合片| 日本91在线| 伊人成人在线视频| 在线精品亚洲一区二区古装| 国产精品一线天| 亚洲侵犯无码网址在线观看| 色久综合在线| 国产精品手机在线观看你懂的 | 久久精品嫩草研究院| 911亚洲精品| 亚洲成a人片在线观看88| 特级做a爰片毛片免费69| 日韩欧美中文字幕在线韩免费| 亚洲国产精品VA在线看黑人| swag国产精品| 国产精品密蕾丝视频| 黄色网站不卡无码| 呦女亚洲一区精品| 网友自拍视频精品区| 欧美不卡视频在线| 91视频区| 日韩精品成人在线| 97视频免费看| 免费毛片在线| 在线精品视频成人网| 国产成人精品日本亚洲| 国产乱人乱偷精品视频a人人澡| 久久亚洲国产最新网站| 国产三区二区| 国产成人a毛片在线| jizz国产在线| 97超爽成人免费视频在线播放| 91尤物国产尤物福利在线| 九色视频一区| 精品无码人妻一区二区| 国产精品无码一二三视频| 久久亚洲中文字幕精品一区| 91极品美女高潮叫床在线观看| 在线播放精品一区二区啪视频| 在线观看欧美精品二区| 亚洲三级电影在线播放| 99久久成人国产精品免费| 亚洲精品无码AV电影在线播放| 成年人免费国产视频| 人妻一本久道久久综合久久鬼色| 亚洲人成电影在线播放| 亚洲精品欧美重口| 久久一日本道色综合久久| 国产va在线观看免费| 一区二区三区四区在线| 色婷婷成人| 又爽又黄又无遮挡网站| 91精品久久久久久无码人妻| 免费高清毛片| 国内精品小视频福利网址| 久久精品日日躁夜夜躁欧美|