999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

計算音系學:原理、方法及未來發展

2023-12-23 08:01:44趙永剛黃捷
外國語文 2023年6期
關鍵詞:規則語言研究

趙永剛 黃捷

(西安外國語大學 英文學院, 陜西 西安 710128)

0 引言

隨著世界科技的飛速發展,交叉學科不斷繁榮,計算語言學研究也取得了長足的進展,其中計算音系學的興起正是這一領域的重大成果之一。 計算音系學既屬于音系學,又屬于計算語言學,是音系學的跨學科研究。 關于計算音系學理論的思考,最早可追溯到早期SPE(Sound Patterns of English,簡稱:SPE)音系學的規則推導理論,即有序排列規則可組構成有限狀態技術(Finite State Transducer,簡稱:FST)的理念。 盡管計算音系學研究涉及形式語言學理論,以及各種不同的研究方法,但這些研究的共同目標都表現為使用計算方法來分析和探究自然語言的復雜語音和音系現象,也就是在一系列“邏輯上的可能形式”中找出音變規律。 如今,這一研究領域已廣泛涉及語音識別與合成(技術)、語音處理和語音交互等諸多方面。 自20 世紀90 年代初以來,音系學研究從基于規則的理論開始轉向基于制約條件的理論框架,如OT 理論(Optimality Theory,簡稱:OT)(Prince et al.,2004),激發了語言學家對如何使用有限狀態技術將OT 理論加以模式化的深入探討,此后對OT理論、自動學習、語法與語音/音系界面等方面的研究皆成為這一領域的熱點論題。 隨著自然語言信息處理和人工智能的步步深入,計算音系學在未來的若干年內必將成為語言學的一個新的重點研究領域。

計算語言學是計算機科學、數學、邏輯學、語言學等學科結合下產生的一門新興交叉學科,旨在通過分析自然語言現象,建立數學模型,將語言形式化,進而利用計算機軟件處理、模擬并生成人工語言。 形式語言學建立了一整套形式化的原則和規則系統,試圖從語言結構內部尋找對語言現象的解釋。 計算音系學是計算語言學下的一個分支,主要任務是用計算方法或者形式化的方法來闡釋自然語言中復雜的語音現象,探索音變規律。 計算音系學和語音技術、語音識別、語音模擬等息息相關。 本文通過厘清計算音系學的定義、研究方向和研究范圍,闡述計算音系學的有限狀態模式和聯結主義這兩大主要研究方法,并以具體語言現象為例,分析兩種研究方法的具體應用,旨在喚起國內語言學界對計算音系學的重視,闡釋該學科研究現狀和推進學科前沿,激發語言學家、計算機科學家以及自然語言處理方面的專家進一步認識語言學的計算方法和認知理據,促進人工智能向更縱深層次發展。

1 計算音系學的基本定義和發展歷程

1.1 計算音系學:計算語言學的分支

計算語言學是集計算機科學、數學、邏輯學、語言學于一體的交叉學科,旨在通過計算機來進行人類語言研究,和計量語言學、數理語言學、自然語言理解、自然語言處理、人類語言技術等學科密切相關,基本架構就是通過研究分析自然語言,構建數學模型,利用計算手段對形式化的語言進行編輯處理,最終目標是模擬生成人工語言。 計算語言學的構成要素可以用下圖表示(Halvorsen,1988:20;袁毓林,2001:159):

圖1 計算語言學架構圖

目前,計算語言學研究的重點主要放在自動編排、自動分析和自動化研究上。 語言學家以計算機為工具,來進行諸如文本信息檢索、文獻自動分類、自動文摘、語音自動識別與合成、機器翻譯以及文本信息的提取和過濾等復雜工作,進行縱深層次的語言分析和語言處理。 計算語言學有五個任務:(1)語言學問題,即從語言學角度出發去看待計算語言處理的問題。 自然語言處理需要解決諸如語句分割問題、句子的語義等語言學問題。 (2)語言的形式化,我們需要用數學工具把語言學問題表述成語言模型,并將研究的問題在語言學上加以形式化,嚴密而規整地表示出來,才有利于語言處理。 (3)計算形式化,語言模型需要被計算機的算法描述成為一個可計算的模型,從而實現計算形式化,計算機語言中的前向或后向最大匹配算法、動態規劃算法等,就是為了實現計算的形式化。 (4)編程階段,完成了前三個任務之后,才可以開始這個任務,即使用編程語言實現這個計算模型。 (5)評估,我們需要對計算機處理的結果進行評估,通過計算某些指標,如準確率、召回率等,評估任務完成的情況。 語言學理論進入計算機程序的過程,Halvorsen(1988:201)用圖2 表示:

圖2 語言學理論到計算機程序流程圖

計算語言學和自然語言處理都是對自然語言的研究,但研究的側重點存在差異。 前者強調建立純數學的語言模型,用純粹數學的方法來描述語言結構,后者是要讓計算機像人一樣能懂語言,其本質是要把語言學數學化。 兩者研究的核心問題都是語言的自動理解和自動生成。 自然語言處理從計算機科學的角度出發,主要用來進行語言計算(語音與音系、詞法、句法、語義、語用等各個層面上的計算)、語言資源建設(計算詞匯學、術語學、電子詞典、語料庫、知識本體等)、機器翻譯與機器輔助翻譯、手寫和印刷體文字識別、語音識別及文語轉換、信息檢索(搜索引擎、信息抽取與過濾)、文本分類等。 自然語言處理的研究是為了促進機器的智能化,從而實現信息的有效處理(王萌等,2015:151),而計算語言學的主要應用在機器翻譯、語音識別、語音合成、語料庫分析等領域,更專注于理解語言規律,提高語言輸入和輸出水平。

計算音系學是計算語言學的最新領域之一,計算音系學把計算語言學理論、技術和方法應用于語音研究,把語言學家、音系學家和計算機科學家等不同研究群體聚集在基于制約的音系領域,借鑒基于制約的語法以及約束編程的見解,探索在現代非線性音系學中利用制約條件,來形式化和實現基于制約的音系學。 計算音系學是利用數理計算和形式化方法來分析自然語言中復雜的語音現象,總結出音變規律的語言科學。 史蒂文·伯德(Steven Bird)(2003:30)認為計算音系學是語言形式化和計算技術在音系信息表征和語音處理中的具體應用。 計算音系學的出現,為語音技術尤其是語音分析技術提供了新的解決思路。 一方面可以幫助語言學家分析和解釋語音現象,另一方面也可以促進自然語言處理在語音信息處理方面的發展。 計算音系學的核心應用就是文語轉換(Text-to-Speech,簡稱:TTS)和自動語音識別(Automatic Speech Recognition,簡稱:ASR)。 TTS 的核心任務是以文本中詞的序列作為輸入,產生聲學波形作為輸出。 ASR 的核心任務是以語音的聲學波形作為輸入,產生單詞串作為輸出。 語音自動處理的主要方法有:貝葉斯公式(Bayes formula)、噪聲信道模型(Noisy Channel Model)、N 元語法(N-gram Grammar)、隱馬爾可夫模型(Hidden Markov Model,簡稱:HMM)等,這些方法奠定了計算語言學包括計算音系學中各種統計方法的基礎。 趙忠德等(2009:35)認為音系學家們經常被數據分析所困擾,很難從文本中獲得并保存語料進行實證研究,對語料的分析也很難全部用手工進行。 因此,計算音系學的研究重點并不是為了將音系理論用在計算機上(也可能是計算分析的副產品),而是著重于音系學理論本身的更新和發展(Heinz,2011:140)。 國內有關計算語言學的研究日益進步,如俞士汶(1993)、袁毓林(2001)、劉穎(2002)、馮志偉(2011)等。 趙忠德等(2009)首次提出計算音系學這個分支學科,強調計算方法在音系分析中的重要地位。 趙忠德等(2011:339)認為當今計算音系學存在四個關鍵的延展領域:優選論、自動學習、語法與語音界面以及支持音系描寫。 然而,對計算音系學的研究和認知都相對滯后。

1.2 計算音系學的研究主題和方向

計算音系學的研究領域十分廣泛,具體包含語言理論與形式重建、實踐應用、自動學習和計算音系學與語法和言語的交互四大部分(Bird,1994)。 計算音系學的實踐和應用涉及語音識別、語音合成、語音處理和語音交互四個方面。 語言理論與形式重建是在已有理論上的更新,或在形式語法的基礎上重新構建形式體系,進一步完善和創建更加合理有效的音系理論框架。 實踐應用主要與自然語言處理、計算機程序研發息息相關,一方面可以幫助音系學家測試音系理論,另一方面對詞庫音系學、自主音段音系學、歷時音系學等音系學領域的發展具有重要意義。 自動學習通過觀察人類語言學習的過程,統計并分析數據,總結規律,建立形式模型,實現計算機的自動處理,為音系研究提供有效數據。 機器學習是自然語言處理中的重點和難點。 音系-句法交互和形式重建息息相關,語言研究者試圖推進句法-語音和句法-音系之間的交互作用(趙永剛,2016:24),若某一音系理論同樣適用于句法學和語義學,那也一定適用語法學,也有助形式語法的重建。 反過來,語法形式又可以作用于音系學,完善音系學理論。

計算音系學屬于形式語言學的范疇,其模型建構和形式模擬都離不開音系學和計算機科學的跨學科發展。 第一,形式語言學、計算機理論與音系學理論之間的關系應該納入計算音系學的研究之中。 音系學離不開形式化的方法,形式框架比較(如SPE 和OT)需要形式語言和邏輯之間的等價性,大規模約束模型的有效優化需要有限狀態模式。 諸如標準化(unification)、謂詞邏輯(predicate logic)、模態邏輯(modal logic)、類型理論(type theory)、分類語法或者邏輯(categorial grammar/logic)、有限狀態模式(finite-state devices)、形式語言理論(formal language theory)等,都是建構理論與形式的重要參考。 第二,自然語言處理和自動語音識別(NLP/ASR)對計算音系具有重要影響。盡管語言處理領域不被視為計算音系學,但概率模型對自然語言問題具有很大的認知效用。 第三,自動學習模型依賴計算音系學的研究結果。 音系學的計算模型與語法和言語的計算模型相結合,可以模擬人類言語行為和語言習得的測試模型,以及為音系學家概括特定的有用數據。 例如,認知計算模型特別關注音系和音系組配習得的計算方法,以及嬰兒和兒童對單詞切分的習得。 第四,大規模語音數據處理與計算音系學的關系密切。 計算音系學的大部分工作依賴于語料庫語言學方法論知識的共享體系,同樣,幾乎總是有必要對語料庫進行預處理以滿足特定語言研究的需求。 認知計算建模涉及語音數據語料庫,或來自刺激“語料庫”的行為結果,或兩者兼而有之,如語音習得認知建模工作運用了有限狀態OT(Hayes et al.,2008)。 以上所提的許多研究都借鑒了形式語言學理論的共同基礎,大部分音系認知計算模型都集中在音系組配和音系學習領域。 基于約束的音系學習方法和對音系變異的隨機方法都是有意義的(Daland,2014)。 計算音系學研究呈現出三種趨勢:數據科學和模型比較、使用計算模擬對音系現象進行建模、以及用定理和證據表征音系模式的計算性質(Heinz et al., 2016)。 總之,計算音系學四大研究方向深入到了語音技術的各個領域,對自然語言的音系學研究有著重要作用。

2 計算音系學的主要研究方法

語言家在分析自然語言時,經常需要處理大規模語料,而人工分析耗時耗力,容易出錯,造成實驗結果不夠客觀。 面對這種情況,研究者在傳統語言學分析的基礎上,將計算方法與語料分析結合起來,形成了計算語言學。 早在20 世紀80 年代初,赫爾辛基大學計算語言學教授基默·寇斯克尼彌(Kimmo Koskenniemi)最先在分析芬蘭語(后擴展至其他語言)時就提出了計算音系學與形態學的有限狀態兩級模式(Koskenniemi,1983;Kaplan et al.,1981)。 馮志偉早在1979 年便詳細介紹了喬姆斯基(Chomsky)等形式語言學理論中語法的四種類型:有限狀態語法、上下文無關語法、上下文有關語法和0 型語法,以及與之相應的四種自動機:有限自動機、后進先出自動機、線性有界自動機和圖靈機(馮志偉,1979:34),對后來的計算語言學研究產生了重要影響。 計算音系學將數理計算方法和音系研究結合起來,主要有兩大計算方法:有限狀態模式(Finite-state Models)和聯結主義方法(Connectionist Methods)(Bird,1995;趙忠德 等,2011:339)。

2.1 有限狀態模式

有限狀態模式主要指兩級音系學(two-level phonology)這種模式,接近于經典音位學和SPE 音系學的方法。 有限狀態模式最初應用于計算機、機械電子電路等,后推廣至管理學、自然語言處理等領域,該方法同樣適用于語言學研究。 現存的自然語言中,大多數語言(如英語)在言語表達上屬于無限語言。 這些語言通過構詞法或復雜句式,不斷產出新的表達,具有強大的自我再生能力。 無限語言的研究不僅對計算語言學家意義重大,也對所有關心自然語言的人意義非凡(Borschev et al.,2004:2)。 語言的句法結構、音系結構等語法規則都可以用有限狀態模式來研究,從而使無限狀態語言模式化,將無限轉化成有限,這一點和喬姆斯基的生成語法有異曲同工之妙。 喬姆斯基用形式化方法研究自然語言,利用數理邏輯對語言進行定義:給定一組符號(一般是有限多個),稱為字母表,以∑表示,又以∑?表示由∑中字母組成的所有語符列(或稱字,也包括空句子和空符號串)的有限或者無限集合,∑?的每個子集都是∑上的一個語言。 例如,若令∑為26 個拉丁字母加上空格和標點符號,則每個英語句子都是∑?中的一個元素,所有合法的英語句子的集合是∑?的一個子集,它構成一種語言(Chomsky,1956)。 道格拉斯·約翰遜(Douglas Johnson)(1972)很早就表明可以用有限狀態均值對音系學的某些方面進行建模,羅納德·開普蘭等(Ronald M.Kaplan)(1981)則展示了一種將多個有限狀態傳感器編譯成單個有限狀態傳感器,以實現SPE 風格的改寫規則,該技術在開普蘭等(1994)中有詳細解釋。

有限狀態模式在音系學中主要應用在兩個領域:音系改寫規則(Phonological Rewrite Rules)(Johnson,1972)和兩級規則(Two-level Rules)(Koskenniemi,1983)。 有限狀態自動機(Finite State Automaton,FSA)為它們提供了計算支持。 FSA 又可具體劃分為確定性FSA 和非確定性FSA。 確定性FSA 是指系統中由一個狀態到另一個狀態時的目的狀態是確定的,而非確定FSA 中由一個狀態轉換到的目標狀態是不確定的、可變化的。 其中,確定性有限狀態轉換器(Deterministic Finite State Transducer, DFST)形式化為七元組:<q0,Q,F,Σ,δ,λ,Λ>①q0∈Q,q0 為初始態,Q 為狀態的有限集合;F?Q,F 為終止態,是Q 的子集;Σ 為一組有限的輸入符號(輸入字母表);Λ 為一組有限的輸出符號(輸出字母表);δ 是Q×Σ→Q 中的函數,是轉移集,它將一種狀態和一個輸入符號映射到另一種狀態;λ 是Q×Σ→Λ 中的函數, 亦稱轉換函數(發射函數),它將一種狀態和輸入符號映射到輸出符號。 這就準確描述了確定性有限狀態轉換器下輸入到輸出的過程。(Borschev et al.,2004:2)。 值得注意的是,FSA 只能進行狀態間的變化,不能進行產出。 為了彌補這一不足,有限狀態轉換器應運而生,與自動機不同的是,有限狀態轉換器不僅能夠改變狀態,還可進行相應產出。 有限狀態轉換器不僅可以描述輸入到輸出的過程,還可以產出輸出項(即表層結構)。 音系改寫規則和兩級規則是有限狀態轉換器最明顯的兩個應用。

兩級規則(Two-level Rules)最早由寇斯克尼彌(Koskenniemi,1983)提出,用于建構計算機模型分析詞形的認知和產出。 寇斯克尼彌構建了他的基于約束的模型,該模型不依賴于規則編譯器、組合或任何其他有限狀態算法,他稱之為兩級形態學。 寇斯克尼彌早先發明了一種用有限狀態術語來描述音系交替的新方法。 與中間階段的級聯規則和它們導致的計算問題不同,規則可以被認為是直接約束詞串表層的語句。 多個規則不會按順序應用,而是并行應用。 每條規則都會限制某種詞匯/表面對應,允許、要求或禁止相對應的環境。 他的兩級形態學基于三個思想:規則是并行應用的符號到符號約束,而不是像改寫規則那樣按順序應用;約束可以指詞匯語境、表層語境或同時指兩個語境;詞匯查找和形態分析同時進行。 同樣,一個復雜的音系規則通常包含多個子規則,底層形式每經過一個規則都會映射一個實際不存在的新詞匯形式,直到形成最終的表層形式。 整個音系變化過程只需輸入、輸出和轉換器三個組成成分。 有限狀態轉換器將音系底層形式作為輸入形式,表層形式為輸出形式,音系改寫過程如圖3 所示(Beesley et al.,1992:2):

圖3 詞匯形式-表層形式中的有限狀態轉換器

從圖3 可以看出,有限狀態轉換器將多個規則組合成一個轉換器,壓縮成詞匯形式(底層形式)到表層形式過程中的唯一規則。 此過程模擬了音系底層形式到表層形式的變化,極大簡化了形態規則、音系規則等,降低了規則的復雜性。 兩級模型與經典生成音系學的不同之處在于它提出了平行規則而不是連續規則。 這樣就避免了單個詞形派生過程中中間階段的存在。 “兩級模型”這個名稱反映了這種設置,其中只有詞法和表層“存在”,甚至在邏輯上也沒有中間層。 OT 框架下的音系學家,對傳統的有序改寫規則進行了尖銳批判。 OT 理論就是一個兩級理論,具有相似的并行制約條件,許多優選制約條件都可以簡單地表示為兩級規則。

2.1.1 音系改寫規則中的有限狀態模式

20 世紀60 年代形成的經典生成音系學理論,由一系列有序的改寫規則(rewriting rules)組成,通過一系列推導過程將抽象的底層音系形式轉換為表層語音形式(Chomsky et al., 1968)。 音系規則用來描述音系底層形式到表層形式的變化規律,是經典生成音系學的理論基礎,通常用改寫規則來表示。 音系改寫規則通常與詞匯形態變化形式相關,如φ→ψ/λ___ρ,其中φ 是替換的目標,ψ 是替換后的形式,λ 是替換目標的左邊語境,ρ 是替換目標的右邊語境,所有這四個成分都是常規表達式(Hetherington,2001:1)。 這個表達式和經典生成音系學中的改寫規則“A→B/X___Y”一樣,當A出現在X 和Y 之間的語境中時,A 要發生音變,變成B,也就是“XAY→XBY”。 自然語言中的現象通過形式化的規則,就成為音系的推導公式。 在計算音系學中,這些規則被稱為語境敏感改寫規則(Context-sensitive Rewrite Rules),它要比普通表達式或者語境自由改寫規則(Context-free Rewrite Rules)更加強大。

有限狀態轉換器在音系改寫規則中的應用十分普遍。 勞瑞·卡爾杜恩(Lauri Karttunen)(1998:3)以約克茨語①約克茨語(Yokuts):美洲土著人約克茨人所用的語言,以前主要居住在圣華金河谷南部和內華達山脈附近的山腳下,也可以稱為Yawelmani 語。(Yokuts)為例,描述了該語言中元音交替的三個過程:圓唇化(rounding)、低音化(lowering)、縮短(shortening)。 當然,該語言里存在著共謀現象(Conspiracy)和絕對中和化(absolute neutralization)問題,很多學者都對此做過討論,在此不做贅述。 以下以[?u:t+hIn]→[?othIn]為例,探究其中元音從輸入到輸出經歷的三個步驟,如圖4 所示:

圖4 約克茨語中元音交替的改寫三個過程②圖4 和圖5 中的符號“.o.”表示組合操作。

從圖4 可以看出,[?u:t+hIn]→[?othIn]的過程經歷了圓唇化、低音化、縮短三個步驟,[?u:thIn]首先經過圓唇化變成[?u:thun],再經過低音化變成[?o:thun],最后元音的長音縮短變成[?othun]。 約克茨語中的元音變化規則明顯,順序固定,適用于有限狀態模式。 通過將三個規則合并可得到唯一轉換器,如圖5 所示:

圖5 約克茨語中的元音交替的組合

通過對比約克茨語元音交替過程,可以發現,運用有限狀態轉換器下的元音變化更簡潔清晰,實現了輸入到輸出的直接轉換,減少中間環節,明顯優于傳統音系改寫規則。 兩級模型避免了非常有問題的規則排序,其作為過程模型之所以具有吸引力,也是因為它是基于有限狀態自動機這種簡單裝置,它們可以通過多種網絡和設備來實現。 總之,有限狀態模式在音系改寫規則上的應用十分普遍,有限狀態轉換器是對多個規則的合并,是在傳統音系規則上的進一步創新。

2.1.2 有限元方法在兩級規則上的應用

寇斯克尼彌最早于1983 年提出有限狀態下的兩級模型(Two-level Model)。 和音系的改寫規則類似,兩級規則也是生成音系學對音系底層形式到表層形式的描述。 這一理論最初用于芬蘭語形態學的研究,后被廣泛應用于各種自然語言。 該模型由三種形式(形態、詞匯和表層表征)和兩個與它們相關的規則系統(詞庫規則和音系規則)組成,如圖6 所示:

圖6 兩級模型圖

如圖6 所示,該模型可以用有限狀態轉換器表示,并且易于實現。 事實上,該模型有兩個方面:一方面它屬于描述音系現象的形式主義方法,另一方面,它是一種計算裝置,它將特定語言的描述為能夠識別和生成詞匯形式的操作系統。 兩級規則的兩級性指的是詞匯層(lexical form)和表層(surface form)。 自然語言中經常會存在底層形式與表層形式不一致的情況,兩級規則的出現就是為了合理解釋這兩個層級的差異現象(Koskenniemi et al.,1988:335)。 如3.1.1 中提到的約克茨語的元音交替過程也可以用兩級規則來解釋(Karttunen, 1998:3)。

與有限狀態模式在音系改寫規則中的應用相同的是:元音的圓唇化、低音化、縮短三個規則都被組合成一個有限狀態轉換器,降低了規則的復雜性。 不同的是,音系改寫規則中,規則之間遵循嚴格的順序,而兩級規則中轉換器內部規則之間處于平等地位,沒有順序性。 依據圖7 所示的規則,約克茨語的圓唇化通過詞匯環境的控制來實現,而低音化和縮短的共同影響則是[?u:t+hIn]中的u 變成了o。 因此,這三個規則之間不存在順序性,每一個規則的使用和其對應的輸入項無關,可單獨構成一個大的規則。 這三個規則共同構建了一個有限狀態轉換器,再與輸入聯系起來。 因此,改寫規則的基本計算操作是組合,涉及將規則應用于語符列以及合并規則本身;而對于兩級規則,相應的操作是交叉組合和融合交叉。

圖7 約克茨語元音交替中的兩級規則圖式

兩級規則在其他語言中同樣適用。 寇斯克尼彌等(1988:335)以芬蘭語中“lasi”(意為“玻璃”)為例,分析了兩級規則中的詞匯形式和表層形式。 芬蘭語中“玻璃”一詞在表示“部分”的復數形式時,其詞匯形式為“lasiIA”,這里“lasi”為詞干,“I”為復數詞尾,“A”為表示“部分”概念的詞尾,而其復數的表層形式為“laseja”。 從“lasi”到“laseja”的變化,蘊含著三個變化,這三個變化可以分別用兩級規則和音系改寫規則分析如下:

(1)兩級規則:i: e<=>___I:

音系改寫規則:i→e/___I

芬蘭語中“i”只有在后接復數后綴“I”時才會變成“e”。 如“lasi”進行單復數轉化時,詞干最后的“i”受到后面的“I”的影響變成了“e”。 即[lasiIA]→[laseIA],那么

(2)兩級規則:I: j <=>:V___:V

音系改寫規則:I→j /V___V

芬蘭語中,詞綴“I”和詞尾“A”都對應元音,根據(1)可知“I”前的音位“i”變成了“e”,“I”在兩個元音之間變成了語素“j”,即[lasiIA]→[lasejA]。 由“A”到“a”的過程實際上是元音和諧的過程

(3)[A ∶a|O ∶o|U ∶u]=>∶Vback∶Vnonfront?

最后一個音位嚴格遵守元音和諧規則,要求詞尾元音和詞干元音在前后特征上保持一致,因此,“A”受詞根“e”[+前位性]特征的影響,變成了前元音“a”,即[lasejA]→[laseja],而中間的元音只要不是前元音,任何元音都可分布于此。 當然,規則(3)并不屬于兩級規則,因為輸入輸出之間并不是雙向的。 從以上分析可以看出,芬蘭語中詞匯底層到表層的轉變,同樣可以利用有限狀態模式來完成,通過將(1)、(2)兩個兩級規則組合起來形成一個有限狀態轉換器。

總之,從有限狀態模式在音系改寫規則和兩級規則上的應用可以看出,它們對約克茨語的描述是相同的,都是從底層形式到表層形式的映射,只是從不同的角度將復雜的元音轉換關系簡化為更易理解操作的音系關系(Karttunen,1998:4)。 當然,基于經典音位學、弗斯(Firthian)音系學和自然生成音系學(所有這些都是陳述音系學方法),兩種基于約束的方法都是通過音系規則約束引入,從而導致其分析與陳述音系學非常相似。 音系改寫規則和兩級規則的共同點是都以FSA 為計算基礎,用于解釋語言中的普遍聯系。 音系改寫規則中規則之間具有嚴格的順序性,而兩級規則中條件之間是對立平等的。 值得注意的是,音系改寫規則中的各規則之間是垂直分布的,而雙約束關系將滿足相同語境的規則結合起來,形成平行的有限狀態轉換器。 也就是說,音系改寫規則描述的是不同情境下的規則,且規則間存在順序性。 兩級規則適用于相同語境的規則集合,對順序性沒有要求。 同時,前者的核心在于組合,通過將規則順序性連接起來形成有限狀態轉換器,而后者更關注規則之間的相互關系和相互影響。 綜上所述,有限狀態模式可以用來描述音系現象,通過規則組合而得到有限狀態轉換器,從而簡化中間環節,對理解和優化音系規則具有重要意義。

2.2 聯結主義方法

除有限狀態模式外,聯結主義方法(Connectionist Methods)也是計算音系學經常使用的一種研究手段。 這一理論認為“復雜的認知能力來自簡單處理單位,即神經元之間的互動,像語言這樣的復雜行為反應了這些神經網絡的基本特點”,人類對行為和精神狀態的理解都是基于對大腦神經元的認知(趙忠德 等,2011:367)。 聯結主義方法也被稱為平行分布處理方法,最初產生于發展心理學,在20 世紀80 年代成為一種流行的研究方法。 該方法主要用來解釋人類行為出現的方式和原因,模擬人類認知習得、知識存儲和信息提取,與認知科學緊密相關,廣泛應用于語言學各個領域,如語言處理、語言感知等。 盡管聯結主義方法在不同領域的應用各不相同,但都蘊含著認知科學中的“連接”思想。 知識起源的兩種觀點——先天遺傳說和后天培養說——都與聯結主義相關。 先天遺傳說不僅是基因間相互作用的結果,還受外界環境的影響(Elman et al.,1996:xi)。 同樣,后天習得的過程也會受到某些特定基因的影響。 因此,這兩種觀點并不是簡單的對立關系,而是相互聯系,共同作用。 聯結主義倡議以許多相互聯結且平行運作的單元所構成的網絡,來仿真人類的信息處理過程(趙永剛,2012:38)。 聯結主義方法的核心就是系統內部之間的相互聯系,各個分子間相互刺激,從而共同維護系統的穩定性。

聯結主義方法是一個由神經元和權重(weights)組成的復雜網絡系統,核心是平行分布式處理(Parallel Distribution Processing)和浮現特征(Emergentism)(Elman et al.,1996:50)。 聯結主義方法是一個非常復雜的網絡系統,由兩個基本元素組成:組成元素(也叫節點或單元,類似人造神經元)和元素間的加權關系(Elman et al.,1996)。 節點從輸入中選擇合適的元素,輸入到下一個節點,傳送刺激,構成完整網絡系統。 由于元素間的加權關系不同,節點之間的關系也存在差異,部分節點聯系緊密,部分節點間聯系不大。 刺激從一個節點傳遞到另一個節點,兩個節點的聯系越緊密,傳遞的刺激越強,反之則越弱。 詹姆斯·麥克萊蘭德(James McClelland)等(2009)提出自然語言處理實際是模擬大腦信息處理的過程,無數人造神經元共同組成網絡系統,每個神經元再通過這個網絡系統同時作用,將刺激傳遞下去。 大多數情況下,輸出是多個刺激共同作用的結果。

正是因為人類的認知行為是刺激通過神經網絡傳遞下去的,信息傳遞的方式就顯得尤為重要。戴維·普拉特(Dawid Plaut)(1998:144)介紹了聯結主義方法下的三種信息流方法:正反饋神經網絡、重復反饋式神經網絡和多模塊神經網絡。 它們分別反映了信息傳遞的三種方向。 其中,正反饋是神經系統網絡最簡單的結構,即刺激是從輸入到輸出的單向傳遞,方向固定,功能單一。 但實際上自然語言還受到時間、環境等其他多重因素的影響,因此這一理論也存在缺陷。 重復反饋式神經網絡是更符合現實情況的信息流方法,它強調系統中神經元相互作用直到實現相對穩定的動態平衡。 丹尼斯·馬雷沙爾(Denis Mareschal)(2003:32)通過對三四個月幼兒關注點的變化與表征構建的關系進行研究,總結出這一過程的聯結神經網絡,如圖8 所示:

圖8 嬰兒對新信息感知過程及自動解碼的神經網絡

圖8(a)表示嬰兒對新信息的感知過程,圖8(b)模擬了嬰兒神經網絡的自動解碼過程。 該圖主要反映了幼兒關注點變化過程,符合正反饋神經網絡的特點。 假設幼兒先前接觸過有關“貓”形象的輸入,那么在同時接收到“貓”和“狗”的照片時,幼兒對狗的關注度會更高。 因為“狗”在這一情境下是新的輸入,幼兒會對新信息投入更多關注,并對其解碼處理,然后變成自己的內化知識。 從該實驗中可以得出:幼兒對新信息表現出更大的興趣,通過對新信息進行處理,內化成自身知識的一部分。 同時值得注意的是,幼兒吸取的知識往往是范疇化的知識,如在看到“狗”的形象時,不會僅僅是對特定的某一只狗的理解,而是對種群的整體認知。 所以下次再接收到另一只“狗”的形象時,盡管和之前的形象不同,但仍當作已有認知對待,不會投入更多關注。 該原理類似人類活動中的條件反射。 人類往往通過實踐習得能力,通過對環境產生刺激進行反應,越陌生的刺激系統處理時間越長,相同或類似刺激需要的時間則較短。

聯結主義方法還可以用來解釋很多自然語音現象,如發音同化(Sound Assimilation)和元音和諧(Vowel Harmony)。 元音和諧作為一種常見的語言現象,通常是指一個單詞中的所有元音相互影響,最終達到和諧狀態,包含某些相同或者相似的特征。 以芬蘭語(Finnish)中元音和諧現象為例,研究者通常利用兩級規則分析芬蘭語中的元音和諧現象,并將其劃分為兩個平行條件,指出芬蘭語詞干中的最后一個元音會影響后綴元音的選擇。 喬治·萊考夫(George Lakoff)(1988)討論了音系過程中的三層表征:底層形式的形態音位層(morphophonemic level)、音位層(phonemic Level)和表層形式的語音層(phonetic level),并指出這三個層次之間為正反饋關系。 安尼莉·提卡拉(Anneli Tikkala)基于神經網絡系統,提出一種名為FinnPro 的研究工具,建立交互刺激傳遞模型(Interactive Spreading Activation Models)和模擬詞匯產出過程(Word Production Process),研究芬蘭語中的元音和諧現象,該原理類似人類活動中的條件反射。 和有限狀態模式不同的是,提卡拉首次利用神經網絡來研究芬蘭語中的元音和諧現象。 這種網絡系統又包含選擇網絡(Selection Network)和控制網絡(Control Network)兩個子系統。 芬蘭語中包含八種元音,根據元音和諧規則,可將其分為三類:前元音、后元音和中元音。 其中,前元音和后元音屬于和諧元音。 芬蘭語中存在兩種元音和諧現象,一種是詞干中的元音和諧,一種是在給詞干添加詞綴時產生的后綴和諧。 圖9 是提卡拉從神經網絡的角度分析了芬蘭語中元音和諧的原理。

圖9 芬蘭語中的元音和諧的神經網絡系統

如圖9 所示,利用FinnPro 工具所研究的元音和諧過程,明確將音節層和音位層分隔開來。 這一系統下的元音和諧受四個節點控制:刺激前節點和終止前節點、刺激后節點和終止后節點。 如圖所示,實線代表刺激傳遞的方向,虛線代表終止。 箭頭表示刺激傳遞的方向。 刺激前節點激活所有前元音:/y ? ?/,刺激后節點激活所有后元音:/u a o/,它們同時也可以反過來刺激自身。 元音之間相互抑制。 刺激前節點將刺激傳遞到終止前節點,刺激后節點傳遞刺激至終止后節點。 終止前節點抑制終止后節點和任何包含后元音的音節核的產生。 反過來,終止后節點也會抑制終止前節點和任何包含前元音音節核的產生。 節點與節點之間相互作用,互為掣肘。

綜上所述,自然語言的音系結構十分復雜,受到多種制約條件的限制,很難用經典音系學中簡單的形式化規則來描述音系變化過程。 聯結主義方法為語言分析提供了計算機模擬的支持,也構建了音系本質研究的計算基礎(Touretzky et al.,1989:372)。 當然,架構聯結機制模型,分析音位在多個位置的同時插入、刪除、突變等現象,對分析音系現象也極具開創性。

3 計算音系學發展現狀

3.1 國外計算音系學發展現狀

隨著人工智能的發展,計算音系學開始引起廣泛關注,語音技術也成為學界關注的熱點。 當前國內外計算語言學發展迅猛,計算音系學作為計算語言學的一個分支,理應得到足夠重視。 國際計算語言學協會計算音系學特別研究小組(ACL Special Interest Group in Computational Phonology,簡稱:SIGPHON)于1991 年成立,專注于計算音系學的研究。 整體來看,國際上有關計算語言學的成果較多,但專門針對計算音系學的研究成果依然較少。 隨著自然信息處理和人工智能的發展,計算音系學必將成為研究的重點領域。

國外語言研究者往往將計算音系學與語言現象結合起來,以兩種研究方法為核心的音系學研究方法,探究其跨學科功能。 尤其是在自動學習和語音交互上,如優選論在音系規則中的功能、聯結主義方法在語言處理中的應用等。 計算音系學發展初期,海外研究者汲取各領域的知識,迎來了理論發展的高潮期,相關理論蓬勃發展(Johnson,1972;Elman et al.,1996;Bird,1994;Plaut,1998)。伯德(1995)指出了計算音系學的兩大研究方法:有限狀態模式和聯結主義方法。 基礎框架構建之后,學術研究者開始將目光轉向理論在自然語言現象中的具體應用(Karttunen,1998;Koskenniemi et al.,1988;Hetherington,2001)。 與此同時,還有一些跨學科學者通過建立模型來模擬語言產出過程(Tikkala,2000;Mareschal,2003)。 盡管計算音系學的發展已經有了一段時間的歷史,但整體還處于學科發展的建設階段。

目前,進行計算語言學研究的國家主要有美國、英國、德國等。 美國的語言學研究一直位居世界前列,除了傳統語言學專業,美國大學還非常注重語言學和其他專業結合產生的交叉學科,如計算語言學、心理語言學、神經語言學等。 其中,這些大學開設的計算語言學專業通常是有計算機系和語言學系聯合培養,如斯坦福大學、賓夕法尼亞大學、芝加哥大學、愛丁堡大學等;大多數大學都將這一專業設置在計算機或工程學院下,少數學校的語言學系也有這一專業。 開設語音處理相關專業更是寥寥無幾,英國愛丁堡大學的語音與語言處理專業(MSc Speech and Language Processing)在國際上較為有名。

3.2 國內計算音系學發展現狀

與國外相比,國內在計算音系學領域的探索相對較少,且集中在二語習得領域,與自然語言現象的結合并不是很多。 國內有限狀態模式主要應用在自然語言處理方面,而聯結主義的探索較為普遍。 葛魯嘉(1994)第一次提到聯結主義研究方法,指出這一手段在認知科學上的重要性。 后來的研究者逐步將聯結主義應用在語言學上,特別是二語習得。 楊劍峰和舒華(2008)通過研究英語詞匯閱讀的平行分布方法是否同樣適用于漢字閱讀,得出中英文具有普遍的加工機制。 值得注意的是,和喬姆斯基不同的是,聯結主義方法主張規則不具有先天性,而是“基于對大量輸入語料的統計學習而浮現出來的特征”。 王邁(2015)在前人研究的基礎上,較為全面地將聯結主義的主要特征總結為:節點、關系、并行、容錯性、自動學習、遺忘和規則浮現。 同時指出對無限集的分類是以破壞細節特征規則為代價的,并不是最好的選擇,這是進行聯結主義分析時需要注意的問題。 柴春麗(2010)指出語感是聯結主義方法的一個典型應用,正是由于輸入的一次次重復,刺激了神經網絡系統,才促使了權重的增加,熟練是學習的表面產物。 盡管頻率對語言習得其至關重要的作用,周昱(2014)卻強調頻率并不是決定性的唯一條件,如二語學習者接觸英語冠詞的頻率最高,但掌握順序卻靠后。

整體來看,現階段國內使用計算方法分析或者模擬音系現象研究還不是很多。 一方面,國內語言學研究者更偏向語言本體的研究,提到計算往往都望而卻步,語言學學者缺乏計算機、數學背景,在這一領域的研究中受到局限。 另一方面,盡管碩士階段國內開設語言學專業的院校非常多,但研究理論語言學的學者相較較少,基于學習難度和就業需要,可以開設這個專業方向的高校寥寥無幾,學生更多偏向應用語言學領域。 過去,語音相關研究基本都是計算機專業的人在做,隨著自然語言處理、人工智能、機器翻譯等領域遭遇瓶頸,研究者發現計算機科學家并不能解決所有語言問題,這一領域需要語言學家的參與。 目前,越來越多的公司開始招募語言學專業的人才,如谷歌、訊飛等科技公司。 面對計算語言學發展的“黃金時期”,葉子(2017)提出高校語言學專業人才培養需要進行兩方面轉變:“首先,語言學基礎學科,如音系學、句法學、語義學等應當加大形式化描述的比例,要讓學生在語言學實例中感受數學模型的運用。 其次,要加大基礎課程中數學學科的分量。 對語言學來說,由于支撐核心的句法語義現象的數學主要是離散數學,因此有必要將這門課程作為重點課程。”

4 結語

綜上所述,本文通過概述計算音系學基本定義、分析其兩大主要研究方法的具體應用、國內外培養現狀,旨在系統介紹這一學科,讓讀者初步了解計算音系學這一領域。 計算音系學作為計算語言學下的一個分支,利用計算方法來研究音系學中遇到的問題,與自然語言處理相得益彰。 計算方法的利用可以在很大程度上系統化、模式化語音產出和感知的過程,降低語音研究者的時間成本。同時也應該看到,計算機遵循指令而不會做出判斷,雖然非常擅長評估語法的一致性和描述的充分性,但除非程序員提供必要的信息(即衡量由語法分配給字符串結構準確性的標準),否則他們無法測試解釋充分性。 總之,在智能化快速發展的新時代,語言學家應當轉換自己的身份,積極參與并融合其他學科最新發展,共同推進人類語言知識的更新與進步。 人工智能是新時代的創新,人類對人工智能既有向往又有敬畏。 事實上,該研究的意義在于提高人類生活的智能化,給人類提供生產或者生活的便利,而不是完全取代人類大腦,解放人類雙手。 語音輸入、語音識別技術的開發,也可以進一步推進生產和生活的智能化,提高人類的生活質量。

猜你喜歡
規則語言研究
FMS與YBT相關性的實證研究
撐竿跳規則的制定
遼代千人邑研究述論
數獨的規則和演變
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
讓語言描寫搖曳多姿
讓規則不規則
Coco薇(2017年11期)2018-01-03 20:59:57
TPP反腐敗規則對我國的啟示
主站蜘蛛池模板: 国产精品爽爽va在线无码观看 | 真人免费一级毛片一区二区| a色毛片免费视频| 不卡午夜视频| 国产区人妖精品人妖精品视频| 欧美一区二区自偷自拍视频| 丝袜国产一区| 四虎影院国产| 免费国产黄线在线观看| 亚洲三级电影在线播放| 国产18在线| 一区二区欧美日韩高清免费| 国产精品免费福利久久播放| 成人在线第一页| 国产精选小视频在线观看| 成人在线不卡| 国产乱人伦AV在线A| 国产在线无码一区二区三区| 国产无码精品在线播放| 国产成人高清精品免费软件| 五月婷婷亚洲综合| 国产成人h在线观看网站站| 欧美三级日韩三级| 青草娱乐极品免费视频| 欧美在线视频不卡第一页| 国产综合另类小说色区色噜噜| 99视频在线免费看| 日韩精品无码不卡无码| 国产精品网曝门免费视频| 亚洲男人的天堂视频| 婷婷六月综合网| 亚洲成人精品在线| 久青草国产高清在线视频| 爆操波多野结衣| 国产传媒一区二区三区四区五区| 就去吻亚洲精品国产欧美| 国产一级视频久久| 国产精品99一区不卡| 青草91视频免费观看| 国产三级国产精品国产普男人 | 青青热久免费精品视频6| 亚洲日本在线免费观看| 尤物成AV人片在线观看| 2020精品极品国产色在线观看| 综合色88| 中日无码在线观看| 国产成人1024精品下载| 制服丝袜一区| 一区二区三区国产精品视频| 久久青草精品一区二区三区| 91精品专区| 伊人久久婷婷| 国产剧情国内精品原创| 久久综合一个色综合网| 国产成人a毛片在线| 国产无遮挡裸体免费视频| 国产在线精品99一区不卡| 久青草免费视频| 精品久久香蕉国产线看观看gif | 欧洲免费精品视频在线| 欧美在线精品怡红院| 国产h视频免费观看| 国产91线观看| 日本a级免费| 中文字幕永久在线看| 国产全黄a一级毛片| 黄色福利在线| 在线精品欧美日韩| 午夜视频在线观看区二区| 亚洲国产欧美目韩成人综合| 中美日韩在线网免费毛片视频| 国产三级韩国三级理| 亚洲乱码精品久久久久..| 农村乱人伦一区二区| 欧美啪啪一区| 四虎成人免费毛片| www.亚洲一区| 国产日韩久久久久无码精品 | 久久青草视频| 国产在线精彩视频论坛| 欧美日韩理论| 日韩欧美国产成人|