黃睿紅



摘 要:本文使用Cite Space軟件,以2012-2022年期間WOS收錄的1564篇國外語音學領域感知與產出研究為主體,從研究機構及國家、作者、關鍵詞及關鍵詞聚類、關鍵詞突顯對語音學領域感知與產出的研究進行可視化分析,以追蹤和捕捉國外語音學領域感知與產出研究的發展現狀及研究前沿。結果表明,感知與產出領域跨學科趨勢明顯,新技術運用廣泛,語音意識、個體差異、音韻編碼等是研究前沿,感知相關的研究比產出豐富,關于感知與產出之間的關系尚未達成一致。
關鍵詞:感知;產出;Cite Space;知識圖譜;研究前沿
中圖分類號:H311? 文獻標識碼:A? 文章編號:1673-2596(2023)05-0056-08
一、引言
感知(perception)與產出(production)是第二語言語音習得研究中的關鍵問題,也是目前語音學領域研究的熱點之一。感知和產出是語音鏈的重要組成部分,對其的研究可以粗略分為三大類:一是語音感知;二是語音產出;三是語音感知與產出之間的關系。
20世紀70年代,范疇感知,即識別(identification)和區分(discrimination)連續變化的語音音段邊界(phonetic boundary),在幼兒語音習得領域研究得到廣泛開展。20世紀80年代,二語習得領域的語音學家,如Strange、Flege、Kuhl和Best等設計了針對成年人二語語音習得的實證研究,試圖探尋成年學習者對非母語語音的感知情況并找到科學合理的解釋。進入21世紀,中國國內的學者翻譯并總結了Flege等語音學家關于二語語音感知與產出方面的理論和模型,并結合理論開展漢語二語習得中感知與產出方面的研究[1]。
二語語音產出受到學習者母語語音系統的深刻影響。語音產出是發音產生的聽覺和聲學結果,也是語言加工的外在表現形式[2]。語音產出是從模仿開始并通過積累經驗在語言學、生理學和聲學層面感知和產出語音[3]。Flege通過實證研究發現二語語音產出存在等值匹配(Equivalence Classification)模式,即學習者總是把二語語音中的相似音素(Similar Phoneme)歸入母語某個語音范疇中[4]。
感知與產出領域主要有以下四種理論模型。母語磁吸模型(Native Language Magnet,NLM)認為母語者腦中存儲著對某一個音的感知形式。二語語音中的某個音與學習者母語系統中的相似音感知效果越相近,學習者將這個音與母語中相似音分開的難度越大[5]。Best提出的感知同化模型(Perceptual Assimilation Model,PAM)認為學習者傾向于把二語語音范疇歸類到與其發音相似的母語語音范疇[6]。Strange提出的自動選擇感知模型(Automatic Selective Perception,ASP)認為語音行為反映學習者對聲學信息的選擇和整合,學習者對二語和母語的聽覺能力并不能決定其二語語音行為[7]。Flege于1995年提出了語音學習模型(Speech Learning Model,SLM),并認為二語語音學習基本是從學習者的母語范疇開始的。該模型認為,二語語音感知先于產出,且感知能力會極大地影響產出能力[8]。
二、數據來源與研究工具
(一)數據來源
利用WOS的SCI-EXPANDED、SSCI、CPCI-S、CPCI-SSH五大引文庫對2012—2022年期間以TS=“perception” and “production”為主題詞的文獻進行高級檢索,文獻類型設置為“文章(article)”,文獻出版時間設定為“2012—2022年”,得到有效文獻17358篇。通過WOS類別篩選保留“linguistics”“psychology”“psychology experimental”“audiology speech language pathology”“neurosciences”“language linguistics”“acoustics”8個與語言學相關的類別,剔除“agriculture”“business management”等與語言學無關的類別,從WOS導出1627篇文獻的全記錄txt文件。利用Cite Space軟件自動去重功能,最終得到1564篇文獻。這樣的文獻獲取方式和文獻篩選方法能較好地平衡總文獻的查全率和查準率,保證基礎數據的代表性和權威性。
(二)研究工具
Cite Space軟件是由美國德雷克塞爾大學信息科學與技術學院和大連理工大學WISE實驗室聯合開發的信息可視化軟件,可以測量和分析研究數據,展示知識圖譜可視化研究領域的研究趨勢和合作情況[9]。本文利用Cite Space軟件,通過對研究國家(地區)、研究作者、研究機構、關鍵詞、關鍵詞聚類及關鍵詞突現的分析,總結了國外語言學領域感知與產出研究的研究熱點和研究趨勢。
數據導入Cite Space 5.8.R3,軟件參數設置如下:時間區域(Time Slicing)為“2012年1月—2022年12月”,時間切片(Year Per Slice)為“1”,節點類型(node types)分別為“作者(author)”“國家(country)”“機構(institution)”“關鍵詞(keyword)”。
三、結果與討論
(一)文獻計量現狀
利用WOS網站自帶的引文分析功能對1564篇文獻及其被引頻次進行統計分析,探究國外感知與產出研究的基本發展情況。經分析,2012—2022年國外感知與產出研究的文獻數量在2022年前一直保持穩定的數量,大約每年有140—160篇文章產出,研究文獻年產出較為穩定,說明感知與產出領域的研究發展平穩。感知與產出領域的文獻被引頻次逐年上升,在2020年后曲線增陡,增速加快,說明語言學領域感知與產出研究熱度逐步升高。由于在檢索時文獻發表時間限定在2022年6月30日前,所以2022年的發文量為平均值的一半左右,符合事物發展的普遍規律。
(二)研究現狀分析
1.研究國家(地區)分布
通過對研究所在的國家(地區)進行文獻計量,可以明確國外對感知與產出研究的地域空間分布,從而分析出不同國家(地區)在該領域的關注度和貢獻度。首先將分析對象設定為“國家(地區)”,在Cite Space軟件中的Node Types界面選取“country”,經數據處理分析得到國外感知與產出研究的國家(地區)可視化圖譜。國外感知與產出研究的國家(地區)可視化圖譜中共有節點74個,連線65條,網絡密度0.0241。以上數據說明感知與產出的相關研究共涉及74個國家(地區),這些國家和地區之間的研究互動過65次,總體合作程度不高。目前國家(地區)間的合作互動以美國為中心,英國、加拿大、德國等國家(地區)之間的合作居于次位。
在可視化圖譜中,中介中心性(Centrality)表示相同節點在某領域當中的中介作用,凸顯節點在結構中的重要程度。中介中心性數值>0.1即說明該節點的影響力較強。突現性(Burst)數值通過突增算法得出,突現性高說明未來具有爆發力和創新性。Sigma值由公式Sigma=(Centrality+1)* Burstness(突現指數)得出。Sigma值可以用來識別創新性文獻或者創新性主題。
由表1可以得知,2012—2020年美國、加拿大、英國、德國和法國占據了國外有關感知與產出研究的文獻總量排名的前五位。作為語音學領域的熱點研究,感知與產出研究在各國研究的規模與國家(地區)的發展水平密切相關。
位列第七的中國發文量85,中心度為0.01,影響力與美國、英國還有一定差距,但中國的發文突現性為4.91,位列第一,Sigma為1.04,體現中國在感知與產出方面的研究勢頭正猛,研究潛力大,未來應加強國際間的學術交流合作,提升我國在感知與產出研究領域的學術影響力。
2.研究作者分布
核心作者的可視化分布可以幫助我們了解該研究領域內主要研究者狀況。Cite Space結合作者發文數量與引用率,在知識圖譜中突顯具有高影響力的作者。
在Cite Space軟件中,選取節點類型為“作者”,時間跨度依舊設定為“2012—2022年”,單個時間區分長度為“1年”,節點條件(Threshold)設置被引頻次為“5以上”,得到2012—2022年WOS數據庫中感知與產出領域研究作者被引頻次共現圖。研究發現該領域內有一定量的研究者合作發文,高頻次作者中有一定比例的作者形成了合作網絡,但其余的多數研究者仍以獨立發文為主,研究作者呈現出明顯的分散狀態。
據表2(發文量≥6篇)的研究作者信息可見,2012—2022年國外感知與產出領域排名前五的作者為Katherine Demuth、Barbara Tillmann、Lucie Menard、Holger Mitterer和Benjamin Munson。其中Katherine Demuth和Barbara Tillmann發文數量最多,為8篇,引用率也居高位次。
Katherine Demuth發現在澳大利亞英語母語兒童中,閉音/l/(peel)的掌握要比起始音/l/(Leap)晚,兒童對起始音/l/的產生和感知的差異與生理和語音發展都有關[10]。Barbara Tillmann研究音樂和語言認知研究的相似性,認為音樂認知研究為理解語言加工、語音感知與產出以及其他結構化刺激加工提供了啟示。Lucie Menard等研究了先天性視覺障礙對成人語音產出的影響,在正常和擾動(在唇間插入25mm直徑管道)條件下讓視力正常者和盲人進行了法語元音/u/的發音,雖然所有被試在受干擾的情況下都將舌頭后移,但盲人更多地修改了舌形參數[11]。Holger Mitterer通過眼動實驗發現荷蘭語中擦音在早期就被感知學習改變,進一步說明感知學習影響語音加工的早期階段[12]。Benjamin Munson用視覺模擬刻度(VAS)評價兒童自然產生的/s/-/θ/、 /t/-/k/和/d/-/ɡ/這三個目標音在單詞開頭的位置,并考察了有經驗的言語病理學家(SLPs)與沒有經驗的人在感知兒童語音細節方面的不同,證明有言語病理學工作經驗的人會更好地感知兒童說話時的語音細節[13]。
3.研究機構分布
感知與產出研究領域的研究機構分布圖譜中包括307個節點,508條連線,網絡密度為0.0108。據表3信息可見,在國外感知與產出領域中高等院校是研究主力,其中麥吉爾大學(McGill Univ)、英國倫敦大學(UCL)、哈斯金斯實驗室(Haskins Labs Inc)、蒙特利爾大學(Montreal University)是核心研究機構。麥吉爾大學發文數量為42篇,居于首位。英國倫敦大學緊隨其后,發文40篇,且具有高中介中心度(Centrality=0.24),英國倫敦大學與蒙特利爾大學研究合作密切,蒙特利爾大學發文32篇,位列第四。位列第三的是美國耶魯大學的哈斯金斯實驗室,發文38篇。表3顯示,拉德堡德大學(Radboud Univ Nijmegen, Burst=3.17, Sigma=1.33)、法國國家科學研究中心(CNRS, Burst=2.7, Sigma=1.22)和麥考瑞大學(Macquarie Univ, Burst=3.1, Sigma=1.18)在感知與產出領域具有高創新性,2012年至2022年的相關發文數量突增,具有極高的研究潛力。
(三)研究前沿和熱點分析
1.研究前沿分析
Cite Space通過詞頻統計、關鍵詞共現、關鍵詞聚類,聚焦某一領域的研究熱點。詞頻分析方法就是通過在文獻信息中提取能夠表達文獻核心內容的關鍵詞或主題詞頻次的高低分布,來研究該領域發展動向和研究熱點的方法。關鍵詞聚類則是對文獻主要關鍵詞的高度凝練與概括,對文獻的關鍵詞進行詞頻分析后,找出頻率相對較高的關鍵詞聚類成主題詞,這在一定程度上可反映該領域形成了哪幾個研究類團。節點的大小與關鍵詞出現的頻次成正比,各節點間的連線代表不同關鍵詞之間的共現關系,關鍵詞之間共現關系的強度由連線的粗細反映[14]。
通過Cite Space進行詞頻和關鍵詞聚類分析后,可以得到國外感知與產出研究的關鍵詞聚類知識圖譜,圖譜中N=184,E=263,網絡密度為0.0156,每個時間段排在前50的文獻中一共包括了184個關鍵詞,圖譜共有263條連線。現將頻次排名前20的關鍵詞制成表4。
通過表4可知,國外感知與產出研究領域中出現頻次最高的詞是“perception”,一共出現588次。高頻詞反映出以“perception”為中心的其他關鍵詞節點還有“language”“speech”“perception”“English”“acquisition”“discrimination”“brain”“recognition”“children”“FMRI”“frequency”等。國外感知與產出領域研究以感知研究為主,且對英語學習的研究數量較多。研究角度多聚焦于習得、認知、表征、可理解度、人腦語音感知和產出的機制神經等。研究理論多采用感知與產出方面的經典理論模型,如SLM、PAM、NLM等。近十年神經語言學研究技術FMRI是感知產出領域熱門的研究方法。在被試群體方面,針對兒童的語音感知和產出研究較多。
突現是指短時間內突然增長或者頻次明顯增加的關鍵詞。Cites Space的突變檢測計算可以檢測一個學科內研究興趣的驟變程度,反映研究前沿的時間變化規律和演化路徑。結合突現詞和關鍵詞,可以進行以下分析。第一,鏡像神經元(mirror neuron)、基地神經節(basal ganglia)、前運動皮質(premotor cortex)等關鍵詞的突現表明近年來感知與產出領域神經科學、腦科學、語音學習等相結合的研究趨勢。第二,語音知識和詞匯加工之間的關系也受到研究者們的關注,語音短時記憶在詞匯加工上發揮著重要作用。此外,許多研究發現,影響語言加工的因素,如經驗(experience)、短期記憶(short term memory)等會產生個人差異(individual difference),個人差異研究受到許多學者的關注[15]。
2.研究熱點分析
采用Cite Space對關鍵詞進行聚類,采用對數似然率算法,通過提取文獻的關鍵詞對聚類進行命名。Cite Space依據網絡結構和聚類的清晰度,提供了模塊值(Q值)和平均輪廓值(S值)兩個指標。聚類的模塊值可反映網絡的模塊度。該值越大,表明網絡的聚類效果越好。Q值一般在[0,1)區間內,Q>0.3就意味著劃分出來的社團結構是顯著的。聚類的平均輪廓值可反映網絡同質性的高低,該值越接近1說明網絡的同質性越高。當S值在0.5以上,一般認為聚類是合理的,若在0.7時,聚類是高效率的、令人信服的。
此次共得到了46個聚類,篩選出的前8個聚類(聚類大小>10)分別為“intelligibility(可理解度)”“speech(語音)”“eeg(腦電圖)”“fmri(功能性磁共振成像)”“voice onset time(發音起始時間,VOT)”“language(語言)”“English(英語)”“extended bandwidth(頻帶擴展)”。
由表6可見,本次共有8個聚類生成。聚類0的標簽是“可理解度”,指說話者的言語被實際理解的程度[16]。近年來,可理解度是國外語音教學的研究熱點,相關研究數量快速增加[17-21]。聚類1的標簽是“語音”。在此聚類下,感知、韻律、可預測性是重要的下一級標簽。2012年至2022年間,韻律及其可預測性是語音感知領域研究的熱點。聚類2和聚類3的標簽分別是“eeg”和“fmri”。這反映了近十年的研究熱點是將語音研究與腦科學和核磁共振技術結合,探索人類語音習得的神經機制。聚類4以“發音起始時間(VOT)”為標簽。在語音產出領域,塞音的研究最為廣泛,VOT是塞音最突出的聲學特征。近十年圍繞VOT開展的研究多聚焦于音韻發展和語言老化等,其中針對西班牙語的研究數量較多。
聚類5和聚類6的標簽分別為“語言”和“英語”,主要包括音韻編碼(phonological encoding)、音韻相似性(phonological similarity)、音節重量(syllable weight)、聲學線索(acoustic cue)和音位序列頻率(phonotactic probability)等。
聚類7標簽為“頻帶擴展”。在此聚類中,語音發展(speech development)、聲學特征(acoustic characteristics)突出。頻帶擴展在不改變信源編碼和網絡傳輸的前提下,在解碼重碼信號中人為添加高頻成分,能有效地增強音頻。隨著對聲學感知研究的深入,人們發現佩戴具有頻帶擴展屬性的助聽器可以幫助聽障兒童聽到聲音。
語音感知與產出領域跨學科研究趨勢愈加明顯。隨著語言學領域技術的飛速發展,越來越多的實驗設備和實驗方法被引入語音學領域。眼動實驗研究中,眼動儀可以同時追蹤被試的閱讀路徑和朗讀錄音。神經語言學領域的實驗設備如腦電圖(EEG)、腦磁圖(MEG)、功能性磁共振成像(fMRI)、功能性近紅外光譜技術(fNIRS)等技術也應用于語音感知方面的實驗中。
四、結論
據本文分析可得,從2012到2022年國外感知與產出領域研究發展迅速,研究論文數量呈快速增加趨勢。從研究現狀看,該領域跨學科研究趨勢明顯,語言學、醫學、心理學、教育學、人工智能等的交叉結合,在研究方法、研究目的、被試群體上都有明顯體現。在實驗方法上,研究者多結合EEG、FMRI等神經語言學技術探究人腦對語音習得的神經機制。在被試群體上,成人、兒童、單語者、多語者、聽障群體受到更多關注。目前感知與產出領域研究熱點包括個體差異、語音意識、可理解度、音韻編碼等,主要圍繞語音感知的神經機制和語音識別處理。
在感知和產出的研究發展中,研究者對語音感知和產出之間的關系仍然存在爭議。肌動理論(Motor Theory)和直接現實主義理論(Direct-Realist Theory)認為產出先于感知,而一般聽覺理論(General Auditory Theory)和語音學習模型(Speech Learning Model)則認為感知先于產出。總體而言,對語音產出的關注度不如語音感知高,語音產出方面的研究還有待增加。
——————————
參考文獻:
〔1〕常莉.語音感知和語音產出——二語語音習得研究梳辨[J].語文學刊(外語教育教學),2015(04):47-49.
〔2〕陳瑩.語音產出的實驗研究方法[J].外語研究,2021,38(05):6-11+32.
〔3〕Keyser, S.J. and K.N. Stevens. Enhancement and overlap in the speech chain[J]. Language, 2006, 82(01): 33-63.
〔4〕關雪.語音感知和語音產出關系的分析研究[D].哈爾濱:哈爾濱工業大學,2020.
〔5〕Kuhl P. K. Innate Predispositions and the Effects of Experience in Speech Perception: The Native Language Magnet Theory[A]. Boysson-bardis B., Schonen S., Jusczyk P., et al. Developmental Neurocognition: Speech and Face Processing in the First Year of Life[M]. Dordrecht: Springer Netherlands, 1993: 259–274.
〔6〕Best C. T. A direct realist view of cross-language speech perception[J]. Speech Perception & Linguistic Experience Issues in Cross Language Research, 1995.
〔7〕Strange W. Automatic selective perception (ASP) of first and second language speech: A working model[J]. Journal of Phonetics, 2011, 39(04): 456–466.
〔8〕Flege J. E. Production and perception of a novel, second-language phonetic contrast[J]. The Journal of the Acoustical Society of America,1993,93(03).
〔9〕陳悅等.CiteSpace知識圖譜的方法論功能[J].科學研究,2015,33(02):242-253.
〔10〕Lin S., Demuth K. Children's acquisition of English onset and coda/l: Articulatory evidence[J]. Journal of Speech, Language, and Hearing Research, 2015, 58(01): 13-27.
〔11〕Ménard L, Turgeon C, Trudeau-Fisette P, et al. Effects of blindness on production–perception relationships: Compensation strategies for a lip-tube perturbation of the French [u][J]. Clinical Linguistics & Phonetics, 2016, 30(3-5): 227-248.
〔12〕Mitterer H, Scharenborg O, McQueen J M. Phonological abstraction without phonemes in speech perception[J]. Cognition, 2013, 129(02): 356-361.
〔13〕Munson, B., J.M. Johnson and J. Edwards, The Role of Experience in the Perception of Phonetic Detail in Children's Speech: A Comparison Between Speech-Language Pathologists and Clinically Untrained Listeners[J]. American Journal of Speech-Language Pathology, 2012,21(02): 124-139.
〔14〕陳超美,陳悅.科學發現的結構與時間屬性[J].科學與管理,2014,34(03):27-32+81.
〔15〕Fu, R., The Influence of Individual Differences on Learning a Second Language[R]. Jeju Island: 2013 3rd Inernational Conference on Social Sciences and Society, 2013.
〔16〕Munro M J, Derwing T M, Morton S L. The mutual intelligibility of L2 speech[J]. Studies in second language acquisition, 2006, 28(01): 111-131.
〔17〕Fogerty D, Ahlstrom J B, Bologna W J, et al. Sentence intelligibility during segmental interruption and masking by speech-modulated noise: Effects of age and hearing loss[J]. The Journal of the Acoustical Society of America, 2015, 137(06): 3487-3501.
〔18〕Sewell A. The intranational intelligibility of Hong Kong English accents[J]. System, 2015, 49: 86-97.
〔19〕Orikasa M. The intelligibility of varieties of English in Japan[J]. World Englishes, 2016, 35(03): 355-371.
〔20〕Sheppard B E, Elliott N C, Baese-Berk M M. Comprehensibility and intelligibility of international student speech: Comparing perceptions of university EAP instructors and content faculty[J]. Journal of English for Academic Purposes, 2017, 26: 42-51.
〔21〕Crowther D, De Costa P I. Developing mutual intelligibility and conviviality in the 21st century classroom: Insights from English as a lingua franca and intercultural communication[J]. TESOL Quarterly, 2017, 51(02): 450-460.
(責任編輯 曹彩霞)
Abstract: This paper uses Cite Space software to visualize and analyze foreign speech perception and production that collected by WOS from 2012 to 2022. In terms of research institutions and countries, authors, keywords and keyword clustering, and keyword highlighting, this paper aims to track and capture the development of speech perception and production. The results indicate that there is a clear interdisciplinary trend in the field of perception and output, and new technologies are widely used. Speech awareness, individual differences, and phonological encoding are research frontiers. Research related to perception is more abundant than output, and there is no consensus on the relationship between perception and output.
Keywords: Perception; Production; Cite Space; Knowledge Graph; Research Frontier