尹穎堯+曹曉晨+田媛
計(jì)算語(yǔ)言學(xué)到底研究啥
北語(yǔ)的計(jì)算語(yǔ)言學(xué)開(kāi)設(shè)于全校唯一理工科學(xué)院信息科學(xué)學(xué)院(簡(jiǎn)稱(chēng)信科)。學(xué)院副書(shū)記李超是學(xué)院首屆本科學(xué)生,作為本碩博都在這兒讀的,徹頭徹尾的土著,講起北語(yǔ)信科和計(jì)算語(yǔ)言學(xué),他滔滔不絕。
北語(yǔ)信科的歷史有近三十年了,前身是計(jì)算機(jī)科學(xué)與技術(shù)系,成立于2000年,再之前,是1987年成立的中國(guó)第一個(gè)以漢語(yǔ)信息處理為主要研究方向的“語(yǔ)言信息處理研究所”。2014年,北語(yǔ)進(jìn)行了大部制改革,信科在原有的語(yǔ)言信息處理研究所基礎(chǔ)上,成立了另外三個(gè)研究所,分別是:大數(shù)據(jù)與語(yǔ)言教學(xué)研究所、語(yǔ)言監(jiān)測(cè)與社會(huì)計(jì)算研究所(國(guó)家語(yǔ)言監(jiān)測(cè)與研究平面媒體中心)和管理科學(xué)與工程研究所。幾個(gè)研究所基本上都與計(jì)算語(yǔ)言學(xué)學(xué)科直接相關(guān),分別對(duì)語(yǔ)言的教學(xué)、研究和應(yīng)用開(kāi)展深入的研究。信科的主要任務(wù)是培養(yǎng)外語(yǔ)水平出色,具有信息處理基本素養(yǎng)的
人工智能大潮滾滾而來(lái),語(yǔ)言信息處理是人工智能中最難突通用人才,在信息領(lǐng)域開(kāi)展一些前沿性的研究。破和最難解決的核心技術(shù)問(wèn)題之一。“語(yǔ)言智能與技術(shù),是北語(yǔ)在中國(guó)語(yǔ)言文學(xué)一級(jí)
北京語(yǔ)言大學(xué)語(yǔ)言智能與技術(shù)(以下稱(chēng)計(jì)算語(yǔ)言學(xué)),就是學(xué)科下,自主設(shè)置的二級(jí)學(xué)科。”李超說(shuō),計(jì)算語(yǔ)言專(zhuān)門(mén)做語(yǔ)言信息處理的。計(jì)算語(yǔ)言學(xué)是語(yǔ)言學(xué)的一個(gè)分支,學(xué)就是利用計(jì)算機(jī)對(duì)語(yǔ)言進(jìn)行計(jì)算處理,比如要提出
某個(gè)語(yǔ)言現(xiàn)象,若沒(méi)有語(yǔ)言數(shù)據(jù)的支持,就不能成為
利用計(jì)算機(jī)對(duì)語(yǔ)言進(jìn)行研究。不同于傳統(tǒng)的語(yǔ)言學(xué),它是一一個(gè)語(yǔ)言規(guī)律。而發(fā)現(xiàn)規(guī)律一般有兩種方法:一種基門(mén)由語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)和數(shù)學(xué)三者交叉的新型學(xué)科,融合于規(guī)則,如語(yǔ)法專(zhuān)家經(jīng)過(guò)研究,發(fā)現(xiàn)語(yǔ)言規(guī)律;另一了計(jì)算機(jī)的奧妙、語(yǔ)言學(xué)的神秘,還有數(shù)學(xué)的邏輯,在人工種基于統(tǒng)計(jì),根據(jù)大規(guī)模數(shù)據(jù)提煉規(guī)則。后一種就是智能的科技大潮中,顯示出非凡的生命力和創(chuàng)造力。計(jì)算語(yǔ)言學(xué)主要做的事。
在這門(mén)融合了計(jì)算機(jī)科學(xué)、語(yǔ)言學(xué)和數(shù)學(xué)的計(jì)算語(yǔ)言學(xué)中,計(jì)算機(jī)科學(xué)是研究工具,語(yǔ)言學(xué)是處理對(duì)象,數(shù)學(xué)是建模工具,此外還會(huì)用到物理學(xué)等知識(shí)。李超進(jìn)一步解釋?zhuān)骸坝?jì)算語(yǔ)言學(xué),是從字、詞、句、篇章、語(yǔ)音等各個(gè)維度去研究語(yǔ)言,比如讓計(jì)算機(jī)自動(dòng)評(píng)判一個(gè)留學(xué)生寫(xiě)漢字寫(xiě)得對(duì)不對(duì)、好不好,這項(xiàng)技術(shù)的核心是數(shù)學(xué)曲線在二維平面的變換;再比如研究日本人說(shuō)漢語(yǔ),計(jì)算機(jī)可以判斷他們說(shuō)得對(duì)不對(duì)、準(zhǔn)不準(zhǔn),這項(xiàng)技術(shù)就利用了物理學(xué)中的聲學(xué)理論,通過(guò)發(fā)音的波形進(jìn)行判斷。”計(jì)算語(yǔ)言學(xué)的應(yīng)用還有很多,最常見(jiàn)的比如在拼音輸入法中,有一項(xiàng)功能是“拼寫(xiě)和語(yǔ)法錯(cuò)誤”,一旦判定有錯(cuò)誤嫌疑,系統(tǒng)就會(huì)用紅色波浪線劃出。還有讓計(jì)算機(jī)評(píng)判一篇論文寫(xiě)得好不好,對(duì)不對(duì)等。
資源優(yōu)勢(shì)獨(dú)一無(wú)二
除了北語(yǔ),國(guó)內(nèi)開(kāi)展計(jì)算語(yǔ)言研究的還有清華大學(xué)、北京大學(xué)、中國(guó)科技大學(xué)、哈爾濱工業(yè)大學(xué)、復(fù)旦大學(xué)、中國(guó)科學(xué)院等名校。每所大學(xué)的研究各有側(cè)重,比如中國(guó)科技大學(xué)的科大訊飛主攻語(yǔ)音信息處理,特別是語(yǔ)音識(shí)別。語(yǔ)音識(shí)別的應(yīng)用也很多,比如語(yǔ)音輸入法,又比如語(yǔ)音考試,“在口語(yǔ)考試中,有一種題型是模仿原聲讀句子,計(jì)算機(jī)會(huì)給考生自動(dòng)評(píng)分。”傳統(tǒng)牛校的計(jì)算語(yǔ)言研究規(guī)模大,相比之下,北語(yǔ)更像是小團(tuán)隊(duì)作戰(zhàn),但在某些領(lǐng)域有得天獨(dú)厚的優(yōu)勢(shì)。
這優(yōu)勢(shì)就是在語(yǔ)言資源方面,尤其是搜集外國(guó)人的語(yǔ)言資源上面。李超在寫(xiě)博士論文時(shí),需要收集各國(guó)人書(shū)寫(xiě)的漢字樣本做研究。當(dāng)時(shí),他的一個(gè)師弟在英國(guó)讀博,也做著相同的研究。師弟采集樣本時(shí)跑遍了英國(guó),還專(zhuān)門(mén)跑去了埃及,可是一年下來(lái),收集的樣本規(guī)模還不如李超在北語(yǔ)一堂漢語(yǔ)課上收集得多。“在北語(yǔ),隨便推開(kāi)一間教室的門(mén),20位同學(xué)就可能來(lái)自20個(gè)國(guó)家,我只要收集每個(gè)人的漢字,就是20個(gè)國(guó)別樣本。”李超自豪地說(shuō)。目前,約有170多個(gè)國(guó)家和地區(qū)的學(xué)生在北語(yǔ)學(xué)習(xí),校園里能見(jiàn)到世界各地的人。在北語(yǔ),研究語(yǔ)言信息處理根本不愁樣本,這是其他高校無(wú)法比擬的。
李超的博士論文研究外國(guó)人寫(xiě)漢字。在傳統(tǒng)教學(xué)模式中,老師只能看到留學(xué)生寫(xiě)完的漢字,看不到寫(xiě)字過(guò)程中的筆畫(huà)順序,無(wú)法全方位判斷寫(xiě)得怎么樣。李超研究時(shí)用了一種數(shù)碼筆,“它看起來(lái)和普通圓珠筆一樣,但書(shū)寫(xiě)的時(shí)候,能記錄書(shū)寫(xiě)者書(shū)寫(xiě)漢字時(shí)的位置、速度、壓力等信息,再加上研制的算法,計(jì)算機(jī)就能告訴留學(xué)生寫(xiě)的漢字到底對(duì)不對(duì)了,如果不對(duì)還能指出哪里寫(xiě)得不對(duì),給出修正意見(jiàn)。”
北語(yǔ)堅(jiān)持‘專(zhuān)業(yè)+外語(yǔ)的復(fù)合型人才培養(yǎng)模式。大一到大四都開(kāi)設(shè)英語(yǔ)課,學(xué)院本科生的英語(yǔ)專(zhuān)八考試通過(guò)率能達(dá)到70%。
此外,計(jì)算語(yǔ)言研究需要的理論知識(shí),北語(yǔ)也有著得天獨(dú)厚的條件。“全球近300所孔子學(xué)院,由北語(yǔ)承辦的就有17所。在培養(yǎng)漢語(yǔ)國(guó)際教學(xué)師資方面,北語(yǔ)是培訓(xùn)漢語(yǔ)國(guó)際教學(xué)師資的官方機(jī)構(gòu),對(duì)漢語(yǔ)國(guó)際教學(xué)中的各種教學(xué)研究得非常深入。”豐富的學(xué)生資源、專(zhuān)業(yè)的理論積累,都為北語(yǔ)的計(jì)算語(yǔ)言學(xué)提供了良好環(huán)境。
專(zhuān)業(yè)教學(xué)各有特色
北語(yǔ)計(jì)算語(yǔ)言學(xué)專(zhuān)業(yè)招收本科、碩士和博士。本科時(shí)要將基礎(chǔ)數(shù)學(xué)、物理、統(tǒng)計(jì)等基礎(chǔ)學(xué)科學(xué)扎實(shí)了,這可不簡(jiǎn)單。在本科生眼里,高等數(shù)學(xué)、線性代數(shù)、離散數(shù)學(xué)和概率論與數(shù)理統(tǒng)計(jì)是“四座大山”。李超認(rèn)為,在計(jì)算語(yǔ)言學(xué)專(zhuān)業(yè)中,數(shù)學(xué)是基礎(chǔ),所有的語(yǔ)言現(xiàn)象都要對(duì)應(yīng)一個(gè)語(yǔ)言模型。什么是語(yǔ)言模型?說(shuō)得簡(jiǎn)單點(diǎn)兒就是一個(gè)數(shù)學(xué)公式。攻克了“四座大山”,大三大四的學(xué)生就可以選人工智能、自然語(yǔ)言處理等選修課了,還可以參與到學(xué)院老師們的研究項(xiàng)目中。本科生直接申請(qǐng)項(xiàng)目或直接參與科學(xué)研究,這是北語(yǔ)信科的特色。
至于碩士和博士,北語(yǔ)的計(jì)算語(yǔ)言學(xué)專(zhuān)業(yè)文理兼收,“我們不挑人,會(huì)針對(duì)每個(gè)人的專(zhuān)業(yè)特長(zhǎng)、興趣點(diǎn)對(duì)他們的研究方向進(jìn)行專(zhuān)門(mén)定制。”李超說(shuō),多數(shù)碩士博士是理工科出身,他們會(huì)編程,但一般不懂語(yǔ)言學(xué),進(jìn)來(lái)后要補(bǔ)修《語(yǔ)言學(xué)概論》等語(yǔ)言學(xué)基礎(chǔ)課程。文科背景的研究生則要補(bǔ)數(shù)學(xué)和計(jì)算機(jī)課程,但這沒(méi)有想象中那么痛苦,“甚至有幾位文科研究生經(jīng)過(guò)一段時(shí)間的學(xué)習(xí),成了編程大拿。”
北語(yǔ)計(jì)算語(yǔ)言學(xué)強(qiáng)調(diào)動(dòng)手能力,本科生、碩士生和博士生有時(shí)會(huì)參加同一個(gè)研究課題,但是對(duì)他們的要求是不同的:本科生做的是基礎(chǔ)工作;研究生則是解決課題中的一兩個(gè)具體問(wèn)題;對(duì)于博士生,則必須有三五個(gè)完整的創(chuàng)新點(diǎn),并以此為基礎(chǔ)完成博士論文,這是畢業(yè)的硬性要求。
去向好,招生難
談起同學(xué)們的畢業(yè)去向,李超精神一振:“北語(yǔ)堅(jiān)持‘專(zhuān)業(yè) +外語(yǔ)的復(fù)合型人才培養(yǎng)模式。信科大一到大四都開(kāi)設(shè)英語(yǔ)課,學(xué)院本科生的英語(yǔ)專(zhuān)八考試通過(guò)率能達(dá)到70%。”選擇就業(yè)的本科生和研究生,除了去外交部、新華社等國(guó)家級(jí)機(jī)構(gòu),以及中國(guó)銀行、工商銀行等金融單位從事信息技術(shù)相關(guān)工作外,還有不少畢業(yè)生在IBM、微軟、Google、百度、阿里巴巴、騰訊、新浪等從事軟件開(kāi)發(fā)、信息管理、技術(shù)服務(wù)工作。
因?yàn)樽龅亩际乔把匮芯浚幸馍钤斓耐瑢W(xué)去向也不錯(cuò),每年都有50%左右的本科畢業(yè)生赴國(guó)內(nèi)外名校讀研,如清華、北大、北航、北郵、牛津大學(xué)、斯坦福、帝國(guó)理工、加州伯克利、哥倫比亞、賓夕法尼亞、卡耐基·梅隆、東京大學(xué)等。想讀博也不難,張勁松教授門(mén)下四位2015屆研究生,一個(gè)去了日本京都大學(xué),一個(gè)去了美國(guó)伊利諾伊大學(xué)厄巴納 -香檳分校分校,一個(gè)去了澳大利亞麥考利大學(xué),還有一個(gè)去了德國(guó)德累斯頓工業(yè)大學(xué),都拿了全額獎(jiǎng)學(xué)金。還有一個(gè)研究前后鼻韻母的2016屆研究生,聯(lián)系了西澳大利亞大學(xué)的一個(gè)大牛級(jí)教授,兩封信就談妥了讀博事宜。如今,每年都有外國(guó)高校請(qǐng)北語(yǔ)計(jì)算語(yǔ)言學(xué)的教授推薦博士生候選人。
“2012年,北語(yǔ)邀請(qǐng)第三方機(jī)構(gòu)調(diào)查了校友滿(mǎn)意度,各院系中信科校友滿(mǎn)意度排名第一。”李超自豪地說(shuō)。不過(guò)校友滿(mǎn)意度第一也可能是由于一個(gè)令人哭笑不得的原因:沒(méi)來(lái)信科之前,不少同學(xué)對(duì)北語(yǔ)的唯一理工科學(xué)院不了解甚至有怨氣,來(lái)了后卻發(fā)現(xiàn)真的很棒,不虛此行。
畢業(yè)不愁出路的計(jì)算語(yǔ)言學(xué),招生時(shí)卻讓學(xué)院操碎了心。考研時(shí)第一志愿填報(bào)北語(yǔ)計(jì)算語(yǔ)言學(xué)的,只要能過(guò)國(guó)家分?jǐn)?shù)線就能被錄取。但每年招的30名碩士研究生,還是有近一半要靠調(diào)劑。2015年,計(jì)算語(yǔ)言學(xué)收到了100多個(gè)調(diào)劑申請(qǐng),最后調(diào)劑生的平均分?jǐn)?shù)比第一志愿錄取的還要高。
采訪手記:
這一次為報(bào)道北語(yǔ)計(jì)算語(yǔ)言學(xué),記者們采訪了八位老師和學(xué)生。自豪和無(wú)奈,是每一位被采訪者都流露出的情感。他們自豪于自己的前沿研究,自豪于自己靈活的本碩博培養(yǎng)方案,自豪于學(xué)生的就業(yè)去向,自豪于畢業(yè)生對(duì)學(xué)院的真心熱愛(ài)。但是,也無(wú)奈于本科招不滿(mǎn),研究生靠調(diào)劑的局面。正如李超所堅(jiān)信的,是金子的終會(huì)發(fā)光。而北語(yǔ)計(jì)算語(yǔ)言學(xué),不僅是金子,還是一座蘊(yùn)藏著金子的金礦。
探索前沿,低調(diào)耕耘
采寫(xiě)/本刊記者 尹穎堯 曹曉晨文字整理/陳林芩
北語(yǔ)計(jì)算語(yǔ)言學(xué)有一群大牛教師,他們的研究前沿、有趣。記者分別采訪了研究語(yǔ)言教學(xué)、研究和應(yīng)用的幾位代表教授。
于東副教授——讓計(jì)算機(jī)“聽(tīng)懂”語(yǔ)言
主攻語(yǔ)言信息處理的于東老師研究語(yǔ)義計(jì)算,即讓計(jì)算機(jī)“聽(tīng)懂”、并且理解人說(shuō)的話。
于老師介紹,語(yǔ)義學(xué)歷經(jīng)了三代研究。第一代是做生物分類(lèi)體系般的語(yǔ)詞典,通過(guò)條目分類(lèi)囊括所有的詞語(yǔ)。第二代是制作知識(shí)圖譜,如網(wǎng)友自發(fā)編輯的百度、維基等百科,每一個(gè)詞條形成一個(gè)小數(shù)據(jù)庫(kù)。第三代則將詞義抽象表示出來(lái),再通過(guò)計(jì)算機(jī)分析詞與詞之間千絲萬(wàn)縷的關(guān)系。比如“雞蛋”,可讓計(jì)算機(jī)通過(guò)50個(gè)數(shù)字表示,表面看50個(gè)數(shù)字毫無(wú)關(guān)聯(lián),但一旦所有的食物都由50個(gè)數(shù)字表示出來(lái)后,計(jì)算機(jī)就能發(fā)現(xiàn)“雞蛋”和“母雞”間的聯(lián)系,并能將它們的關(guān)系類(lèi)比為人類(lèi)母親和孩子的關(guān)系。
提取個(gè)人中文簡(jiǎn)歷中的信息,也是于老師重點(diǎn)負(fù)責(zé)的項(xiàng)目之一。對(duì)于有百度百科詞條的人,他們的信息比較完整,普通人的信息則散落在互聯(lián)網(wǎng)的各個(gè)角落,需要好好尋找。簡(jiǎn)歷中,人們往往會(huì)寫(xiě)祖籍、出生地、年齡等信息,于東和學(xué)生們將這些信息提取后建模,再在更大的互聯(lián)網(wǎng)文本中,找與這個(gè)人有關(guān)的
用計(jì)算機(jī)解決語(yǔ)言應(yīng)信息,比如曾經(jīng)待過(guò)的地方、做過(guò)的職位、人物關(guān)系用問(wèn)題,即計(jì)算機(jī)理等等。之后逐層推導(dǎo),繪制出一份社交圖譜——以一解語(yǔ)言的句法結(jié)構(gòu)和個(gè)人為中心,找出與之相關(guān)的人及其職位,構(gòu)成人物語(yǔ)意結(jié)構(gòu),是當(dāng)前大關(guān)系網(wǎng)絡(luò)。這個(gè)項(xiàng)目2013年啟動(dòng),仍在進(jìn)行中。熱的人工智能的一個(gè)用計(jì)算機(jī)解決語(yǔ)言應(yīng)用問(wèn)題,即讓計(jì)算機(jī)理解方向。語(yǔ)言的句法結(jié)構(gòu)和語(yǔ)意結(jié)構(gòu),是當(dāng)前大熱的人工智能
的一個(gè)方向。餓了吃飯,臟了洗澡,這是人的常識(shí),但計(jì)算機(jī)沒(méi)有這個(gè)常識(shí),如何讓計(jì)算機(jī)獲取、表示,甚至運(yùn)算這種常識(shí)性知識(shí),仍是研究的一個(gè)難點(diǎn)。 2015年,于老師所在的大數(shù)據(jù)研究所團(tuán)隊(duì)加入了國(guó)家 “863”計(jì)劃項(xiàng)目“面向基礎(chǔ)教育的知識(shí)能力智能測(cè)評(píng)與類(lèi)人答題驗(yàn)證系統(tǒng)”,2016年再次申請(qǐng)到國(guó)家社科重點(diǎn)項(xiàng)目資助,目標(biāo)就是以語(yǔ)法、語(yǔ)義結(jié)構(gòu)分析為核心技術(shù),幫助人工智能參加高考,并在高考科目中達(dá)到一定水平。
鏈接:在知識(shí)圖譜領(lǐng)域,清華大學(xué)和中國(guó)科學(xué)院都在做相關(guān)研究,前者注重在知識(shí)圖譜基礎(chǔ)上的知識(shí)推理,而后者關(guān)注如何從原始文本中抽取知識(shí)圖譜。北語(yǔ)計(jì)算語(yǔ)言學(xué)更多是在積累資源,從文本中挖掘知識(shí),并著手清華和中科院都不怎么關(guān)注的常識(shí)領(lǐng)域。
荀恩東教授——寫(xiě)手漂亮的漢字
信科學(xué)院大數(shù)據(jù)與語(yǔ)言教學(xué)研究所所長(zhǎng)荀恩東教授的研究,主要包括兩個(gè)部分。一是用計(jì)算機(jī)幫助漢語(yǔ)學(xué)習(xí)。在北語(yǔ)這個(gè)擁有不同膚色學(xué)生的“小聯(lián)合國(guó)”,很多留學(xué)生寫(xiě)漢字如同畫(huà)畫(huà),而且沒(méi)有筆順概念。荀教授和同學(xué)們研發(fā)了幫助留學(xué)生寫(xiě)好漢字的手機(jī)APP——“易漢字”,以國(guó)家規(guī)定的筆畫(huà)筆順為標(biāo)準(zhǔn),指導(dǎo)學(xué)生寫(xiě)出標(biāo)準(zhǔn)的漢字。這款軟件針對(duì)的不僅僅是外國(guó)人,沒(méi)機(jī)會(huì)“練筆”的中國(guó)成年人同樣是目標(biāo)對(duì)象。
如今,人們提筆忘字的現(xiàn)象越來(lái)越嚴(yán)重,為讓人們寫(xiě)得一手好字,荀教授還請(qǐng)來(lái)了書(shū)法家,采集其書(shū)寫(xiě)漢字的過(guò)程和成型的字體,讓大家在APP上跟著書(shū)法家一筆一畫(huà)地臨摹。此外,荀教授還將師生互動(dòng)從課堂上搬到了移動(dòng)終端上。課前,他將課上要講的內(nèi)容發(fā)送至手機(jī)等終端,供學(xué)生預(yù)習(xí),課后,他收集學(xué)生練習(xí)的結(jié)果,作為研究的第一手資料。
與于東老師一樣,荀教授也關(guān)注人工智能中的常識(shí)問(wèn)題。此外,他還牽頭建立了BCC現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)(http://bcc.blcu.edu.cn/),總字?jǐn)?shù)約 150 億字,包括報(bào)刊(20億字)、文學(xué)(30億字)、微博(30億字)、科技( 30億字)、綜合( 10億字)和古漢語(yǔ)(20億字)等多領(lǐng)域語(yǔ)料,可供檢索,服務(wù)于教學(xué)、輿情等。它是目前國(guó)內(nèi)最大、被使用次數(shù)最多的語(yǔ)料庫(kù),不論是博士、碩士生寫(xiě)論文,還是老師做語(yǔ)言學(xué)研究,都能用到它。
鏈接:北京語(yǔ)言大學(xué)在漢語(yǔ)學(xué)習(xí)的理論方法領(lǐng)域做得最深入,比如漢語(yǔ)的字、詞、句、篇章的分析和處理技術(shù),在國(guó)內(nèi)可比肩清華大學(xué)、中國(guó)科學(xué)院大學(xué)、哈爾濱工業(yè)大學(xué)、和復(fù)旦大學(xué)等知名院校,也絲毫不比國(guó)外遜色。
荀教授和同學(xué)們研發(fā)了幫助留學(xué)生寫(xiě)好漢字的手機(jī)APP——“易漢字”,以國(guó)家規(guī)定的筆畫(huà)筆順為標(biāo)準(zhǔn),指導(dǎo)學(xué)生寫(xiě)出標(biāo)準(zhǔn)的漢字。
2015年,張教授的團(tuán)隊(duì)在日本同學(xué)中做測(cè)試,參加測(cè)試前,日本同學(xué)發(fā)音的準(zhǔn)確率是80%,經(jīng)過(guò)一段時(shí)間的訓(xùn)練,準(zhǔn)確率達(dá)到了90%。
張勁松教授——改進(jìn)洋腔洋調(diào)
張勁松教授關(guān)注計(jì)算機(jī)輔助發(fā)音教學(xué)和實(shí)用語(yǔ)音學(xué)。經(jīng)過(guò)調(diào)研,張教授發(fā)現(xiàn)計(jì)算機(jī)輔助發(fā)音的第一代產(chǎn)品,運(yùn)用的是語(yǔ)音匹配技術(shù),用打分的方式判斷發(fā)音是否標(biāo)準(zhǔn),但這對(duì)學(xué)生改進(jìn)和提高發(fā)音的幫助實(shí)在有限。“學(xué)生只知道自己發(fā)音的水平,卻不知道哪兒出了問(wèn)題。這樣的反饋,于教學(xué)而言遠(yuǎn)遠(yuǎn)不夠。”
怎樣才能讓學(xué)生更好地改進(jìn)發(fā)音呢?
帶著這一目標(biāo),張老師把發(fā)音分成“三個(gè)環(huán)節(jié)、五個(gè)層面”,挨個(gè)兒攻克難關(guān)。五個(gè)層面指音段、聲調(diào)、語(yǔ)調(diào)、語(yǔ)段和韻律。“三個(gè)環(huán)節(jié)”的第一個(gè)環(huán)節(jié)是產(chǎn)出環(huán)節(jié)。張老師發(fā)現(xiàn),將漢語(yǔ)作為第二語(yǔ)言學(xué)習(xí),不同國(guó)家的學(xué)生有著不同程度的“洋腔洋調(diào)”。比如日本人分不清l、r和zhi、chi、shi,送氣也不足。此外,日本人講中文時(shí),也許每個(gè)音調(diào)都正確,但他們不明白漢語(yǔ)的韻律、節(jié)奏,連起來(lái)說(shuō)時(shí)句子聽(tīng)起來(lái)十分生硬。第二個(gè)環(huán)節(jié)是知覺(jué)層面,這個(gè)層面常見(jiàn)的問(wèn)題是在教學(xué)過(guò)程中,老師講的東西同學(xué)能理解多少,老師不能確定,如“媽”和“馬”,有的同學(xué)聽(tīng)起來(lái)完全一樣。第三個(gè)層面是交際層面,這個(gè)層面也有一些容易產(chǎn)生的問(wèn)題,比如,中國(guó)人與外國(guó)人聊天時(shí),為了讓對(duì)話順利進(jìn)行下去,有時(shí)會(huì)選擇性忽略外國(guó)人說(shuō)中文時(shí)的錯(cuò)誤,這樣一來(lái),外國(guó)人就認(rèn)為自己的錯(cuò)誤表達(dá)是正確的,這是加深印象或鞏固錯(cuò)誤的陷阱。
隨后,張教授帶領(lǐng)同學(xué)們有針對(duì)性地解決這些問(wèn)題。在知覺(jué)環(huán)節(jié),針對(duì)日本學(xué)生陽(yáng)平上聲不分的問(wèn)題,團(tuán)隊(duì)利用物理參數(shù)合成音高區(qū)間,并劃分了十個(gè)次級(jí),“對(duì)母語(yǔ)是漢語(yǔ)者來(lái)說(shuō),聽(tīng) 1~4 級(jí)時(shí), 100%的人都表示聽(tīng)到的是陽(yáng)平;聽(tīng) 7~10級(jí)時(shí), 100%聽(tīng)到的都是上聲;而聽(tīng) 5或6級(jí)時(shí),他們也會(huì)拿不準(zhǔn)。”團(tuán)隊(duì)把中國(guó)人聽(tīng)1~10次級(jí)的情況告訴日本同學(xué),并針對(duì)他們的薄弱環(huán)節(jié)進(jìn)行針對(duì)性的訓(xùn)練。 2015年,張教授的團(tuán)隊(duì)在日本同學(xué)中做測(cè)試,參加測(cè)試前,日本同學(xué)發(fā)音的準(zhǔn)確率是 80%,經(jīng)過(guò)一段時(shí)間的訓(xùn)練,準(zhǔn)確率達(dá)到了 90%。
鏈接:在計(jì)算機(jī)輔助發(fā)音教學(xué)領(lǐng)域,美國(guó)佐治亞理工學(xué)院、香港中文大學(xué)、新加坡A*STAR(Agency for Science,Technology andReseach)研究所、日本京都大學(xué)等都有相關(guān)研究。由于北語(yǔ)開(kāi)展得比較早,目前在國(guó)內(nèi)外都處于前沿地位,研究成果在領(lǐng)域內(nèi)也極受重視。