尹穎堯+曹曉晨+陳林芩
《大學生》:你們的研究方向都是哪些?
高山:我的專業是語言學和應用語言學,方向是計算語言學(語言信息處理)。我的研究興趣點是機器翻譯,它對語言學的要求非常高。當然,這和我的專業有很大關系,我是開羅大學中文系本科畢業的,后來來到北語讀計算語言學研究生。北語招國外博士生時,要求很高,在信科只有我一個外國博士生。
盧涌:我的專業和高山相同,主要做語義資源的構建,是偏文的。
林舉:我的研究方向是計算機輔助發音教學,對計算機知識的要求高,還需要了解留學生的發音特點。
劉春花:我的方向叫計算機應用科學,更偏技術層面。
《大學生》:考北語的研究生難嗎?那么多學校,為什么就選了北語?
高山:當然有難度。北語的留學生博士入學要求很嚴格,更不要說拿獎學金了。
盧涌:本科畢業時,我想去南開大學學語言學,但是本科導師跟我說,北語是專業性的語言學校,所以我就過來了。當時北語的語言學方向有十幾個,我又不想學純語言類的,導師就建議了計算語言學。
林舉:文科生考北語的研究生相對比較難,理工科的容易些,畢竟想考北語研究生的理工科學生并不多,但其實來之后感覺都挺好的。
劉春花:我本科就是北語的,放棄了保研,準備考外校的研究生,但考分不理想,就調劑回來了。
為了解計算語言學專業學習的情況,記者采訪了幾位研究生。
高山
博二
埃及人
本科在開羅就讀
林舉
研三準備去新加坡國立大學讀博
《大學生》:文科背景和理科背景讀這個專業的區別在哪?
高山:計算語言學重點在于語言學、數學和計算機知識,如果做技術,對計算機功底的要求比較高,而要做語言資源的話,語言文學功底應該更強。
盧涌:這個專業對計算機知識有一定的要求,我所在的實驗室側重點是編程。文科轉理科,難度還是很大的,要花很多的時間。與我一同進實驗室的一位中文系男生,花了很多功夫學編程,他的畢業論文也基本上跟語言資源無關,做的是算法或計算。不論文理生,每個人在這兒讀研都得補課,文科生補計算機,理科生補語言學。不過這也是優勢啊,都成了復合型人才。每位導師手下都有文科生和理科生。
《大學生》:在北語讀研的優勢有哪些?
高山:計算語言學是文理交叉學科,北語的語言學研究在國內數一數二,有很多語言學界鼎鼎大名甚至鼻祖級的專家教授。另外,北語的學術氛圍十分自由、融洽,導師都十分重視我們的學術研究,每周至少開一次組會,導師跟同學一起討論研究的進展。
盧涌:每個老師都有自己的團隊,每個團隊有自己的組會,每周開一次,一個月有一次大的匯報。我們經常去北大等高校開合作組會,老師還會邀請國外老師過來。信科的基礎設施、硬件設備非常好,每人都會配工位和計算機。
林舉:從我的研究方向計算機輔助發音教學來看,第一個優勢是北語的漢語國際教學處于國內頂尖水平。第二,北語有很多留學生,做計算機輔助翻譯教學需要很多二語資源,非常需要留學生,而在北語
我們比較有信心,也很看好這種語義分析的方法,相關研究正在進行中。
非常容易找。我們前段時間錄了300多個留學生的語調庫,學生都是在北語找的。第三,將來我打算出國深造,北語留學生多,英語氛圍好,很容易找到語伴。
《大學生》:可否介紹一下你們的項目?
高山:我們的團隊會關注國內外的流行語,比如特朗普為什么有人不叫他特朗普,卻叫川普?我們還統計了中華傳統文化里的成語和小句,如在《論語》或《道德經》等典籍中,哪些成語用的頻率多,這反映了什么樣的思維方式等。我們還會在報紙里找成語的分布或者使用頻率。此外我個人還在做漢語和阿拉伯語的計算機翻譯。
盧涌:我現在在做一種語義分析方法。當前自然語言處理的語義分析方法主要有兩種,一種是淺層語義分析方法,以語義角色標注為代表;一種是深層語義分析方法,比如語義依存分析。我現在做的深層語義表示( Deep Semantic Representation,簡稱 DMR),也屬于深層語義分析方法,這是我們正在和魯東大學的老師合作的項目。現在我們標注了 800多句,也正在制定標注規范,主要的難點在于對名詞結構的表示上。它接近學術前沿,國內剛剛起步,比較有發展前景,也是老師們很重視的問題。我們比較有信心,也很看好這種語義分析的方法,相關研究正在進行中。
林舉:我做過一個留學生聲調評估的項目,是導師張勁松教授幫助留學生學漢語的 APP的一部分。剛開始我做的是對單個字聲調的判斷,導師覺得做單個字太簡單,便讓我在連續語流中研究聲調,比如“今天你吃飯了嗎?”導師的博士論文剛好是聲調識別,看完老師的論文,又調研一些文獻后,我發現在連續語段中,第一聲不一定是平的,它受上下文的影響
化。之前的傳統做法,是用基頻曲線判斷聲調的對錯,通過調研,我發現音段(即聲韻母)對基頻曲線是有影響的。后來我把這個項目寫成論文,在語音頂級會議 interspeech上發表了,還申請了一項發明專利。
劉春花:我的導師荀恩東最近在做句法語義分析器,我承擔了其中一個小任務,是漢語功能詞的還原,讓整個句子的句法結構更加清晰。漢語功能詞是指像“了”“著”“或”這樣經常用在動詞后面的虛詞。具體做的時候,我會先對一句沒有功能詞的句子——比如“他的老師給他提出很多建議”,判斷“提出”后加“了”“著”“過”哪一個功能詞合適,且哪一個功能詞出現的可能性最大。這個判斷是由我的計算機通過深度學習的模型得到的。
《大學生》:你們對自己就業有什么計劃?
高山:同學們一般是考公務員,另外進百度、搜狗等互聯網企業比較多。我現在還沒有具體的計劃,但就業前景還是很明朗的, IT公司急需我們專業的人才。
林舉:師兄師姐出國的比較多,就業的也不少。這個專業很好就業,但是也很苦。我準備去新加坡國立大學讀博,再以后,我應該會回高校當老師,繼續做計算語言學方面的研究,或者結合人工智能創業,做計算機輔助發音教學這一塊。
盧涌:目前還在找工作,前不久參加了公務員考試,但傾向于進企業。這個專業就業還是不錯的,實驗室的小伙伴有的拿到了中科院軟件所的offer,但我更想回家工作。
劉春花:現在自然語言處理很火,這個專業的就業前景很好。我可能會出國讀博。