999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

語料庫驅動的通用漢語學術詞表構建

2024-01-01 00:00:00高松錢隆丁芊
中國科技術語 2024年3期

摘 要:學術詞表開發是學術漢語研究的重要課題。該研究基于1450篇學術期刊論文構建了漢語學術語料庫,借鑒英語學術詞表AWL和AVL的創建方法,開發了一個包含1368個詞型的通用漢語學術詞表,并對該詞表的有效性進行了檢驗。檢驗結果表明:通用漢語學術詞表覆蓋了漢語學術語料庫25.88%的文本,覆蓋水平較高;詞表在BCC和LCMC語料庫的學術、科技子庫的覆蓋率分別為18.85%和23.86%,在文學庫和微博庫的覆蓋率低于3%,這一差異表明詞表中的學術詞匯具有一定代表性;詞表對漢語學術語料庫各子庫的覆蓋率均超過17%,能較好地服務于不同學科領域的學術漢語教學和學習。詞表展示了漢語學術詞匯學習目標,為學術詞匯教學、學習以及專門用途漢語教材編寫提供了參考。

關鍵詞:詞表;學術詞匯;語料庫;學術漢語

中圖分類號:N04;TP391" 文獻標識碼:A" DOI:10.12339/j.issn.1673-8578.2024.03.010

Developing and Validating a Chinese Academic Vocabulary List (CAVL): A Corpus-Driven Approach//GAO Song,QIAN Long,DING Qian

Abstract: The development of Chinese academic vocabulary lists is a significant topic in the study of Academic Chinese. This research constructed a Chinese academic corpus (CAC) based on 1,450 academic journal articles. Drawing from the methodologies employed in the creation of the Academic Word List (AWL) and the Academic Vocabulary List (AVL) in English, we developed CAVL with 1,368 word-types. An assessment of CAVL’s efficacy indicated that it covered 25.88% of the CAC, demonstrating a high level of coverage. The list accounted for 18.85% and 23.86% of academic and technological sub-corpora in the BCC and LCMC respectively. However, its coverage in literature and microblog sub-corpora was less than 3%, and this difference suggests that the academic vocabulary in the lexicon is sornewhat representative. CAVL covers more than 17% of all sub-corpora in CAC, showcasing a balanced representation across various academic disciplines, hence can serve as a valuable resource for Academic Chinese teaching and learning in different fields. CAVL delineates the learning objectives for Chinese academic vocabulary and offers a reference point for vocabulary instruction, learning, and the development of Chinese textbooks for specific purposes.

Keywords: vocabulary list; Chinese academic vocabulary; Corpus; Chinese for academic purpose

收稿日期:2023-10-18" 修回日期:2024-04-28

基金項目:2020年教育部人文社會科學研究青年基金項目“基于語料庫的現代漢語書面語歷時演變計量研究”(20YJC740010);2023年北京語言大學研究生創新基金(中央高校基本科研業務費專項資金)項目“基于依存樹庫的英美漢語學習者二語書面語發展特征計量研究”(23YCX162);2022年教育部產學合作協同育人項目“大學英語智慧教學實踐互動平臺建設”(220600273075052)

0 引言

通用學術詞表是對具有學術目的學習者的一般通用詞表的擴展,是值得學習者和二語教師廣泛關注的詞匯列表[1]。學術詞表在為語言課程設定詞匯目標、指導學習者進行獨立學習、為教材編寫者提供信息和開展學習活動等方面發揮著關鍵作用[2]。通過強調在各類學術文本中經常出現的詞匯,詞表向學習者直接展示了學習目標,幫助學習者了解哪些詞是最有用、應該最先學習的,可以提高學術詞匯的學習效率。毫無疑問,學術詞表能極大地滿足學術詞匯教學和學習的需要。

目前,英語學術詞表研究已有相當豐富的成果[3-4]。最具代表性和影響力的英語學術詞表,一個是Coxhead于2000年開發的學術單詞表(Academic Word List,簡稱AWL)[2],另一個是Gardner、Davies于2014年創建的學術詞匯表(Academic Vocabulary List,簡稱AVL)[5]。后來,借鑒AWL和AVL的編制方法,學者們又陸續開發了各學科的英語學術詞表,如化學英語學術詞表、環境科學英語學術詞表、航海英語學術詞表、醫學英語詞匯表等[6-8]。

通用漢語學術詞表的開發還處于起步階段,相關研究成果較少。現已開發的某些專業學術詞表,如漢語語言學學術詞表[9]、經貿類本科專業學術漢語詞表[10]、醫學漢語學術詞表[11]等,均是非通用學術詞表。通用漢語學術詞表是對具有學術目的漢語學習者的一般通用漢語詞表的擴展。朱明玉2020年開發了通用漢語學術詞表,然而該詞表在選詞時,僅使用了頻率和范圍標準,并未考慮到詞匯的專業性和均勻分布等問題,一定程度上影響了詞表在各學科領域應用的廣泛性和有效性[12]。總的來看,漢語學術詞表的研究還十分薄弱。如果說積累學術詞匯是攻讀學位的學習者面臨的一個主要挑戰[13],那么缺少通用漢語學術詞表將不利于學術詞匯的教學,也不利于專門用途漢語教材的編寫,在一定程度上會影響到學生的學術學習和訓練。

鑒于此,本文基于自建的漢語學術論文語料庫,采用AWL和AVL的開發方法,嘗試創建通用漢語學術詞表,挖掘通用于各學科領域的核心學術詞匯,考察詞表對不同學科、不同類型文本的覆蓋情況,并對詞表有效性進行系統檢驗,以此來推動漢語學術詞匯的研究,滿足學術詞匯教學和學習的需要。

1 專門用途漢語學術詞匯

專門用途漢語(Chinese for specific purposes,簡稱CSP)是漢語作為第二語言教學體系的重要分支,指用于某種專業領域、特定范圍和固定場合的漢語[14-15]。它是相對日常生活和工作中普遍使用的通用漢語(Chinese for general purposes,簡稱CGP)而言的。隨著來華留學的學歷生人數增長,通用漢語教學已不能滿足學歷生的現實學習需求[16]。學生進入專業學習后,沒有專業詞匯、專業語篇結構和句法表達的儲備,聽課、讀文獻和寫論文會遇到較大困難。開展深入的專門用途漢語研究,加強對學歷生學術漢語能力的培養,幫助學生適應專業學習,是極為必要的。

“學術漢語”是專門用途漢語的一個重要組成部分,學術漢語教學目標是訓練學生運用漢語從事專業學習和學術活動[17]。學術漢語表達規范、結構嚴謹、專業性強,很少使用口語化的詞匯和表達方式[18]。對學生來說,掌握學術漢語確實難度較大。張秀菊等指出,留學生進入專業學習時,聽不懂課的現象很普遍[19]。李海燕等發現,本科留學生不會使用論文寫作常用的學術詞匯,論文中口語化問題嚴重[20]。這就要求教師在課堂教學中對詞匯和語法進行有針對性的教學。但是,目前缺乏專門用途漢語詞匯教學,學生大多是自學專業詞匯[21]。有學生明確提出需要盡快學習和專業相關的詞匯和話題[22],以此來解決在理解和輸出過程中存在的語言問題。

Nation認為,詞匯可以分為高頻詞匯、學術詞匯和專業詞匯[1]。學術詞匯介于高頻詞匯和專業詞匯之間,是在眾多學科的學術文本中高頻出現且比其在非學術文本中更高頻出現、分布廣泛且均勻的詞匯[23]。學術詞匯學習成功與否直接影響到學習者的閱讀能力和學術成就[24]。可以說,學術詞匯是語言教學和學習的關鍵。掌握一定的學術詞匯,學生能提高聽課效果,能更好地理解學術文獻,更好地進行學術論文寫作。由于學術詞匯的出現頻率遠遠低于高頻詞匯,學生對學術詞匯的熟悉程度也低,學術詞匯是學生學習的難點[25]。鑒于此,學者們致力于創建學術詞表,對學術詞匯進行具體教學,服務于學術詞匯的教學和學習[26]。

2 建立漢語學術論文語料庫

學術詞表要借助學術文本的語料庫來創建,語料庫可以反映出詞表中詞語的頻數和覆蓋情況[27]。因此,我們采用語料庫驅動的研究方法[28],通過自建漢語學術語料庫(Chinese Academic Corpus,簡稱CAC)來開發通用漢語學術詞表(Chinese Academic Vocabulary List,簡稱CAVL)。

所創建的語料庫納入了2019年1月至2020年12月中國知網(CNKI)的1450篇期刊論文,包含3 533 018個詞例,56 517個詞型。為確保語料庫設計良好,我們兼顧語料的代表性和典型性,按照通用性、描述性、實用性和抽樣性等原則來選取語料[29]。學術期刊來自中國科學引文數據庫(CSCD)、中文社會科學引文索引(CSSCI)、《中文核心期刊要目總覽》(北大核心)中收錄的自然科學、哲學與人文社會科學領域的期刊。期刊從中國知網資源庫中隨機選擇,領域覆蓋中國知網文獻分類目錄里的各個學科。選取的期刊論文既有研究型文章又有綜述文章,各領域選取的論文數量大致相同。

根據中國知網的文獻學科分類,即基礎科學、工程科技Ⅰ、工程科技Ⅱ、農業科技、醫藥衛生科技、哲學與人文科學、社會科學Ⅰ、社會科學Ⅱ、信息科技、經濟與管理科學,將語料庫劃分為10個子語料庫。每個子語料庫中的PDF格式論文經過分層抽樣和系統抽樣方式入庫,確保論文來自不同的期刊和刊期。然后,用Java編程語言和Eclipse編輯器編寫腳本,通過外部工具包PDF box以及文字庫Font box將所有PDF格式的論文轉化為TXT格式。每篇論文都刪除了圖表、注釋、腳注和尾注、參考文獻和附錄等,只保留中文摘要和正文。由于論文的篇幅長短不同,為滿足樣本選取規模的一致性,我們從每篇選定的論文中隨機選取了長度約4000字的文本。取樣后,采用中國傳媒大學國家語言資源監測與研究有聲媒體中心的在線分詞標注系統(CUCBst)進行文本自動分詞。基于以上原則和方法,我們構建了涉及廣泛專業領域的漢語學術語料庫,建設的具體流程,如圖1所示。

3 編制通用漢語學術詞表

語料庫語言學中,常見的詞頻統計單位包括詞型(word type)、詞元(lemma)和詞族(word family)[30]。AWL用詞族作為詞頻統計單位;而AVL采用詞元作為詞頻統計單位。漢語屬于漢藏語系語言,沒有豐富的屈折變化和派生形式,不適合以詞族和詞元為詞頻統計單位,因此我們將詞型作為詞表詞頻的統計單位。

編制學術詞表時,確定選詞標準是關鍵。學術詞匯必須用系統、嚴格的選詞標準來識別[8]。我們綜合考慮了AWL和AVL提取學術詞匯的方法,同時結合了漢語實際,考慮了以下5個方面來提取學術詞匯。

(1)高頻性

選詞時,詞頻是一個非常重要的指標。詞的出現頻率越高,說明詞越常用,在詞表中的位置越靠前[30]。開發詞表時,通常要根據齊普夫定律(Zipf’s Law)確定合適的詞頻來選詞。Coxhead規定選入AWL的詞匯在語料庫中的出現頻次要高于100[2]。我們在頻次為50~100范圍內多次試驗調整頻次的設定,以便找到詞表選詞的最佳值。當最低頻次設定為60時,10.13%的詞型覆蓋了90.47%的詞例,此時詞對語料庫的覆蓋率較為理想,詞語的抽取效果最好。最低詞頻設定為100時,會排除很多有用也很常用的學術詞匯,如“客體”(詞頻:87)、“剖析”(詞頻:86)等;最低詞頻設定為50時會收錄太多詞,會擴增詞表的規模,從而增加學生的學習負擔。因此,設定詞在語料庫中的出現頻次高于60,才可以選入通用漢語學術詞表中。

(2)專業性

為突出學術詞表的專業性,Coxhead規定收錄AWL的詞不能是通用英語詞表(General Service List,簡稱GSL)中的詞[2]。Gardner和Davies使用了頻率比標準,規定選入AVL的詞在美國當代英語語料庫(Corpus of Contemporary American English,簡稱COCA)學術文本庫中出現的頻率是其在COCA非學術文本庫中出現頻率的1.5倍,以此來確保收錄詞匯是學術詞匯[5]。

AWL為保證專業性而排除了高頻詞,該做法受到了學者們的質疑。因為高頻詞和學術詞匯之間并沒有明晰的界限,高頻詞可能是學術詞匯,學術詞匯也可能是高頻詞,開發學術詞表時沒有必要排除高頻詞[3]。而AVL不采用高頻性選詞標準,采用頻率比標準又使AVL收錄過多的低頻詞[8]。對于那些與高頻詞表重復的詞,頻率比設為1.5過低,不利于突出學術詞匯的專業性。因此,我們結合AWL和AVL專業性選詞標準,對其做出了一些調整。

我們首先將北京語言大學BCC現代漢語語料庫中科技文獻庫以外的其他子語料庫作為非學術語料庫。BCC語料庫中的科技文獻同樣來自國內的學術期刊,可以將其視為BCC語料庫的學術子語料庫。然后,計算入選漢語學術詞表的詞在漢語學術語料庫中的出現頻率與其在BCC非學術語料庫中出現頻率的比值。同時,將頻率比設定在1.2到2的范圍內進行試驗。試驗發現,如果頻率比設定為1.2,詞表會收錄過多通用高頻詞,如“少”(頻率比:1.22)、“時間”(頻率比:1.39)等;如果頻率比設定為2,詞表就排除了一些核心學術詞匯,如“清晰”(頻率比:1.78)、“顯示”(頻率比:1.66)。當頻率比設為1.5時,選詞效果最理想。同時,為了突出選取學術詞匯的專業性,把中國政府獎學金本科來華留學生預科教育結業考試《基礎漢語常用詞匯表》作為通用詞表來輔助參考。結合頻率比設定為1.5到3之間的試驗結果,最終規定,通用漢語學術詞表中的詞如果出現在預科《基礎漢語常用詞匯表》中,且頻率比達到2才能入選;如果沒有出現在預科《基礎漢語常用詞匯表》中,頻率比達到1.5才能入選。

(3)廣泛分布性

依靠詞頻作為選詞標準,在小范圍內統計詞語,一般來說頻次是可靠的。但是在大范圍內統計詞語,頻次的片面性就顯露出來了。由于統計方法和抽樣方面的原因,會造成統計結果的嚴重偏差。為解決這個問題,詞匯統計學家指出除詞頻外還要考慮詞的分布,計算詞的分布率[31]。因此,廣泛分布性也是一個重要的選詞標準。

收錄到AWL的詞,必須在語料庫的人文、商業、法律、科學4個學科和28個子學科領域的15個或更多領域中至少出現10次[2]。選入AVL的詞在語料庫的9個學科中至少出現在其中7個學科中,且每個學科中出現的頻次至少達到期望頻次的20% [5]。綜合AWL和AVL制定的廣泛分布標準,我們規定入選漢語學術詞表的詞在漢語學術語料庫10個子語料庫中至少出現在其中7個子語料庫中,且在每個子語料庫中的出現頻次至少達到期望頻次的20%。

(4)均勻分布性

收錄詞表的詞除了考慮廣泛分布性,還要考慮在語料庫中是否均勻地分布。AVL的設計是將Julliand’s D值[32]作為均勻分布的計算指標,規定選入AVL的詞其D值要大于或等于0.8[5]。由于Julliand’s D值被認為是計算均勻分布最可靠的指標[8],因此我們也采用Julliand’s D值來計算詞在語料庫中的均勻分布值。構建詞表時,D值設定沒有統一的標準,所以我們將D值設定在0.3到0.9區間來進行試驗。試驗發現,如果D值設定太高(D值:0.9),“協同”“特征”等常用的學術詞匯就會被排除;如果D值設定太低(D值:0.3),詞表的均勻分布性就無法保證。D值設定為0.6,選詞的效果最為理想。根據試驗結果,我們規定漢語學術詞表中入選詞的Julliand’s D值要大于或等于0.6,以此保證收錄詞在漢語學術語料庫的10個子語料庫中均勻分布。

(5)學科指數

AVL還將學科指數作為詞表的一個選詞標準。考慮學科指數,主要是為了排除只在特定學科出現的詞,確保詞表中的詞匯不是僅僅在某個學科領域中高頻使用。AVL規定,收錄詞在9個學科里的任何一個學科中出現的頻次不能超過期望頻次(每百萬詞)的3倍。如果超過3倍,這個詞就要被排除在學術詞匯之外。這些詞雖然本質上是具有學術性的,但是對于一個核心學術詞表來說,似乎太具體了,需要通過學科指數這一選詞標準將其排除[5]。因此,我們參考AVL選詞時采用的學科指數標準,經過多次試驗設定學科指數值。在分別試驗了2.5、3、3.5、4等數值后,發現學科指數值為3時選詞效果最好。因此,我們規定詞表的入選詞,在漢語學術語料庫任何一個子語料庫中的出現頻次不能超過其在該子語料庫期望頻次的3倍或以上。

詞表的選詞工作是在Excel環境下進行的。根據選詞標準提取學術詞匯的樣例,見表1。

收錄詞必須同時滿足以上5條選詞標準,確保收錄詞是高頻使用、專業性突出、廣泛分布、均勻分布,且不是僅在某個學科領域高頻出現的詞。基于此,我們提取出一個符合上述選詞標準的詞表,包含1483個詞型。經過人工校對,刪除了由分詞軟件造成切分錯誤的語素和非固定短語,如“形”“述”“一個”“也就是說”等,最終創建了一個包含1368個詞型的通用漢語學術詞表。詞表按詞在漢語學術語料庫中的詞頻高低橫向排序,詞頻最高的“研究”排第一位,詞頻排第二位的是“進行”,以此類推。表2顯示了詞表中詞頻由高到低的前30個詞(完整詞表見《中國科技術語》官網,可掃描下面二維碼瀏覽)。

4 結果與討論

為了檢驗通用漢語學術詞表的有效性,我們計算了詞表對漢語學術語料庫CAC的覆蓋率。同時,以北京語言大學BCC現代漢語語料庫和蘭卡斯特LCMC現代漢語語料庫為例,考察了詞表對現代漢語語料庫各領域文本的覆蓋情況。通用漢語學術詞表中各學術詞匯對CAC漢語學術語料庫、BCC語料庫和LCMC語料庫的覆蓋率,見表3。

由表3可見,通用漢語學術詞表對CAC漢語學術語料庫的覆蓋率達到25.88%。而AWL的570個詞族對學術英語語料庫的覆蓋率約為10%;AVL的3015個詞元對COCA語料庫學術文本庫的覆蓋率約為14%。與AWL和AVL相比,我們創建的通用漢語學術詞表對學術語料庫的覆蓋情況更為理想。詞表對BCC和LCMC學術、科技子語料庫的覆蓋率均超過了18%,顯示詞表的覆蓋性較好。通用漢語學術詞表對CAC漢語學術語料庫和對BCC學術子語料庫的覆蓋率相差約7%。原因可能在于CAC和BCC學術子語料庫采用了不同的分詞系統,通用漢語學術詞表中的一些詞在BCC語料庫中并未處理成詞,因此,其對BCC語料庫的覆蓋率均顯示為0。所以,通用漢語學術詞表對BCC學術子語料庫的覆蓋率略低。通用漢語學術詞表對BCC學術子語料庫和LCMC學術子語料庫的覆蓋率都高于其他子語料庫。詞表對BCC學術子語料庫的覆蓋率為18.85%,是BCC新聞子語料庫覆蓋率的1.86倍,是文學子語料庫覆蓋率的6.81倍,是微博子語料庫覆蓋率的6.55倍;詞表對LCMC學術子語料庫的覆蓋率為23.86%,是LCMC新聞子語料庫覆蓋率的2.38倍,是文學子語料庫覆蓋率的8.71倍。詞表有較好的代表性。詞表對BCC新聞子語料庫和LCMC新聞子語料庫的覆蓋率均超過了10%,原因可能在于學術詞匯通常是書面語詞匯,而新聞大多也是書面語,所以學術詞表對新聞子語料庫的覆蓋率偏高。

通用漢語學術詞表對CAC漢語學術語料庫每個子語料庫的覆蓋率,見表4。

從表4來看,通用漢語學術詞表對CAC漢語學術語料庫每個子語料庫的覆蓋率均超過17%;詞表對經濟與管理科學、信息科技、工程科技Ⅱ三個子語料庫的覆蓋率均超過30%。可以說,詞表達到了相對較高的總體覆蓋水平。雖然我們采用了均勻分布的選詞標準,但詞表對各子語料庫仍未達到均衡覆蓋。詞表對經濟與管理科學庫的覆蓋率最高,為31.97%;詞表對哲學與人文社科庫的覆蓋率最低,為17.46%。詞表對這兩個子語料庫的覆蓋率相差近15%。這一現象在AVL中同樣存在,AVL對經濟學文本的覆蓋率幾乎是其對文學名著文本覆蓋率的兩倍[26]。這表明,不同的學科在詞匯使用上具有顯著差異[33]。

雖然各學科學術漢語詞匯存在一定的差異,但詞表反映出來對各學科子語料庫的覆蓋情況較為理想,基本可以滿足各學科學術漢語教學和學習的需要。可以將詞表看作是核心學術詞匯表。核心學術詞匯在各學科學術文獻中經常出現,使用頻率高,可以作為教學和學習的重點。漢語教師可以依據詞表進行相應的學術漢語課程設計,讓學生掌握核心學術詞匯,幫助學生更好地理解學術文獻和撰寫學術論文。同時,詞表也可為開發專門用途的漢語教材提供一定參考。此外,我們也應看到該詞表并未涵蓋所有的漢語學術詞匯。該詞表是有效性較好的通用漢語學術詞表,其規模不大,可以在一定程度上減輕學習者的學習負擔。

此外,考慮到開發通用漢語學術詞表主要為了銜接來華留學生的預科教育和本科教育這兩個階段[10],我們統計了預科《基礎漢語常用詞匯表》對幾個現代漢語學術語料庫的覆蓋率。又對創建的通用漢語學術詞表和預科《基礎漢語常用詞匯表》進行了詞表合并,計算出合并后詞表對現代漢語學術語料庫的覆蓋率。統計結果見表5。

從表5中我們看到,預科《基礎漢語常用詞表》對CAC語料庫的覆蓋率為65.11%,合并通用漢語學術詞表后對CAC語料庫的覆蓋率為75.07%,覆蓋率提高了近10%。兩個詞表合并后,對BCC科技子語料庫和LCMC學術子語料庫的覆蓋率也都有所提高。其中,對LCMC學術子語料庫的覆蓋率高達77.24%。數據表明,通用漢語學術詞表是對預科《基礎漢語常用詞匯表》的有效補充。學習者掌握了這兩個詞表中的詞匯,也就掌握了學術文本中的大部分詞匯。由此,學生能更好地理解專業課,更利于閱讀學術文獻,進而更好地完成學術論文寫作。

5 結語

學術詞表開發是學術漢語研究中的重要課題。漢語學術詞表的創建和研究是一項重要的工作,也是充滿挑戰的。本文通過自建漢語學術語料庫,借鑒英語學術詞表AWL和AVL的創建方法,嘗試開發了一個包含1368個詞型的通用漢語學術詞表。經過效度檢驗,通用漢語學術詞表在BCC和LCMC語料庫學術、科技子庫中的覆蓋率分別為18.85%和23.86%,而在文學庫和微博庫中的覆蓋率低于3%,表明其有別于通用詞表或其他領域詞表,詞表有一定的學術代表性。通用漢語學術詞表對各學科文本的覆蓋率均超過17%,能夠較好地服務不同專業領域的學術漢語教學和學習。詞表的規模不大,可以將其視為核心學術詞匯表。當然,通用漢語學術詞表在其他語料庫中的覆蓋情況和其有效性,還可進一步接受檢驗。

基于通用漢語學術詞表開發過程中受到的啟發,本文提出有待進一步研究的問題:一是需要開發不同學科領域的漢語學術詞表。不同學科的詞匯非常廣泛,沒有一個詞表能充分滿足所有學生的需求。考慮到各學科在學術詞匯使用上具有明顯差異,我們有必要開發針對不同學科的漢語學術詞表,如農學漢語學術詞表、化工漢語學術詞表等。二是擴大自建漢語學術語料庫的規模,補充專門用途漢語教材的語料。因為接受學歷教育的留學生除了閱讀期刊學術論文、撰寫學位論文,還要學習一些專門用途漢語教材。將這些教材語料補充上,能最大限度地保證漢語學術詞表收錄的詞就是他們在學習和研究中遇到的詞。我們曾經考慮不自建漢語學術語料庫,而直接在已有現代漢語語料庫的學術子庫中提取漢語學術詞匯。但是現有的現代漢語語料庫未提供各子語料庫的詳細樣本信息和相關數據,也就無法進行詞的廣泛分布、均勻分布和學科指數等指標計算。下一步的研究如果還是通過自建語料庫的方式來構建詞表,有必要加大語料庫的規模。三是要對通用漢語學術詞表中的學術詞匯進行分級。由于本科生和研究生使用的學術詞匯存在顯著差異,不同年級的本科生之間也存在顯著差異,因此,需要對通用漢語學術詞表中的學術詞匯進行分級,區分出適用于不同學習階段的學術詞匯,最大化地滿足學術漢語的教學和學習需要。

參考文獻

[1] NATION P.Learning Vocabulary in Another Language[M].Cambridge:Cambridge University Press, 2001:18-20.

[2] COXHEAD A. A new academic word list[J]. TESOL Quarterly,2000,34(2):213-238.

[3] 劉迪麟,雷蕾. 學術詞表研究綜述[J].外語教學, 2020(2):34-37.

[4] 劉宇紅,殷銘. 語言學語域的學術詞匯表與術語詞匯表[J].中國科技術語, 2022,24(2):47-54.

[5] GARDNER D, DAVIES M. A new academic vocabulary list[J]. Applied Linguistics, 2014, 35(3):305-327.

[6] VALIPOURI L,NASSAJI H. A corpus-based study of academic vocabulary in chemistry research articles[J]. Journal of English for Academic Purposes,2013,12(4):248-263.

[7] LIU J, HAN L. A corpus-based environmental academic word list building and its validity test[J]. English for Specific Purposes,2015, 39:1-11.

[8] LEI L, LIU D. A new medical academic word list: A corpus-based study with enhanced methodology[J]. Journal of English for Academic Purposes,2016, 22:42-53.

[9] 薛蕾. 基于漢語語言學論文語料庫的學術漢語詞匯析取及特征研究[D].昆明:云南師范大學, 2017.

[10] 王笑然,王佶旻. 經貿類本科專業學術漢語詞表研究[J].語言教學與研究,2022,(4):9-19.

[11] 錢隆,袁亮杰,王治敏.學科融合視域下醫學漢語學術詞表的構建[J].云南師范大學學報(對外漢語教學與研究版),2023,21(3):31-40.

[12] 朱明玉. 通用學術漢語詞表研究[D].昆明:云南大學,2020.

[13] EVANS S,GREEN C. Why EAP is necessary: A survey of Hong Kong tertiary students[J]. Journal of English for Academic Purposes,2007,6(1):3-17.

[14] 李泉. 論專門用途漢語教學[J].語言文字應用, 2011(3):110-117.

[15] 張黎. 專門用途漢語教學[M].北京:北京語言大學出版社,2016:1-10.

[16] 單韻鳴. 專門用途漢語教材的編寫問題:以《科技漢語閱讀教程》系列教材為例[J].暨南大學華文學院學報,2008(2):31-37.

[17] 高增霞,劉福英. 論學術漢語在對外漢語教學中的重要性[J].云南師范大學學報(對外漢語教學與研究版),2016(2):44-51.

[18] 王佶旻. 來華留學預科教育的漢語能力標準[J].語言教學與研究,2021(2):26-34.

[19] 張秀菊,羅煜寧,GAZI T E.提升來華留學研究生培養質量的針對性措施研究:以河海大學為例[J].外國留學生工作研究,2020(2):24-28.

[20] 李海燕,張文賢,辛平.本科留學生學術漢語寫作課需求調查與課程建設:以北京大學本科留學生學術漢語寫作通選課為例[J].國際漢語教育(中英文),2020(1):51-60.

[21] 肖珊,廖雅璐,徐成慧.“一帶一路”背景下高校留學生專門用途漢語能力需求分析模型及發展探討[J].語言產業研究,2021(3):198-206.

[22] 魯洲. 來華留學生專業學習的現狀與問題[J].外國留學生工作研究,2014(3):54-59.

[23] 張博. 學術漢語詞匯的主要特點及教學策略[J].世界漢語教學,2022(4):517-530.

[24] NAGY W, TOWNSEND D. Words as Tools: Learning Academic Vocabulary as Language Acquisition[J]. Reading Research Quarterly,2012, 47(1):91-108.

[25] COWAN J R. Lexical and syntactic research for the design of EFL reading materials[J]. TESOL Quarterly,1974, 8(4):389-399.

[26] DURRANT P. To what extent is the Academic Vocabulary List relevant to university student writing?[J]. English for Specific Purposes,2016(43):1-13.

[27] 桂詩春. 多視角下的英語詞匯教學[M].上海:上海外語教育出版社, 2013:165-166.

[28] 衛乃興. 語料庫語言學的方法論及相關理念[J].外語研究,2009(5):36-42.

[29] 郭曙綸. 漢語語料庫應用教程[M].上海:上海交通大學出版社, 2013:9-11.

[30] 崔維霞,王均松. 基于語料庫的詞表創建原則及方法研究[J].中國科技術語,2013,15(2):15-19.

[31] 尹斌庸,方世增. 詞頻統計的新概念和新方法[J].語言文字應用,1994(2):69-75.

[32] JULLIAND A, CHANG-RODRIGUEZ E. Frequency Dictionary of Spanish Words[M]. The Hague: Mouton,1964: LXVII-LXIX.

[33] DURRANT P. Discipline and level specificity in university students’ written vocabulary[J]. Applied Linguistics,2014,35(3):328-356.

作者簡介:高松(1982—),女,博士,大連外國語大學漢學院副教授,碩士生導師。研究方向為計算語言學、對外漢語教學。主持國家社科基金、教育部人文社科基金項目等5項。出版學術專著1部,發表論文20余篇,獲得省級獎項3項。通信方式:gaos_0808@163.com。

錢隆(1996—),男,北京語言大學國際中文教育研究院在讀博士研究生。研究方向為語料庫語言學、國際中文教育。通信方式:qianlong_blcu@163.com。

丁芊(1997—),女,安徽信息工程學院通識教育與外國語學院助教。研究方向為話語分析、功能語言學。通信方式:dingqian0801@163.com。

主站蜘蛛池模板: 91久久偷偷做嫩草影院| 国产精品欧美激情| 国产91熟女高潮一区二区| 2021精品国产自在现线看| 香蕉久久国产超碰青草| 亚洲欧洲日产国产无码AV| 视频二区中文无码| 亚洲一区网站| 国产精品免费露脸视频| 亚洲一区二区约美女探花| 在线毛片网站| 亚洲天堂精品视频| 岛国精品一区免费视频在线观看| 一级毛片免费观看不卡视频| 中文字幕亚洲综久久2021| 色婷婷色丁香| 在线欧美日韩国产| 手机在线国产精品| 国产精品久久久久久久久久久久| 国产一区二区三区精品久久呦| 亚洲色图欧美视频| 亚洲国产成人精品一二区| 亚洲成人一区二区| 日韩av资源在线| 福利国产在线| 精品夜恋影院亚洲欧洲| 国产尤物jk自慰制服喷水| 国产激爽大片高清在线观看| 亚洲精品欧美日韩在线| 天堂在线视频精品| 亚洲精品男人天堂| 91午夜福利在线观看| 经典三级久久| 中文字幕 91| 色偷偷男人的天堂亚洲av| 日本精品视频一区二区| 国产经典三级在线| 午夜福利免费视频| 凹凸国产分类在线观看| 免费无码又爽又黄又刺激网站| 久久精品视频亚洲| 77777亚洲午夜久久多人| 国产女人喷水视频| 伊人激情综合网| 国产97区一区二区三区无码| 亚洲国产综合自在线另类| 欧美亚洲激情| 中文字幕自拍偷拍| 四虎成人精品| 久久亚洲黄色视频| 91精品情国产情侣高潮对白蜜| 亚洲视屏在线观看| 高清久久精品亚洲日韩Av| 国产福利影院在线观看| 亚洲欧美在线综合图区| 日本在线视频免费| 国产男女免费视频| 91av国产在线| 国产微拍精品| 久久精品国产精品青草app| 蜜桃视频一区| 久久久久青草大香线综合精品| 国产在线91在线电影| 午夜福利免费视频| 91视频99| 在线视频亚洲色图| 亚洲 欧美 偷自乱 图片 | 视频一本大道香蕉久在线播放| 久久精品人人做人人爽电影蜜月| 亚洲色图欧美| 尤物视频一区| 波多野结衣一区二区三区88| 蜜臀av性久久久久蜜臀aⅴ麻豆| 国产精品尹人在线观看| 久久香蕉国产线看观| 欧美国产日韩在线| 色婷婷在线播放| 国产第二十一页| 欧美亚洲国产一区| 老司机精品久久| 红杏AV在线无码| 亚洲av中文无码乱人伦在线r|