摘要:語料庫在學術論文英文摘要寫作中的應用是研究中心。根據對語料庫應用現狀的研究,認識到學術論文英文摘要寫作中語料庫的重要性。明確語料庫應用研究目的,加大對語料庫設計的研究力度,該文結合語料庫創建現狀,以新能源科技型學術論文英文摘要寫作短語應用案例為基礎,對英文摘要寫作語料庫應用關鍵點準確掌握,目的在于提高學術論文英文摘要寫作水平。
關鍵詞:學術論文英文摘要語料庫語料采集
中圖分類號:H315文獻標識碼:A? ?文章編號:1672-3791(2022)03(b)-0000-00
Title of the Article: The Application of Corpus in English Abstract Writing of Academic Papers
KONG Zhimin
(Foreign Languages College of Jiamusi University, Jiamusi, Heilongjiang? Province,154007? China)
Abstract: The application of corpus in English abstract writing of academic papers is the center of the research. According to the current research on the application status of corpus, the importance of corpus in academic English abstract writing is realized. It’s necessary to have a clear research purpose of the application of corpus, intensify the study of corpus design. To aim at the improvement of the level of academic English abstract writing, it should take the phrasesapplication cases of new energy science and technology academic English abstract writing as the basis, and connect it with the present situation of the creation of corpus to grasp the key points of corpus in English abstract writing application accurately.
Key Words:Academic papers;English abstract;Corpus;Language acquisition
1學術論文英文摘要寫作中語料庫應用現狀
語料庫從20世紀90年代已經成為語言學研究關注的焦點之一,經過不斷研究創新,目前取得理想應用效果。尤其是實證性語言研究方法的應用,以語料庫作為研究與應用基礎,取得非常高的認可[1]。學術論文英文摘要寫作中,積極應用英文語料庫,幫助學術論文高效完成英文摘要寫作。語料庫應用當前主要包括兩方面:其一為通用語料庫;其二為專用語料庫。其一的核心是反映不同類型語言變體,參考BROWN語料庫以及ANC語料庫,集中于基礎性語料庫的相關研究。其二的核心是對特定領域、專業性強的情況下語言變體等加以反映,參考科技領域英文、醫學領域英文或者軍事領域英文[2]。
2 語料庫在學術論文英文摘要寫作中的應用研究目的
摘要在論文中還具有預示性作用,幫助讀者對學術論文的主題與核心內容有所了解。英文摘要的寫作,必須與中文摘要保持平行關系,為了提高英文摘要寫作水平,要科學應用語料庫[3]。當前最常用的語料庫為CEPAC——中外學術論文中英文摘要平行語料庫。研究的目的主要是為學術論文英文摘要寫作提供更多幫助,能夠準確掌握英文摘要寫作的關鍵點,并且對語類特征有所了解,科學區別中文摘要寫作特征,提高英文摘要寫作水平。此次研究應用的主要方法為平行語料庫技術。由定性、定量兩方面著手,在深入分析的同時,避免學術論文英文摘要寫作中出現片面性現象[4]。加大英文摘要寫作中語料庫的作用價值,對英文摘要寫作中語言表達進行合理規劃[5]。
3語料庫的設計與創建
3.1總體規劃設計
語料庫整體設計,明確文本相關應用與選擇規則。具體包括選樣規則、信息屬性、收集處理、對齊處理、多層級標注處理、軟件適應、撰寫標注手冊、自檢處理、統計處理、語料檢索處理等。
3.2語料采集加工
采集環節必須根據語料庫設計實施的隨機選樣原則為前提,重視時效性,及時對語料庫進行更新,同時不能忽視時效性。
縱觀采集的中英文摘要內容,均屬于翻譯對應類型[6]。結合期刊資料整合,語料庫按照學科主要劃分兩方面:其一是中國學術期刊——中文摘要語料庫;其二是國際期刊——英文摘要語料庫。隨即按照實際應用要求,分別劃分語料庫子庫。劃分標準以學科為主,第一是健康與衛生科學,第二是自然、理論、工程科學,第三是人文社會科學,第四是生命與生物醫學,第五是語言與文學科學。針對性地充實語料庫子庫,同時還要對文本內容進行核對,必須做到中英文摘要語料匹配平衡。針對語料庫中的內容,突出其代表性,及時進行信息性限定,充實語料庫的同時,還要做到學科、語際等可比性。
加工環節主要針對語料庫中的生語料為主。首先,根據語料內容,生成獨立摘要語料文檔。對文檔按照語料庫要求排序,摘要與文檔必須對立。
其次是對語料精準校對。語料采集中存在部分雜質,語料入庫之前需反復校對。借鑒語料庫雜質處理工作可以發現,單詞或者字符非常規,存在明顯的拼寫錯誤或者符號錯誤等。看似雜志處理簡單,但是語料資源廣、類型多,因此清潔整理難度非常大。
再次是標記語料以及雙語聯系。語料庫中包括中英文摘要內容,以同一期刊的中英文語料分別整理,建立獨立文檔的同時,還要保證兩者的雙語聯系。
最后是程序開發方面。語料標注作為加工整理的重要內容,為了加快語料標注效率,方便語料庫信息查新,加大文本轉化程序研究,根據寫作需要,及時生成需要的文本格式。當前文本轉化程序常見轉化格式以可機讀格式為主,同時還包括人讀友好格式。
元信息設置也是語料庫加工處理的重要環節。利用表頭文件、摘要內容兩種標記結構,完成元信息設置工作。元信息設置實際實施比較復雜,以表頭文件為例,涉及多項信息內容,如語料的學科門類,學科門類又劃分多種類型。語言類別信息,包括中文摘要內容、英文摘要內容。
3.3語料標注設計
語料標注設計,第一要研究標注工具,這是核心內容,從屬性標注角度出發,及時標注語料信息,標注軟件當前所應用以德國MMAX22為主。Java環境下,MMAX22運行在的主要標注格式為xml,及時完成語料儲存。
首先,將原始語料進行整理,隨后完成多層級語料信息標注,將標注語料單獨保存。在此基礎上增加語篇標注、界面保存等功能。其次是具有突出的應用優勢,不僅運行性能穩定,并且操作性非常強。最后是能夠根據語料庫使用需要,根據定制條件對語料展開變量應用,變量過程靈活。正因為如此,語料庫中該軟件得到廣泛應用。第二是語料句子的對齊。語料庫句子對齊的處理,根據語料內容,按照篇章級、句子級等進行層次劃分。中英文摘要資料,按照句級對其的方式進行標注,同時將表述信息科學整理,并且轉化語料庫信息屬性,為后期的應用提供方便。
4學術論文英文摘要寫作中語料庫的應用案例
4.1研究方法應用
學術論文摘要的地位與價值非常關鍵,體現著學術論文的寫作水平。新能源相關研究正在不斷深入,新能源技術應用越來越成熟,尤其是其中的發電領域,學術論文隸屬于科技研究類型,因此英文摘要寫作中必然會涉及科學英文。根據學術論文研究核心,英文摘要寫作中必須對研究對象加以明確,同時涉及的設備狀態以及技術等都要詳細介紹,其中不會摻雜過多的點綴詞匯,對名詞詞組應用比較多,這需要語料庫給予更多支持。對于英文摘要寫作中常用的基本英文詞匯,科技英文詞匯的特征更明顯。
4.2研究結論
以中國學術論文寫作,尤其是英文摘要寫作習慣方面為切入點分析,首先以母語遷移的方面出發,對英文摘要寫作中語料庫應用以及寫作要點等進行總結。第一,名詞化研究。主要包括兩個研究方向:其一是以某個詞類型為基礎,逐漸演變為名詞;其二是從底層小句為基礎,派生出名詞。在語料庫應用中,將其規劃為概念隱喻范疇,實際應用中,英文短語對其來龍去脈可以不去深究,但是對構詞習慣必須清晰掌握,這樣才能夠在論文英文摘要寫作中,對詞匯能夠精準應用。其次,從語體方面出發研究,名詞短語應用中,必須以學術論文英文摘要寫作結構為基礎,英文短語的應用必須能夠充分表達學術論文摘要的理性經驗,同時將客觀形象加以展現,在發揮短語修飾作用的同時,還要將摘要中所涉及的摘要、地點、類別以及用途等充分體現,滿足對科學類型學術論文摘要寫作抽象性、簡潔性寫作需要。尤其是“設計”這類詞匯,中國學者在英文論文寫作中,因為對名詞定語與英美學者有所差異,所以在英文短語詞匯應用中,會面臨強調性不足的問題,這主要因為長期的思維習慣所決定,屬于母語負遷移現象的明顯體現。
5結語
綜上所述,對于學術論文英文摘要寫作來講,語料庫的應用對摘要在語言精練以及邏輯整理等方面有重要幫助。根據對語料庫的設計可以發現,其中針對英文摘要寫作情況,及時收集整理大量語料,按照語料類別等加以劃分歸類,方便英文摘要寫作詞匯選擇。語料庫應用中,提高學術論文英文摘要寫作水平,尤其是翻譯教學與測試等方面,以扎實、準確的數據支撐,輔助英文摘要寫作完成觀點闡述。
參考文獻
[1] 王娜,董建民.基于語料庫分析的工科學術論文英文摘要寫作模式研究——以新能源發電專業為例[J].內蒙古師范大學學報:哲學社會科學版,2019,48(3):101-107.
[2] 陳姝妍.基于語料庫的中外作者學術論文英文摘要中語步對比研究[D].長春:長春理工大學,2018.
[3] 劉科成.基于語料庫的漢英學術論文摘要對比研究[D].長春:東北師范大學,2016.
[4] 張大群,周佳琪.學術論文摘要英譯聲音的學科比較——以第一人稱代詞為例[J].晉中學院學報,2020,37(1):101-104.
[5] 王松.基于語料庫的醫學論文英文摘要現狀分析[J].錦州醫科大學學報:社會科學版,2019,17(2):104-107.
[6] 楊青,張瑞紅,郭海波.基于語料庫的農業科技論文中英摘要的語步特點對比研究[J].榆林學院學報,2020,30(1):110-114.
基金項目:2021年度黑龍江省省屬高等學校基本科研業務費科研項目《學術論文摘要中“推廣性”寫作策略研究》(項目編號:2021-KYYWF-1368)。
作者簡介:孔志敏(1978—),女,碩士,講師,研究方向為英語語言學、翻譯學。