999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于石油學術期刊摘要語料庫的文本特征分析與詞匯比較

2024-01-27 13:41:44彭曉曉
現代商貿工業 2024年4期
關鍵詞:翻譯

彭曉曉

摘?要:本文利用AntConc語料庫工具,從文本和詞匯角度研究了TA語料庫,TA語料庫由505篇石油科技外文期刊摘要構成,含130?000詞。研究發現,TA中被動語態的使用頻率比AmE06_130語料庫高出19.35%;對于人稱代詞,“it”和“we”的頻率最高;oil的詞頻是petroleum的13倍。

關鍵詞:翻譯;語料庫研究;摘要語料庫;石油文本;AntConc

中圖分類號:F74?????文獻標識碼:A??????doi:10.19311/j.cnki.16723198.2024.04.022

1?數據收集及工具選擇

1.1?數據收集

本研究從《AAPG?Bulletin》《Bulletin?of?Canadian?Petroleum?Geology》《Journal?of?Petroleum?Science?and?Engineering》《Petroleum?Exploration?and?Development》和《Petroleum?Science》5個期刊中,選取了2022–2023年出版的505篇摘要,建立了一個130?000詞的摘要語料庫TA。相比以往研究,本研究的樣本數量擴大了一個數量級。從AmE06語料庫中,按分類等比例提取了約130?000詞內容,建立了參照語料庫AmE06_130,用于提取TA中的關鍵詞單。

1.2?工具選擇

AntConc是一款語料庫分析工具,支持Raw?files導入,或將多個Raw?files打包成(.DB)文件,方便切換語料庫。

2?文本特征分析

2.1?被動語態分析

正則表達式可以檢索被動語態結構,檢索前需對目標語料庫進行詞性標注處理。本研究利用TagAnt軟件完成了對語料庫的詞性標注。顯示信息設置為word+pos_tag,其余按照默認選項運行。標注完成后,經測試下列表達式能夠檢索被動語態結構:

(be|am|is|are|was|were)_VBw*s+w+_VBN

上述表達式會匹配這一結構:be動詞后面緊跟著一個過去分詞形式的動詞。結果如表1所示:

綜上所述,TA語料庫的被動語態使用頻次高出AmE06_130語料庫達19.35%。與以往研究結果相吻合,被動語態的使用頻率雖然高,但并未高過主動語態。

2.2?人稱代詞分析

英語中的人稱代詞共12種詞型,作者利用通配符檢索所有詞型,并核實結果對應的上下文判斷是否正確,再對錯誤結果進行修正。最終確定5種人稱代詞,結果如下:

數據顯示,“it”和“we”的使用頻率最高,其余人稱代詞均為復數形式,且僅有第一人稱和第三人稱形式。目標語料庫中沒有出現第一人稱單數形式(I和me),且沒有出現第二人稱的任何一種形式(you)。

2.3?N元模式分析

N-Gram工具可以生成目標文件中的N元列單。隨著Size逐漸增大,結果數量會逐漸減少。研究發現,數值設定為2-5時,檢測出的結果最具有代表性。我們截取了前100條結果,并將其中內容分為兩個大類:

(1)石油科技文本表達;

(2)摘要文本表達。

在N-Gram?Size設定為3的情況下,“oil?and?gas”的頻次最高。摘要文本表達相關的結果可歸為數個類別:表示“發現”、指代“本文”等。“石油科技”相關結果單獨歸為一類。

2.4?詞云圖分析

詞云圖能夠可視化詞單數據,通過字體大小和顏色深淺來體現詞重要性。生成詞云圖的數據樣本取自關鍵詞單。作者利用停用詞單(Stopword)對結果進行清洗(去除and,?of等虛詞)。處理完原始數據后,本文作者在詞云圖工具中,設置圖片尺寸寬900高450,最大詞數為300,輸出值為Keyness?(Likelihood)。

在生成的詞云圖中,顏色越深代表關鍵性越大,越淺則相反;字體大小同理。從圖中容易看出,“oil”的顏色深、字體大,而?“petroleum”則小許多,顏色也更淺,兩者在圖中的位置用箭頭進行了標示。

綜上所述,本節從被動語態、人稱代詞、N元模式和詞云圖等4個方面分析了目標語料庫的文本特征。主要進行了無檢索詞檢索,從側面觀察目標語料庫的文本特征。

3?Oil和Petroleum的檢索及結果的對比分析

3.1?詞頻分析

這部分研究選取的樣本是TA語料庫,參照語料庫為AmE06語料庫。本文作者在Word和Keyword功能中檢索oil和petroleum,發現前者的詞頻是后者的約13倍,關鍵性是后者的約15倍。

3.2?詞叢分析

詞叢分析運用Cluster工具對語料庫進行分析,Cluster?Size為2。為了抓取盡量多的數據,檢索oil時,最小頻次和文檔范圍都設置為3,檢索petroleum時,最小頻次和文檔范設置為2。分別勾選On?Left(檢索詞位于左端)和On?Right(檢索詞位于右端),進行兩次檢索并匯總,最后人工清洗檢索結果,去除噪音數據。清洗后數據顯示,在目標語料庫中petroleum的結果全部位于左端,而oil的結果左右都有。

Petroleum的檢索結果:

綜上所述,這部分研究從詞頻、詞叢和Plot分析三個方面研究了oil和petroleum的區別。結合詞頻和Plot分析,我們發現目標語料庫中oil的使用頻率和關鍵性遠高于petroleum,且前者的Dispersion最大值以及前十數據平均值也都高于后者,最后統計了檢索詞的位置頻數。

4?結語

本研究選取了505篇石油科技外文期刊摘要,建立了目標語料庫,利用AntConc對目標語料庫進行了檢索分析。一方面,本研究采用無檢索詞檢索,研究分析了目標語料庫的文本特征;另一方面,選取了oil和petroleum兩詞進行詞匯層面對比研究。但是,本研究中目標語料庫構成是一元的,oil和petroleum的詞頻對比數據需要在更大的語料庫且成分更多元的語料庫中進行驗證,希望為后續研究提供借鑒和參考。

參考文獻

[1]Anthony,?L.?(2022).?AntConc?(Version?4.2.0)?[Computer?Software].Tokyo,?Japan:?Waseda?University.Available?from?https://www.laurenceanthony.net/software.

[2]Qayyum?N,?Syed?S?F.?Gender?Representation?in?A?Thousand?Splendid?Suns:?A?Corpus-Based?Stylistic?Analysis[J].Journal?of?Excellence?in?Social?Sciences,2023,2(1):2036.

[3]陳柯,楊醫碩.基于AntConc3.2.4軟件的石油英語詞匯的檢索和分析[J].信息與電腦(理論版),2022,34(15):1014.

[4]崔艷秋.《出版人周刊》視域下的中國當代文學——基于AntConc語料分析[J].當代作家評論,2020,(04):189195.

[5]孫毅,王龍本.英文旅游新聞蓄意隱喻的理解與漢譯研究[J].外語教學理論與實踐,2020,(02):7280.

[6]王春艷.免費綠色軟件AntConc在外語教學和研究中的應用[J].外語電化教學,2009,(01):4548+78.

[7]王霞,姜孟.基于Antconc對近十年殘聯聽力障礙相關政策文件的特征分析[J].北京聯合大學學報,2020,34(02):7683.

[8]于強福.基于語料庫的工科碩士學位論文英文摘要語類使用問題及其對策探析[J].華北理工大學學報(社會科學版),2022,22(03):121128+154.

猜你喜歡
翻譯
從意識形態角度對《麥田里的守望者》兩譯本的研究
計算機輔助翻譯與教學設計探討
淺談英漢翻譯中的望文生義現象
人間(2016年28期)2016-11-10 23:42:36
從句子層面淺析英漢語言差異對翻譯的影響
中國文學作品外譯策略研究
淺談漢語顏色詞的解析及英譯
本科英語專業翻譯教學改革與實用型翻譯人才的培養
淺析跨文化交際
人間(2016年26期)2016-11-03 18:34:20
商務英語翻譯在國際貿易中的重要性及其應用
小議翻譯活動中的等值理論
考試周刊(2016年77期)2016-10-09 10:36:47
主站蜘蛛池模板: 婷婷亚洲最大| 在线国产三级| 亚洲激情99| 理论片一区| 国产综合精品日本亚洲777| 91在线无码精品秘九色APP| 欧美一区二区福利视频| 亚洲成人77777| 国产男女XX00免费观看| 久久精品电影| 国产鲁鲁视频在线观看| 亚洲无码A视频在线| 国产成人AV大片大片在线播放 | 亚洲精品波多野结衣| 色爽网免费视频| 国产女人水多毛片18| 无码国内精品人妻少妇蜜桃视频| 亚洲综合第一页| 亚洲欧美国产五月天综合| 亚洲国产理论片在线播放| 亚洲一区二区视频在线观看| 无遮挡一级毛片呦女视频| 五月激情婷婷综合| 青草国产在线视频| 国产精品手机在线播放| 日韩午夜片| 国产精品 欧美激情 在线播放| 国产无码网站在线观看| 狠狠色成人综合首页| 欧美激情视频二区三区| 老司机午夜精品网站在线观看 | 欧美日韩v| 97一区二区在线播放| a级毛片网| 99资源在线| 无码精品国产dvd在线观看9久| 中国精品久久| 高清无码一本到东京热| 精品久久人人爽人人玩人人妻| 18禁不卡免费网站| 香蕉在线视频网站| 久青草免费在线视频| 欧美乱妇高清无乱码免费| 亚洲精品久综合蜜| 国产经典免费播放视频| 中文字幕久久精品波多野结| 国产主播在线一区| 97se综合| 国产无码高清视频不卡| 2022国产无码在线| 日本久久网站| 日韩国产综合精选| 久久久成年黄色视频| 亚洲色图综合在线| 香蕉色综合| 国产欧美精品专区一区二区| 综合色88| 91亚洲精选| 国产高清色视频免费看的网址| 男女性午夜福利网站| 国产精品分类视频分类一区| 波多野结衣二区| 无码精油按摩潮喷在线播放| 国产精品第| 91色在线观看| 国产人免费人成免费视频| 在线va视频| 91精品国产麻豆国产自产在线 | 伊人精品视频免费在线| 国产精品专区第1页| аv天堂最新中文在线| 米奇精品一区二区三区| 久久久久亚洲精品成人网| 色婷婷天天综合在线| 精品午夜国产福利观看| 欧美一级特黄aaaaaa在线看片| 久久综合丝袜长腿丝袜| 国产99久久亚洲综合精品西瓜tv| 玖玖精品在线| 亚欧美国产综合| 无码高潮喷水在线观看| 香蕉综合在线视频91|