999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據背景下機器翻譯在圖書館中的應用研究

2023-04-15 15:05:51鄭州輕工業大學戎璐
辦公室業務 2023年5期
關鍵詞:圖書館語言服務

文/鄭州輕工業大學 戎璐

2022年是“十四五”規劃和向第二個百年奮斗目標前進的關鍵之年,我國正處于科技飛速發展的關鍵時期,也是大數據產業迅速發展的時期。大數據產業的快速發展與數據的不斷積累,引起了數據驅動方式與算法范式的變革熱潮,以機器學習、深度學習為支撐的人工智能技術發展得如火如荼,已經廣泛應用到社會生活的各個領域,引發各行各業向自動化、智能化改革。對圖書館而言,借助人工智能技術的有效應用,推進傳統服務模式創新發展,構建智慧圖書館,不但能夠確保館藏資源的有效傳播與利用,還可以為廣大讀者帶來更加便捷、智能、精準的服務。

機器翻譯是人工智能的終極目標之一,被學術界視為人工智能研究皇冠上最耀眼的一顆明珠。機器翻譯肩負著架起語言溝通橋梁的重任,在促進圖書館自動化、智慧化、未來化建設中具有重要實用價值。因而,越來越多的研究者紛紛將目光轉向機器翻譯在圖書館領域的研究,他們在跨語言檢索、多語言服務等方面展開研究,并取得階段性進展。例如劉莉等人采用文獻分析法、案例分析法和網絡調查法等梳理機器翻譯在圖書館領域的發展現狀,并進一步提出未來的應用趨勢。同時還討論了機器翻譯研究的局限性,并立足于不同角度,試圖提出多語言自動翻譯平臺的構建策略。

此外,就機器翻譯在圖書館的應用現狀而言,國內許多圖書館如南京圖書館、浙江大學圖書館、云南高校圖書館、江蘇大學圖書館都在探索機器翻譯在信息檢索、文獻翻譯等方面的優化。但是通過反饋調查,發現仍然存在對縮寫詞、新生詞以及長難句等翻譯效果不佳的情況。就鄭州輕工業大學圖書館而言,網上圖書館已經能夠進行中英文檢索,構建起了圖書雙語檢索平臺,這一點極大地方便了師生對館藏資源的利用。但是,如何將圖書館內的數字資源與機器翻譯更好地結合,在搜索的同時還能準確地對文獻進行自動實時翻譯,以便能夠同時服務于不同專業學生的借閱需求、滿足不同層次學生的文獻檢索查閱需要,實現館藏資源的最大利用,還有待進一步挖掘與探索。此外,機器翻譯在現有圖書館中應用范圍與廣度的潛力還有待開發。

上述研究成果與應用現狀推動了機器翻譯在圖書館中的研究,也鼓勵了本文的開展。但是,現有研究因其學科視角與切入點不同,導致其對機器翻譯的理解各異,尚未形成全面的視野。

針對此,本文立足于大數據時代背景,首先歸納機器翻譯的內涵和發展脈絡,梳理機器翻譯在圖書館領域的國內外研究現狀。其次分析了領域內主流研究方法的優勢與不足,剖析目前存在的研究問題,并提出簡單的解決方案。最后展望未來可能的研究方向與設想,以期對機器翻譯在圖書館的應用路徑提供新思考與啟發。

一、相關性研究

(一)機器翻譯的內涵與發展。機器翻譯是人工智能的重要分支之一,旨在通過計算機與領域知識將一種語言自動轉換成另一種語言。機器翻譯綜合了計算機科學、信息學、語言學、統計學、社會學等各個學科知識,研究領域覆蓋深度學習、語法規則、俚語文化等多個主題,內含多學科視角與跨學科本質。機器翻譯的起源可以追溯至公元前8到9世紀的古希臘時期,Al-Kindi最早萌生語言翻譯的靈感,開發出系統語言翻譯技術,包括機器翻譯中使用的密碼分析、概率和統計等規則。隨后,機器翻譯的概念出現于17世紀,法國哲學家、數學家René Descartes提出一種設想:創建一種通用語言,使得不同語言的相同思想共享一個符號。

隨著科技與文明的不斷前進,自50年代至60年代,前蘇聯與美國紛紛加大對機器翻譯項目的資金支持,展現出一時的繁榮。受限于當時計算機硬件水平,機器翻譯無法達到成熟且可被人接受的語言翻譯質量,與人工翻譯標準相去甚遠,其經歷短暫的繁榮期后進入蕭條期。步入80年代后,隨著計算機硬件水平的提高和成本的降低,研究者對機器翻譯的統計模型表現出更多興趣并進入實用化階段。自此,隨著計算機硬件與軟件的不斷提升,社交網絡的流行與數據量的激增,對機器翻譯的研究如火如荼。特別是深度學習提出以來,基于深度學習的機器翻譯更是勢如破竹,不僅質量達到人工翻譯的水平,而且效率遠超人工。機器翻譯真正走向實用,成功應用到政治、文化、經濟等各行各業。

據《2022中國翻譯及語言服務行業發展報告》統計顯示,語言服務提供商和服務需求方均認為機器翻譯前景廣闊,89%的語言服務企業希望投入更多的資金以支持本企業在機器翻譯領域的發展,92.9%的翻譯語言服務需求方認為機器翻譯技術的使用可以提高翻譯質量。此外,機器翻譯的研究成果也不斷涌現,例如NiuTrans支持300種語言互譯,是全球支持語種對最多的供應商。瀾舟科技在“漢語與15種語言”的機器翻譯上達到了世界領先水平。谷歌推出“一千種語言計劃”以支持全球1000種常用的語言模型。

(二)機器翻譯在圖書館的應用研究現狀。隨著機器翻譯技術在圖書館自動化、智慧化、未來化建設方面展現的廣闊前景,越來越多的國內外研究學者將目光聚焦于研究機器翻譯在圖書館中的應用,本文將概述與總結目前國內外本領域研究現狀。

1.國內研究現狀。國內主要以知網數據庫為文獻數據源,搜集了2012年至2022年近10年的相關研究。通過對文獻的梳理與分析,本文將目前的研究分為四個方面,分別是機器翻譯與跨語言服務、機器翻譯案例研究、機器翻譯與檢索模型構建以及多語言翻譯平臺構建。

在機器翻譯與跨語言服務方面,司莉等人立足于調研跨語言檢索視角,采用文獻調研法和網絡調研法,選取11個國內外典型的跨語言檢索平臺進行研究,提出多語種翻譯型數據庫的跨語言檢索功能開發策略;針對機器翻譯案例研究,陳江萍等以德州歷史數字圖書館作為研究案例,通過Google、Systran和Bing三個在線翻譯系統進行人工評價,得出Google和Bing在未經過任何語料庫訓練情境下翻譯效果更好的結論,討論了借助Google翻譯融入數字化圖書館建設;對于機器翻譯與檢索模型構建,余如等針對傳統數字圖書館跨語言檢索的問題,提出了一種新穎的圖書館漢英跨語言信息檢索模型,該模型構建了漢英查詢詞互譯關聯規則,最后改進了現有圖書檢索系統的全面性與準確性;對于多語言翻譯平臺構建,徐莉等提出以機器翻譯技術為核心,將其融入智慧圖書館建設,構建一個多語言自動翻譯平臺,以服務于圖書館多語言檢索、多語言信息共享等。

2.國外研究現狀。國外主要以谷歌學術(Google scholar)和Scopus數據庫為文獻數據源,搜集了2012年至2022年近10年的相關外文文獻,通過對文獻整合分析、歸納梳理,將其分為針對發展意義和問題探討兩類研究。針對機器翻譯在圖書館的發展意義研究,Bowker等將渥太華公共圖書館的借閱服務翻譯成西班牙語以滿足西班牙語新用戶的需求,他們通過對四個翻譯版本,分別是基礎機器翻譯、快速編輯的機器翻譯、最大限度人工編輯的機器翻譯和專業人工翻譯進行人工評估,結果顯示,基礎機器翻譯無法滿足用戶的需求與標準,但是經過快速編輯后的機器翻譯已經可以基本滿足用戶的查閱需求。他們認為機器翻譯在圖書館中的研究可以有效提升圖書館自動化水平,提升不同語種用戶的滿意度,對新時代圖書館建設的發展路徑具有重要研究意義。針對機器翻譯在圖書館的問題研究,Bowker拋出機器翻譯在圖書館應用的新問題:如何基于機器翻譯技術提升圖書館員翻譯素養,以提升自身工作能力,滿足工作需要。對此問題,他們也給出了自己的答案,即與翻譯專家、語言學專家合作,請專家參與培訓圖書館員以及定時改進機器翻譯技術。他們同樣認為機器翻譯是一把“雙刃劍”,翻譯人員有責任幫助非語言專業人員掌握機器翻譯,而與圖書館合作就是非常有效的一種方法,達到了普及機器翻譯的目的;Tripathi等則立足于社會倫理,提出獨特的社會問題:如何評判圖書館管理人員與機器翻譯技術的依賴關系?針對此問題,他們認為圖書管理人員和其他信息專業人員對于現有的機器翻譯工具不可過分依賴,可以借助工具進行初始分類,但對于文檔內容分析,仍需要在語言專家的幫助下對內容進行分類或提供給用戶。

二、機器翻譯在圖書館的實踐情況

結合筆者日常工作而言,機器翻譯在圖書館中具有多方面的影響。首先,對信息資源智能化建設影響較為顯著,主要體現在可以基于查詢人員(一般是借閱者)的查詢詞精準分析他們的需求,自動完成在線精確檢索多語種文獻資源,智能多語種標引、智能多語種摘要、多語種學科導航、構建多語種知識庫等知識組織工作。其次,是對圖書館服務的影響較為顯著。機器翻譯可以有效協助留學生、外籍人士等自助辦理借閱證、館內導航、選座定座、檢索、借還,提高服務效率,降低人工成本,也可以基于機器翻譯技術舉辦多語種閱讀推廣、閱讀交流、多語種講座、展覽、文化休閑等活動。筆者所在的大學圖書館更是正在籌備實施館外智能中英文快遞文獻服務,延伸服務范圍,服務于中文、英文借閱者。此外,機器翻譯對圖書館員的影響較為顯著,可以協助圖書館員完成多語種圖書咨詢,提升工作效率與質量。但是機器翻譯的普及,也給圖書館員帶來壓力,使得館員也需要同時學習外語以及相應的翻譯技巧,轉向學習型人才。

三、機器翻譯在圖書館應用中存在的研究問題

基于上述研究現狀與實際應用分析,機器翻譯在圖書館中的應用研究目前主要圍繞跨語言服務、機器翻譯質量評估、解決對策設想等方面展開。其中仍然存在若干問題有待解決。

(一)機器翻譯技術適用范圍的局限性。首先,是機器翻譯和翻譯技術適用范圍有限,對文獻題材翻譯質量良莠不齊,主要體現在對專業性較高的文檔,如新聞或者科技文獻等翻譯效果尚佳,對文學性、風俗性題材則不盡人意。目前最先進的神經機器翻譯系統也只在對話和新聞翻譯方面取得較好效果。其次,是機器翻譯缺乏形象思維能力。翻譯作為人類最復雜的認知活動之一,不僅需要邏輯思維能力,形象思維能力也必不可少,機器翻譯可以通過數據訓練學習邏輯思維能力,但無法學習人類的形象思維,所以在處理文學性較強的文檔時翻譯效果較差。再次,機器翻譯對長句、難句翻譯會出現邏輯混亂的情況。機器翻譯以語句為單位進行輸入,同樣以語句為單位進行輸出。實驗證明,當語句單詞數超過60個詞時,機器翻譯就很難厘清語句內部的邏輯關系。最后,機器翻譯對文本的深層含義難以準確翻譯,特別是一些隱晦性表達,機器翻譯往往難以傳其神。

(二)機器翻譯數據庫建設規模不足。數據庫建設對機器翻譯的長期發展意義重大,是機器翻譯發展的驅動與保障,調查顯示語料庫規模需達到1500萬語句時,基于神經網絡的機器翻譯性能才優于統計翻譯。但在實際中發現,主流語言如中文、英語、日語等數據庫資源比較豐富,而其他小語種資源則難以達到此規模。此外,主流語種之間的互譯也主要集中在新聞和科技文本數據庫中,其他領域例如文化類文檔語料庫相對缺乏。

(三)對最新成果關注度以及與圖書館發展契合度欠缺。《2020中國語言服務行業發展報告》顯示,語言服務研究大多關注學科前沿熱點,但對行業實際問題關注不足。雖然機器翻譯目前應用到各個領域,但在圖書館應用方面模式較為單一,圖書館其他方面的應用還有待探索。此外,機器翻譯主要應用于文本翻譯任務,而語音翻譯方面則鮮有涉及。隨著圖書館智慧化建設,如何將機器翻譯應用到圖書館適合的應用場景中還有待進一步探索與發現。

(四)缺乏完善的理論指導。機器翻譯并沒有一種完善的方法或者成熟的理論去指導機器翻譯在圖書館中的發展與應用。此外,在專業人員方面,圖書館缺乏具有機器翻譯素養的人才,導致機器翻譯在實際應用中無法做到物盡其用,這些都將影響機器翻譯在圖書館的應用潛力。

四、未來發展對策與展望

(一)人機合作新模式,提升翻譯質量。據《2022中國翻譯及語言服務行業發展報告》統計顯示,91%的語言服務企業認為采用“機器翻譯+譯后編輯”模式提高了翻譯效率。針對機器翻譯譯文本身質量而言,采用人機合作可以更好地提升機器翻譯質量,給用戶帶來更好的體驗。對譯文質量要求不高的文本如網頁信息、郵件等可以采用機器翻譯;對譯文質量要求適中的文本如法律文獻、醫學著作等可以采用人機結合的方式;對譯文要求質量較高的文本如文學、哲學等文本則仍需要專業人工處理。針對不同的文本選擇不同的人機合作模式可以有效提升翻譯質量,節省人力物力,促進圖書館智慧化轉型。

(二)加強多語種數據庫構建,推動多語言翻譯平臺建設。據《2022中國翻譯及語言服務行業發展報告》統計顯示,近年來,語言服務企業翻譯語種主要集中在英語、法語、日語等常用語種,但主要語種的業務比重明顯下降,其他小語種有所上升。總體而言,語言服務企業語種業務呈多元化發展趨勢。加快構建多語種數據庫對于機器翻譯的速度和質量有著重要意義。此外,多語言翻譯平臺的構建也勢在必行,越來越多的研究者試圖提出信息檢索模型和多語言自動翻譯平臺的設計構想,以期推動多語言翻譯平臺的創建。

(三)加強最新成果轉化,尋求機器翻譯與圖書館的契合點。大數據背景下,圖書館正面臨從傳統圖書館向數字圖書館再到智慧圖書館的轉型,圖書館的服務內容和服務方式正面臨重大的變革,圖書館不應只將關注點放在跨語言服務中,還需要隨時關注機器翻譯的最新成果,例如將語音翻譯應用到圖書館中以此來提高翻譯效率。此外,一些新型技術在圖書館中的應用已經取得一些成果,如AR和VR技術等,圖書館可以將機器翻譯與AR、VR技術結合使用,進一步提升讀者的閱讀體驗。此外,機器翻譯在圖書排序、圖書組織、索引等方面的應用也亟待探索。

(四)加大對機器翻譯理論的研究力度。單靠數據驅動的機器翻譯方式難以同時做到“信、達、雅”,本質上還是要推動對語言翻譯、語言規則的研究,創建機器翻譯的理論體系,進而衍生出機器翻譯在圖書館的理論指導,例如圖書館文檔規則下的機器翻譯偏好等。應當以理論指導應用,促使機器翻譯在圖書館發展中更完善、更嚴謹。

五、結語

機器翻譯在推動圖書館向智慧化轉型方面的重要性已經被各行各業所認識,其在圖書館中的應用已經成為圖書館建設中的核心研究課題,受到學術界與工業界的共同關注。本文在上述章節中詳細描述了機器翻譯的各個方面,通過這些描述,對機器翻譯的研究背景、問題定義、發展脈絡與最新現狀、相關性工作及已存在的科學問題具備清晰的了解。針對現有工作的不足,試圖提出若干策略與設想。例如通過人機合作來提升翻譯質量、提高效率、節約成本,推動多語言數據庫的建設,加快多語言翻譯平臺的構建,關注機器翻譯技術的最新成果,尋求在圖書館應用中的契合點等。雖然機器翻譯在圖書館的應用已經取得階段性成果,但未來機器翻譯領域的發展還有待進一步探索與研究。

猜你喜歡
圖書館語言服務
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
服務在身邊 健康每一天
今日農業(2019年12期)2019-08-15 00:56:32
服務在身邊 健康每一天
今日農業(2019年10期)2019-01-04 04:28:15
服務在身邊 健康每一天
今日農業(2019年16期)2019-01-03 11:39:20
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
讓語言描寫搖曳多姿
招行30年:從“滿意服務”到“感動服務”
商周刊(2017年9期)2017-08-22 02:57:56
累積動態分析下的同聲傳譯語言壓縮
飛躍圖書館
我有我語言
主站蜘蛛池模板: 青草视频在线观看国产| 91麻豆国产精品91久久久| 久久精品丝袜| 成人自拍视频在线观看| 免费看一级毛片波多结衣| 色天堂无毒不卡| 亚洲人人视频| 91精品免费久久久| 国产精品国产三级国产专业不| 久久精品aⅴ无码中文字幕| 亚洲欧美日韩高清综合678| a毛片免费在线观看| 欧美三级日韩三级| 亚州AV秘 一区二区三区| 四虎永久在线视频| 久久久国产精品无码专区| 国产成人a毛片在线| 久久99蜜桃精品久久久久小说| 欧美啪啪网| 国产成人精品亚洲77美色| 亚洲va在线观看| 成人国产精品2021| 色综合日本| 久青草免费在线视频| 亚洲va欧美va国产综合下载| 欧美精品三级在线| 新SSS无码手机在线观看| av在线无码浏览| 中文字幕在线看| 国产伦片中文免费观看| 在线欧美国产| av尤物免费在线观看| 成年女人a毛片免费视频| 色亚洲成人| 嫩草国产在线| 午夜视频在线观看免费网站| 美女啪啪无遮挡| 中文字幕在线欧美| 亚洲综合亚洲国产尤物| 中文字幕在线欧美| 中文字幕日韩久久综合影院| 国产日韩欧美成人| 久久亚洲国产一区二区| 麻豆国产在线不卡一区二区| 国产成人调教在线视频| 亚洲无码高清免费视频亚洲| 国产波多野结衣中文在线播放| 欧美日韩va| 最新亚洲人成无码网站欣赏网| 精品黑人一区二区三区| 精品福利网| 欧美午夜在线播放| 国产毛片高清一级国语 | 亚洲AV无码久久精品色欲| 欧洲在线免费视频| 人禽伦免费交视频网页播放| 在线免费亚洲无码视频| 91精品国产麻豆国产自产在线| 亚洲欧洲日本在线| 久久无码免费束人妻| 日本午夜影院| 四虎精品国产AV二区| av免费在线观看美女叉开腿| 亚洲日韩精品欧美中文字幕| 91色国产在线| 激情亚洲天堂| 国产一国产一有一级毛片视频| 国模沟沟一区二区三区| 99re视频在线| 欧美精品亚洲精品日韩专区| 欧美亚洲一区二区三区导航| 亚洲AV一二三区无码AV蜜桃| 国产精品网址你懂的| 亚洲日本www| 国产亚洲高清视频| 亚洲色欲色欲www网| 久久黄色毛片| 国产无码网站在线观看| 原味小视频在线www国产| 亚洲国产成人在线| 国产h视频在线观看视频| 一本无码在线观看|