999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

術語知識庫信息資源建設的多模態發展

2024-05-13 16:08:23曾朵
信息系統工程 2024年4期

曾朵

摘要:語言基礎設施是數字時代新媒體和網絡支撐下的信息、知識傳播與承載的集成體,是語言數據、工具、技術整合和信息化建設的標志,術語知識庫即為語言基礎設施的典型代表。結合當前社會表達“視頻化”的數字時代現狀,提出術語知識庫作為特定領域術語、概念、知識的系統化、可視化呈現,其未來將向多模態信息資源建設發展,如使用短視頻的呈現形式,即利用語言、視覺、聽覺、姿勢、空間等多模態符號資源再現術語概念相關知識。術語知識庫的短視頻多模態信息資源將為特定行業領域如翻譯的科研、教學和實踐提供重要支持。

關鍵詞:術語知識庫;語言基礎設施;多模態;短視頻;翻譯技術

一、前言

2021年《國務院辦公廳關于全面加強新時代語言文字工作的意見》發布,指出我國語言文字信息技術創新不適應信息化和人工智能發展需求,要求推進語言文字融媒體應用,加強語言文字信息化平臺建設,提供優質學習資源和信息服務資源。語言基礎設施是數字時代信息、知識傳播與承載的集成體,是語言數據、工具、技術整合和信息化建設的標志,術語知識庫即為語言基礎設施的典型代表。作為信息服務資源的構成,術語知識庫的建設與發展有助于我國新時代語言文字工作。

術語知識庫是特定領域概念知識的結構化表達,通過可視化呈現術語語義的邏輯關系,實現了術語管理、翻譯技術與知識本體的有機結合[1]。當前,術語知識庫作為數字化、多模態傳播媒介呈現出多語言發展與多模態實現趨勢[2]。受歐盟“多語主義”理念影響,多語術語知識庫建設符合“多語主義”語言政策,進一步為不同國家跨文化交流奠定基礎。信息知識資源的多模態傳播符合數字時代用戶的數字認知要求,以EcoLexicon為代表的部分術語庫已實現多模態構建,在用戶界面實現融合語言模態和視覺模態的多模態表征,即為相關概念提供對應圖片等可視化數據,幫助用戶理解概念內涵、術語間關系等。

短視頻作為多模態產品,是新媒體時代炙手可熱的網絡視聽媒介,已成為社會表達“視頻化”的主要表征,不僅在用戶規模、經濟效益等方面取得顯著成績,而且具備社會影響力,能夠影響人們的思維方式[3],可以預見術語知識庫的短視頻多模態呈現趨勢,本研究關注術語知識庫的短視頻多模態信息資源建設。

二、術語庫及術語知識庫概述

術語庫是專業領域術語資源的集成。根據國家標準化管理委員會2019年發布的《建立術語數據庫的一般原則與方法》(GB/T 13725-2019),術語是專業領域中一般概念的詞語指稱,術語數據庫是儲存術語信息的數據庫。術語庫類型多樣,術語條目是術語庫的基本單位,指術語信息集合中包含的一個概念相關的術語數據。術語庫的建庫程序包括基于語料庫的術語提取、術語標準化和術語管理。其中,術語管理指任何對術語信息的深思熟慮加工,術語管理系統專為譯員、術語專家和其他用戶設計,用于收集、維護、獲取術語數據。術語庫管理有助于系統性收集、描述、處理及傳播概念及其指稱。

術語知識庫是知識本體在語言服務領域的適應性變體[4],是術語庫的發展與超越,是術語管理邁向知識管理的標志。術語知識庫的概念最早于1992 年由加拿大渥太華大學信息技術與工程學院的英格麗·邁爾(Ingrid Meyer)提出,其以英法雙語術語知識庫COGNITERM為建設雛形,討論了術語知識庫的基本結構與功能[5]。此后,伴隨著數字技術、大數據與人工智能等互聯網技術的不斷發展更新,術語知識庫依靠術語學、語言學、計算機科學、知識工程學等相關學科領域的理論、方法,在理論基礎、資源建設、數據管理、實際應用等方面已取得一定成果。當前已有許多國際組織、政府機構、國際企業、高校等建立了大型術語庫、術語知識庫,如聯合國(UN Term:The United Nations Terminology Database)、世界貿易組織(WTOTERM)、歐盟(The EU Term Bank)、微軟公司(Language Portal)、法國標準化協會(NORMATERM)、西班牙格拉納達大學(EcoLexicon)、歐洲(CLARIN)、加拿大政府(Termium)等。

三、術語知識庫建設的理論基礎

多語言、多模態術語知識庫是翻譯技術知識體系化演進的最新成果,體現了多領域交叉滲透的集成優勢,如術語學理論、知識本體理論、計算機科學等相關理論為術語知識庫建設提供了理論基礎。

術語學理論中,定名、術語標準化、術語管理等與術語知識庫建設密切相關。例如,術語定名時應遵循的重要原則之一是單義性,即一個術語只表達一個概念,同一概念只用一個術語來表達,應盡量避免同義術語、同音術語和多義術語的出現,否則可能造成系統結構上的混亂。標準化指在具體或抽象的事物完成其功能的過程中,用人為的方法消除不必要的個別屬性,使這些事物符合某種標準,從而保證事物能夠相互交換而不受生產時間和地點限制的一種全社會活動,早期的標準化工作只限于產品的標準化,后來標準化的對象慢慢擴大到語言資源等更多領域[6]。術語管理也是術語知識庫建設的重要組成,主要涉及術語的提取、編輯、儲存與檢索。

知識本體的創建即術語知識庫建庫的關鍵。知識本體與哲學、現代術語學、計算機科學關系密切。在需要進行領域客體分析時,首先需要找出這些客體之間的關系,建立這些客體的集合。這個集合是對領域中各個客體所代表概念的明確、形式化、可共享的描述,形成了該領域的知識本體。《牛津英語詞典》對于知識本體的定義相當寬泛,表述為“研究存在的科學或學問”,正是哲學領域中對知識本體主要關注的范圍。美國計算機專家尼徹斯曾提出一種構建智能系統方法的新思想,認為智能系統由知識本體和問題解決方法兩部分組成,前者涉及特定知識領域共有的知識和知識結構,是靜態的知識;后者涉及在相應知識領域進行推理的知識,是動態的知識,至此,知識本體成為計算機科學領域智能系統的重要研究內容。在傳統術語學中,很多人把客體僅僅理解為客觀的事物,但從知識本體的角度看,術語不僅僅是名詞或名詞短語,也可以是動詞、數詞、形容詞、副詞等,因此傳統術語學是基于概念的,而現代術語學是基于知識本體的術語學[6]。

四、數字化短視頻傳播環境

信息時代,數字文化影響著當代社會生活。十九世紀以來,世界由印刷文化走向二十世紀的電子文化,再到二十一世紀的數字文化[7]。當代社會生活中數字技術的廣泛使用反映數字文化的存在,“數字化可視為文化的標志之一,因其既包括人工制品,同時也包括符號和交流系統,是區分當代生活方式與其他方式的最佳標準”[8]。

數字文化背景下,新媒體已全面滲透社會生活。報紙、雜志、廣播、電視等傳統媒體盡管有著可信度高、受眾群體固定等特征,但同時也面臨著信息獲取成本高、交互性不足、傳播模式單一等問題。根據聯合國教科文組織的定義,新媒體即網絡媒體,可理解為以數字技術為基礎,以網絡為載體的信息傳播媒介[9]。

短視頻作為新媒體時代炙手可熱的網絡視聽媒介,已成為社會表達“視頻化”的主要表征,不僅在用戶規模、經濟效益等方面取得顯著成績,而且具備社會影響力,能夠影響人們的思維方式[3]。2023中國網絡視聽發展研究報告數據顯示,短視頻在我國2022年網絡視聽行業市場規模中以40.3%(2928.3億)的高占比位居榜首;用戶數量上,根據中國互聯網絡信息中心(CNNIC)發布第51次《中國互聯網絡發展狀況統計報告》,截至2022 年12 月,我國短視頻用戶規模達10.12 億,較2021 年12 月增長7770 萬,占網民整體的94.8%。

短視頻社交軟件在海外市場發展態勢迅猛,海外已有社交媒體平臺進一步開拓短視頻市場。以Tiktok(海外版抖音短視頻App)為例,其自2017年成立以來用戶規模快速增長,在7年的時間里吸引了15.3億用戶,用戶平均每天使用時長為 52 分鐘,且日活躍用戶量達10.5億,Tiktok已成為當今最具吸引力的社交媒體應用軟件。有學者指出,通過社交媒體在網絡上進行的視頻活動以及 YouTube 或 Bilibili 等平臺上用戶生成內容的激增,將繼續塑造和滲透我們的交流方式[10]。

五、數字時代術語知識庫的多模態信息資源建設

隨著互聯網、大數據、云計算、人工智能、區塊鏈等新一代信息技術的不斷發展,數字技術已全面滲透人類社會各領域,給人類社會帶來了廣泛而深刻的影響。這些影響不僅改變了人們的工作方式和生活方式,也改變了社會經濟的發展模式和人們的思維方式。根據中國互聯網絡信息中心(CNNIC)發布的第52次《中國互聯網絡發展狀況統計報告》,截至2023年6月,我國網民規模達10.79億,互聯網普及率達76.4%;39歲以下互聯網網民群體占比達52.5%。可以發現,年青一代已然是數字土著,對比作為數字移民的父母長輩,數字土著對于數字技術的適應性較高,且生活極大依賴于數字技術和在線應用。

數字技術之于術語知識庫至關重要。術語知識庫的建庫流程通常包括語料收集、數據處理、雙語術語提取與管理、關系抽取、數據存儲、知識體系化可視化呈現,均需要大量技術支持。以知識組織理論為術語知識庫建庫宏觀理論指導,建庫流程可分為知識獲取、知識表示與知識運用;依據術語學理論完成數據的原始積累與處理;進而按照知識本體視角進行專業領域知識本體的系統化、可視化構建,要求借助技術幫助實現從理論到實際操作。

對比傳統術語庫、術語知識庫的單語言、單模態主要呈現方式,當前術語知識庫已呈現出多語言、多模態發展趨勢。如西班牙格拉納達大學 LexiCon 研究小組研發的環境領域術語知識庫EcoLexicon等部分術語知識庫已實現多模態構建,在用戶界面實現融合語言模態和視覺模態的多模態表征。以術語詞條“abiotic(非生物的)”為例,檢索后界面將出現一幅以輸入詞條為中心,四周呈發散狀的知識圖譜,各發散節點為與中心術語詞條相關的概念以及對應其他語種的術語;定義模塊即展示該術語詞條的定義,即“非生物來源的,用于描述生態系統的非生命元素(即太陽輻射、溫度、濕度和 pH 值)”,并對其中涉及的關聯術語以下劃線標示,點擊相關術語即可跳轉到對應術語詞條;資源模塊提供每個概念/術語相關的資源,包括圖像、文檔URL、視聽材料等,點擊資源模塊下的選項即可獲取相關信息,以多模態方式描述術語概念,幫助使用者獲取相關知識。

不同代際的人對于信息的獲取、權威信息的來源渠道有著不同的認知。根據艾瑞網《2016年中國短視頻行業發展研究報告》,人們通過短視頻來滿足表達和溝通、人際交往、信息獲取、娛樂消遣以及碎片化閱讀的需求。作為移動新媒介的短視頻融合了文字、圖像、聲音、色彩等多模態信息,具有反映、塑造甚至影響現實的能力。

本研究提出數字時代術語知識庫信息資源建設多模態發展的未來發展方向,以短視頻方式整合相關術語知識。當前,EcoLexicon等部分術語知識庫已支持以超鏈接形式關聯維基百科等相關網頁,網頁內容根據其設計包含文字、圖片、表格、數據、視頻等多模態信息,但網頁非直接為服務術語知識庫設計,部分內容與術語關聯不大,仍需要用戶主動尋找相關信息,本研究即提出以短視頻方式整合相關術語知識,利用語言、視覺、聽覺、姿勢、空間等多模態符號資源再現術語概念相關知識,進一步加強術語知識庫的多模態信息資源建設。

六、短視頻多模態發展的術語知識庫應用

術語知識庫是特定領域術語、概念、知識的系統化、可視化呈現,其中文字、表格、圖片、短視頻等多模態信息資源有助于使用者理解、掌握相關概念內涵。除供大眾查閱外,術語知識庫的短視頻多模態信息資源建設為特定行業領域如翻譯的科研、教學和實踐提供了重要的支持。

1. 術語知識庫的短視頻多模態信息資源為科研提供了語言資源和工具,且有助于使用者高效理解相關術語概念。對于特定領域的科研人員而言,一方面多語言術語知識庫將為特定學科領域,如翻譯研究提供數據資源,另一方面術語知識庫將有助于科研人員掌握其所在學科領域的發展脈絡,追蹤學科發展前沿,提高研究效率和準確性。

2. 教學方面,教師可以利用術語知識庫短視頻多模態資源,為學生提供豐富的學習材料和工具。學生通過使用特定領域的術語知識庫輔助其學習,可以實現對相關術語、知識的快速檢索,并利用術語知識庫提供的多模態信息資源輔助其理解。

3. 術語知識庫短視頻多模態資源為行業實踐提供便利和支持。如對外翻譯實踐中,譯者可利用特定領域術語知識庫進行譯前準備,理解并掌握行業術語,積累專業領域知識。多語言、多模態術語知識庫也支持公共服務和政府機構的多語言溝通和服務,提高社會的公平和包容性。

七、結語

隨著全球化的不斷加速以及信息技術的迅猛發展,語言交流與跨文化交流已變得愈發頻繁與密切。語言基礎設施的建設對于社會發展具有重要意義,有助于促進跨文化交流和理解,推動經濟發展和國際合作,支持教育和知識傳播,保護和傳承語言文化,提高社會公平和包容性。術語知識庫作為語言基礎設施的典型代表,呈現出多語言發展與多模態實現趨勢。同時,考慮到短視頻作為社會表達“視頻化”的主要表征,本研究提出術語知識庫多模態信息資源建設的短視頻發展趨勢。術語知識庫的短視頻多模態信息資源建設也為特定行業領域如翻譯的科研、教學和實踐提供了重要支持。

參考文獻

[1]苗菊,牛軍.政治話語雙語術語知識庫的譜系法構建——以“一帶一路”倡議相關術語體系為例[J].中國翻譯,2020,41(02):99-106.

[2]苗菊,吳聰聰.數字認知與傳播中的多語言多模態術語知識庫——社會應用與價值實現[J].中國科技術語,2023,25(04):12-20.

[3]王曉紅.短視頻助力深度融合的關鍵機制——以融合出版為視角[J].現代出版,2020(01):54-58.

[4]寧海霖.基于多模態術語知識庫的譯者知識獲取[J].中國科技術語,2022,24(03):34-40.

[5]Meyer, I. Skuce, D., Bowker, L. Towards a new generation of terminological resources: An experiment in building a terminological knowledge base[A]. Proceedings of the 16th International Conference on Computational Linguistics[C]. Nantes, 1992: 957.

[6]馮志偉.現代術語學引論[M].北京:商務印書館,2011.

[7]Deuze, M. Participation, Remediation, Bricolage: Considering Principal Components of a Digital Culture[J]. The Information Society, 2006, (2): 63-75.

[8]Gere, C. Digital Culture[M]. London: Reaktion Books, 2002.

[9]陶丹,張浩達.新媒介與網絡廣告[M].北京:科學出版社,2001.

[10]Bogucki, ?. & Díaz-Cintas, J. An Excursus on audiovisual translation[A]. In Bogucki, ?. & Deckert, M. (eds.). The Palgrave handbook of audiovisual translation and media accessibility[C].Cham: Palgrave Macmillan, 2020.

基金項目:2015年度國家社科基金重大項目“雙語術語知識庫建設與應用研究”(項目編號:15ZDB102)研究成果

責任編輯:張津平

主站蜘蛛池模板: 亚洲一区二区视频在线观看| 免费av一区二区三区在线| 久久综合九色综合97网| 亚洲国产成人精品青青草原| 国产精品网址在线观看你懂的| 99成人在线观看| 天天色天天操综合网| 2021国产精品自拍| 夜夜操狠狠操| 激情六月丁香婷婷四房播| 99热国产这里只有精品9九| 国产日本欧美亚洲精品视| 九色视频在线免费观看| 毛片视频网址| 久久频这里精品99香蕉久网址| 国产欧美精品专区一区二区| 福利在线不卡| 一本无码在线观看| 国产99在线| 欧美在线视频不卡第一页| 亚洲综合极品香蕉久久网| 亚洲欧美国产高清va在线播放| 国产农村妇女精品一二区| 久久77777| 中国一级特黄视频| 亚洲天堂777| 99精品在线看| 久久综合亚洲鲁鲁九月天| 丰满人妻久久中文字幕| 欧美一级在线看| 亚洲精品波多野结衣| 伊人五月丁香综合AⅤ| 超级碰免费视频91| 国产成人亚洲精品蜜芽影院| 欧美专区在线观看| 99在线国产| 欧美在线精品怡红院| 亚洲精品在线91| 国产精品视频公开费视频| 波多野结衣一区二区三区88| 91青青视频| 真实国产精品vr专区| 日日摸夜夜爽无码| 亚洲精品无码日韩国产不卡| 欧美日韩资源| 亚洲IV视频免费在线光看| 秘书高跟黑色丝袜国产91在线 | 啦啦啦网站在线观看a毛片| 99视频在线免费| 成人毛片在线播放| 国内精品视频在线| 精品成人一区二区三区电影| 午夜丁香婷婷| 一级香蕉人体视频| 国产精品毛片一区视频播| 夜夜拍夜夜爽| 国产精品精品视频| 亚洲天堂.com| 日本精品影院| 全部毛片免费看| 天天做天天爱天天爽综合区| 国禁国产you女视频网站| 国产高清免费午夜在线视频| 这里只有精品在线| 亚洲色图欧美在线| 在线免费看片a| 免费一级毛片不卡在线播放| 欧美午夜网站| 丝袜久久剧情精品国产| 国产va在线观看免费| 久久黄色免费电影| 亚洲天堂精品视频| 午夜无码一区二区三区| 午夜小视频在线| 91久久国产综合精品女同我| 91视频首页| 天天干天天色综合网| 丝袜美女被出水视频一区| 亚洲欧美日韩高清综合678| 秋霞国产在线| vvvv98国产成人综合青青| 婷婷六月在线|