999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

網(wǎng)絡(luò)環(huán)境下《漢語主題詞表》(工程技術(shù)版)詞間等同、等級關(guān)系的處理

2014-12-31 09:42:54王冠華
圖書館論壇 2014年8期
關(guān)鍵詞:詞匯概念

王冠華,危 紅

2010年中國科學(xué)技術(shù)信息研究所啟動《漢語主題詞表》 (工程技術(shù)版)(以下簡稱“《漢表》”)的修訂,2013年基本完成。新《漢表》是建立在網(wǎng)絡(luò)環(huán)境下的在線《漢表》,是由基礎(chǔ)詞庫、核心詞庫、敘詞詞庫等構(gòu)成的知識組織系統(tǒng),采用在線平臺進(jìn)行編制,提供基于知識組織的術(shù)語服務(wù),加強(qiáng)與用戶的交互,并建立動態(tài)變化的專業(yè)知識體系更新與維護(hù)機(jī)制,其智能化和可視化技術(shù)提供了更多人性化的應(yīng)用方式[1]。

新《漢表》 的基礎(chǔ)詞庫來源包括80余種的中文敘詞表,截止2010年6月的全國科學(xué)技術(shù)名詞審定委員會公布的科技術(shù)語,1600余種的術(shù)語標(biāo)準(zhǔn),約200種的理工類詞典(含百科),約300萬條萬方中文期刊、學(xué)位論文關(guān)鍵詞、維普中文期刊關(guān)鍵詞以及約100萬條的網(wǎng)絡(luò)百科詞匯。按詞形查重后總計(jì)360萬條。其中,約30萬條無法歸類,主要為網(wǎng)絡(luò)詞匯,330萬條詞匯有分類;161萬條詞匯有英文譯稱,27萬條詞匯有注釋,21萬條詞匯有用/代關(guān)系,32萬條詞匯有屬/分關(guān)系,10萬條詞匯有相關(guān)關(guān)系[2]。不同來源的數(shù)據(jù)、概念的合并和關(guān)聯(lián)都會加大概念體系的復(fù)雜度。如何合并相同概念,構(gòu)建同義詞群;如何區(qū)分?jǐn)⒃~的等級關(guān)系;如何注意到等同關(guān)系、等級關(guān)系、相關(guān)關(guān)系之間既有語詞客觀的聯(lián)系,又有很大的人為性,且相互間不是絕對的,是可以相互轉(zhuǎn)換的;如何在多人協(xié)同工作模式下,使敘詞的詞間關(guān)系得以控制,是詞表修訂工作中詞間關(guān)系建設(shè)質(zhì)量的體現(xiàn)。

1 等同關(guān)系的建立及同義詞群的構(gòu)建

等同關(guān)系用于同義詞或近義詞之間,即一般的異形同義詞、同一概念的不同譯名之間、舊稱與新稱之間、俗稱與學(xué)名之間、中文全譯名與外文縮寫詞之間、別名與產(chǎn)品型號名之間;還用于準(zhǔn)同義詞之間,即一般準(zhǔn)同義詞之間、部分反義詞之間,用于泛指敘詞與專指敘詞之間,須將使用頻率低的專指詞歸納到所從屬的泛指敘詞。準(zhǔn)同義詞的詞義不同,但從文獻(xiàn)處理與情報(bào)檢索方面考慮,需要將它們作為同義詞來處理,以免分散文獻(xiàn)[3]。

雖然新《漢表》在線平臺對庫中詞匯有同義詞推薦功能,方便了同義詞的詞群建立,但新《漢表》的海量詞匯,致使推薦的同義詞建群的準(zhǔn)確率不太高,真正等同關(guān)系的建立,還是依賴于編表人員的判斷。一般來說,同義詞群是一個(gè)概念的多個(gè)表達(dá)詞匯的匯集。這個(gè)詞群中所包括的詞匯不全是同義詞,它可以有準(zhǔn)同義詞、部分反義詞,以及0詞頻的下位敘詞。

圖1 以廢棄物為敘詞的詞群

如圖1所示,這是具有大量入口詞(即非優(yōu)選詞)的詞群,詞頻的高低是敘詞(即優(yōu)選詞)選取的依據(jù)之一,廢棄物作為這個(gè)詞群中詞頻最高的詞,可選做優(yōu)選詞;廢物作為同義詞、三廢作為準(zhǔn)同義詞、零廢品作為反義詞,因其詞頻低于廢棄物,可作為入口詞;中級廢物、二次廢物、次生廢物等在詞義上具有上下位關(guān)系,但因其0詞頻,則采用用代關(guān)系,而不是屬分關(guān)系。廢棄物作為敘詞具有唯一性,其它詞均作為非敘詞(即入口詞、非優(yōu)選詞)。

如圖2所示,按詞群的詞頻看,SBR法的詞頻最高,但敘詞是序批式活性污泥法。序批式活性污泥法是環(huán)境工程專業(yè)名詞,按中華人民共和國環(huán)境保護(hù)標(biāo)準(zhǔn)《環(huán)境工程 名詞術(shù)語》(HJ 2016-2012)的定義:英文定義為sequencing batch reactor activated sludge process(縮寫SBR);中文定義為在同一反應(yīng)池(器)中,按時(shí)間順序由進(jìn)水、曝氣、沉淀、排水和待機(jī)5個(gè)基本工序組成的活性污泥污水處理方法,簡稱SBR法。SBR法是序批式活性污泥法的簡稱,是一種按間歇曝氣方式來運(yùn)行的活性污泥污水處理技術(shù)。項(xiàng)目組規(guī)定,對于以英文縮略語、中英文組合、中英文縮略語組合的敘詞,應(yīng)列出相對應(yīng)的全中文敘詞,與原有敘詞之間可建立用代關(guān)系。而序批式活性污泥法為國家標(biāo)準(zhǔn)的名稱術(shù)語,是在文獻(xiàn)標(biāo)引與檢索中用于表達(dá)文獻(xiàn)的主題而規(guī)范化的詞,可作為敘詞,其外文縮寫詞或相同概念的不同表達(dá)方法的詞匯做非敘詞,以用代關(guān)系來表達(dá)。

圖2 以序批式活性污泥法為敘詞的詞群

構(gòu)建同義詞群還需注意多個(gè)合成詞組成的復(fù)雜概念敘詞,由于合成詞位置不同而出現(xiàn)的不同詞形敘詞,需要認(rèn)真甄別是否是同一概念。比如,安全生活與生活安全;安全系統(tǒng)與系統(tǒng)安全,按詞義看,前者可作為同義詞來建群,后者則分別為兩個(gè)詞族的下位詞。

2 等級關(guān)系的建立及概念指引聚集語義大小的辨析

嚴(yán)格意義上的概念等級關(guān)系中,表達(dá)涵義較為寬泛的上位概念的外延包含屬于上位詞的較小的、更為專指的下位概念的全部外延,即屬種關(guān)系。從傳統(tǒng)紙質(zhì)檢索系統(tǒng)發(fā)展到現(xiàn)在的網(wǎng)絡(luò)和電子信息檢索系統(tǒng),檢索主體和客體都發(fā)生了轉(zhuǎn)變,知識組織工具為適應(yīng)這種轉(zhuǎn)變,在對概念語義關(guān)系的揭示上也在不斷拓展和演化。美國標(biāo)準(zhǔn)ANSI/NISOZ39.19在2005年的第4版中等級關(guān)系拓展到3種不同的邏輯關(guān)系,即屬種關(guān)系、實(shí)例關(guān)系、整部關(guān)系,該標(biāo)準(zhǔn)沿用至今。

中國標(biāo)準(zhǔn)中對敘詞間等級關(guān)系只規(guī)定了2種類型,即通用屬分關(guān)系與整體部分屬分關(guān)系。通用屬分關(guān)系是以概念之間是否具有包含關(guān)系為基礎(chǔ);事物的整體與部分之間一般不構(gòu)成屬分關(guān)系,只有特定的整體部分關(guān)系可作為屬分關(guān)系處理,即表示行政區(qū)劃、地理區(qū)域的詞,表示人體、生物體的系統(tǒng)與器官的詞,表示某些行政與社群結(jié)構(gòu)的詞。

新《漢表》詞間等級關(guān)系的建立,實(shí)際上就是構(gòu)建一系列詞族,即以詞族形式顯示等級關(guān)系。其等級關(guān)系包括屬種關(guān)系、整體與部分關(guān)系、實(shí)例關(guān)系(通常用專有名詞表示)。需要注意的是,切勿把分類法中所列的某些類目名稱,移植到族首詞的等級關(guān)系中,因?yàn)樵诜诸悪z索語言體系中,用來揭示文獻(xiàn)主題內(nèi)容的標(biāo)識符是分類號,而不是類目名稱,其所顯示的每一級分類號都是受學(xué)科體系分類等級控制的。多數(shù)情況下,孤立的類名是看不出這些層次關(guān)系的。在敘詞檢索語言體系中,標(biāo)識符就是敘詞。每個(gè)敘詞概念的等級,都定位在該敘詞所在詞族的屬分關(guān)系鏈中,通過敘詞屬分關(guān)系鏈就可確定其級別。所以,嚴(yán)格按敘詞概念的本質(zhì)屬性,建立屬分等級關(guān)系就顯得特別重要。

2.1 典型的等級關(guān)系

典型的屬種關(guān)系包括相同屬性的事物(實(shí)體)、相同屬性的活動(過程)、相同屬性的狀態(tài)(形態(tài))、相同屬性的形狀(尺度)、相同屬性的特征(特性)、相同屬性的學(xué)科(理論)、相同屬性的結(jié)構(gòu)(系統(tǒng))、相同屬性的組織(社會機(jī)構(gòu))[4],如圖3、圖4、圖5所示。

圖3 相同屬性的事物

圖4 相同屬性的活動

圖5 相同屬性的結(jié)構(gòu)

2.2 不典型的等級關(guān)系

在詞族加工過程中,很多詞匯的等級關(guān)系并不明顯,有些介于等級關(guān)系和相關(guān)關(guān)系之間,有些類似分類法“類”的關(guān)系。如果按嚴(yán)格的等級關(guān)系,一些詞語具有某種等級關(guān)系,卻又游離在“分類”和“詞族”兩種等級之外,進(jìn)不了詞族[4]。因此在建立等級關(guān)系時(shí),需要編表人員仔細(xì)分析、判斷、歸納,可考慮進(jìn)行必要的變通,比如涉及一些與機(jī)理(原理、機(jī)制、理論)、工藝(技術(shù)、加工、生產(chǎn)、制造)、方法、性質(zhì)等相關(guān)的語詞,可根據(jù)詞量的大小來設(shè)定建等級關(guān)系還是等同關(guān)系或相關(guān)關(guān)系。比如,廢水處理、廢水處理工藝、廢水處理方法、廢水處理技術(shù)就建為同義詞群。有些獨(dú)詞,不適合建立參照關(guān)系,則可以考慮作為最相關(guān)詞的下位詞,這種變通對查詞、自動標(biāo)引有利,也不會引起歧義。

圖6 不典型的等級關(guān)系

2.3 多等級族關(guān)系

當(dāng)一個(gè)概念在邏輯上可以隸屬于多個(gè)不同的族類,這種關(guān)系稱為多等級族關(guān)系,此類關(guān)系的存在是基于對概念詞匯的不同角度建立屬分關(guān)系而形成的。即在不同詞族中,會同時(shí)出現(xiàn)一個(gè)概念的敘詞,或在同一詞族中也會出現(xiàn)敘詞多屬的情況。比如廢液分工業(yè)廢液、黑液、酒精廢液等等,工業(yè)廢液又分輕工業(yè)廢液、化工廢液、皮革廢液等等,輕工業(yè)廢液又分制漿廢液、食品工業(yè)廢液、染色廢液等等,制漿廢液又分制漿黑液;而黑液又分制漿黑液,其中制漿黑液,既屬于制漿廢液,又屬于黑液,它同時(shí)分屬于兩個(gè)不同的上位概念,且還是同一詞族廢液下分的敘詞多屬。

2.4 概念指引聚集語義大小的辨析

新《漢表》的編制過程中,建立敘詞的屬分關(guān)系必須要明確相關(guān)敘詞的概念大小與等級關(guān)系,否則,將造成屬分關(guān)系的混亂。比如某某設(shè)施、設(shè)備、裝置等敘詞,如何區(qū)分這些敘詞的概念大小,項(xiàng)目組給出的參考是:裝備>設(shè)備>機(jī)械>機(jī)器>裝置>機(jī)構(gòu);組件>器件(零件)>部件>元件;系統(tǒng)≈設(shè)備(采油系統(tǒng)、采油設(shè)備);系統(tǒng)≈裝置(檢測系統(tǒng)、檢測裝置);系統(tǒng)≈機(jī)構(gòu)(啟動系統(tǒng)、啟動機(jī)構(gòu));系統(tǒng)≠機(jī)械、裝置、機(jī)構(gòu)(管理系統(tǒng)、管理裝置、管理機(jī)構(gòu))。但在實(shí)際編制過程中,并不能完全按上述給出的參考來完成敘詞的等級關(guān)系,如果一個(gè)概念的前方匹配一致,只是設(shè)備或裝置的詞不同,且詞頻低,詞族聚詞又太少,這時(shí)的等級關(guān)系可轉(zhuǎn)化為等同關(guān)系,某某設(shè)備或某某裝置可按同義詞來構(gòu)建詞群。

圖7 安全設(shè)備、安全設(shè)施

圖8 防雷裝置

如圖7所示,安全設(shè)施和安全設(shè)備的詞頻都不低,且詞族聚詞也不少,各自均有下位詞,因而可分為兩個(gè)詞族。圖8所示,防雷設(shè)施和防雷設(shè)備并沒有分為兩個(gè)詞族,雖然它們的詞頻也不算太低。因?yàn)榉览紫到y(tǒng)、防雷設(shè)施、防雷設(shè)備幾乎沒有不同下位詞的詞族聚詞,所以可與防雷裝置構(gòu)成同義詞群,根據(jù)詞頻及下位類詞,選擇防雷裝置為敘詞。

3 結(jié)語

正確理解等同、等級關(guān)系的構(gòu)建原則是建立等同、等級關(guān)系的前提條件。尤其需要注意那些容易出錯(cuò)的典型的字面成族、分類法的從屬派生關(guān)系與敘詞法的屬分關(guān)系混淆不清,如事物與方面、整體與部分關(guān)系等,泛指概念屬專業(yè)概念,即小帽子大身體。對于復(fù)合概念,保留詞頻較高的詞匯,并注意其多屬特征,刪除詞頻較低的詞匯。在同一詞族,要注意敘詞中的部分詞匯的詞形相同。在構(gòu)建詞間關(guān)系的過程中,大多數(shù)的前方一致檢索是構(gòu)建等同關(guān)系的重要手段,大多數(shù)的后方一致檢索則是構(gòu)建等級關(guān)系的重要手段,以相同詞尾結(jié)束的詞語,有相當(dāng)一部分具有成族性。網(wǎng)絡(luò)環(huán)境下的新《漢表》,不只是單純的詞表,它具備了紙質(zhì)文獻(xiàn)環(huán)境下所不具有的動態(tài)、開發(fā)、便于更改增刪和維護(hù)等功能。它的詞間關(guān)系揭示更為深刻,對于用戶檢索用詞和文獻(xiàn)主題的準(zhǔn)確表達(dá)考慮更為充分,實(shí)現(xiàn)了敘詞表詞庫與用戶檢索用詞最大限度的一致,從而能為更大范圍的人群使用。

[1] 曾建勛,常春,吳雯娜,等.網(wǎng)絡(luò)環(huán)境下新型《漢語主題詞表》 的構(gòu)建[J]. 中國圖書館學(xué)報(bào),2011(4):43.

[2] 中國科學(xué)技術(shù)信息研究所.《漢語主題詞表》(工程技術(shù)版) 編制方法培訓(xùn)[Z].2011.

[3] G B 13190-1991,漢語敘詞表編制規(guī)則[S].

[4] 陳樹年.詞間關(guān)系及其處理[Z].2012.

猜你喜歡
詞匯概念
Birdie Cup Coffee豐盛里概念店
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
幾樣概念店
本刊可直接用縮寫的常用詞匯
學(xué)習(xí)集合概念『四步走』
聚焦集合的概念及應(yīng)用
一些常用詞匯可直接用縮寫
論間接正犯概念之消解
概念的限制
主站蜘蛛池模板: 久无码久无码av无码| 国产精品久久久久久久久kt| 久久福利片| 日本a级免费| 欧美精品不卡| 欧美影院久久| 免费看一级毛片波多结衣| 91色爱欧美精品www| 999精品在线视频| 最新亚洲人成无码网站欣赏网| 久热re国产手机在线观看| 欧美h在线观看| 成人小视频在线观看免费| 国内毛片视频| 亚洲国产清纯| 亚洲视频色图| 亚洲综合在线网| 狠狠ⅴ日韩v欧美v天堂| 在线观看亚洲人成网站| 国产va欧美va在线观看| 色男人的天堂久久综合| 国产亚洲视频免费播放| 欧美中文字幕在线播放| 伊人成人在线视频| 国产高清国内精品福利| 亚洲精选高清无码| 亚洲码在线中文在线观看| 这里只有精品在线| 国产成人亚洲综合a∨婷婷| 久久香蕉国产线看精品| 91免费在线看| 婷婷亚洲最大| 91区国产福利在线观看午夜 | 国产精品13页| 四虎永久免费地址| 国产原创演绎剧情有字幕的| 高清久久精品亚洲日韩Av| 2021国产精品自产拍在线观看 | 国产三区二区| 2020国产精品视频| 一级一级一片免费| 91视频精品| 国产办公室秘书无码精品| 992Tv视频国产精品| 热99re99首页精品亚洲五月天| 亚洲综合在线最大成人| 国产欧美精品午夜在线播放| 国产激爽大片在线播放| 丁香五月婷婷激情基地| 中文字幕在线日韩91| 国产成人亚洲精品蜜芽影院| 国产成人亚洲综合a∨婷婷| 中国一级毛片免费观看| 亚洲人成网站在线播放2019| 婷婷六月激情综合一区| 无码国产偷倩在线播放老年人 | 亚洲人成网站在线播放2019| 高清无码手机在线观看| 香蕉视频国产精品人| 欧美一级特黄aaaaaa在线看片| 伊人久久福利中文字幕| 蜜臀av性久久久久蜜臀aⅴ麻豆 | 99伊人精品| 91福利在线观看视频| 精品无码视频在线观看| 最新亚洲人成无码网站欣赏网| 第九色区aⅴ天堂久久香| 国产乱子伦视频在线播放 | 91亚洲精选| 青青操国产| 九九热在线视频| 狠狠色丁香婷婷| 日韩在线视频网站| 国产精品私拍99pans大尺度| 国产美女无遮挡免费视频| 在线无码九区| 一区二区三区国产| 久久久久久久97| 永久免费av网站可以直接看的| 精品伊人久久久香线蕉| 色偷偷综合网| 免费精品一区二区h|