999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

本體技術(shù)在文獻(xiàn)工作中的應(yīng)用實(shí)踐一以標(biāo)準(zhǔn)文獻(xiàn)為例

2025-05-21 00:00:00李景周潔李國鵬張明
標(biāo)準(zhǔn)科學(xué) 2025年4期
關(guān)鍵詞:概念數(shù)據(jù)庫標(biāo)準(zhǔn)

DOI編碼:10.3969/j.issn.1674-5698.2025.04.016

Study on Ontological Theory and Practice in Literature and Documentation - Taking Standard Documentation as an Example

LI Jing1 ZHOU Jie1 LI Guo-peng2* ZHANG Ming1 (l.China National Institute of Standardization; 2. Institutes of Science and Development, Chinese Academy of Sciences)

Abstract:[Objective]Theapplicationofandpracticalresearchonontologicaltechnologyinthefeldofstandardliterature can broaden the scope ofontologyapplication,providenewmethods andapproaches forknowledgeorganizationofstandard literature,and providebeterknowledge services for users.[Methods]Through literatureresearch,semantic analysis, bibliometric methods,andsystemconstructionmethodsontologybasedknowledgeoganizationiscariedoutwithstandard literatureasthebjectandempicalreseachisnductedintermsoftechicalndicatordisclosurecpusonstructiand knowledgeassociation.Results]Theontologbasedknowledgeorganizationprovidesadatainfrastructurethatconfomsto disciplinaryrulesforthedisclosureoftechnicalindicatorsinstandardliterature,andplaysanimportantoleinthedisclosure of standardcontent indicators inthe fieldsofaquaticproducts,dairyproducts,andagriculturalproducts.Inknowledge association,standardizedobject knowledge assciationhas beenestablishedandefectivelyappliedinthefieldof solar photovoltaiccell.[Conclusion]The applicationofontology-basedknowledge organization methods instandardliterature is beneficialforrevealingimpotanttechnicalcontentimprovingretrievaleffciencyandenhancinguserexperienceReleant achievements have become national standards.

Keywords: ontology, standard literature, knowledge organization system (KOS)

1 本體基本理論

語相關(guān)聯(lián)的。

1.2本體的作用

本體的概念來自哲學(xué)領(lǐng)域。最早開始引人本體概念的是人工智能(AI)領(lǐng)域。本體可用來作為知識表示和知識組織的底層,可以規(guī)定概念與概念之間的復(fù)雜關(guān)聯(lián),并定義概念的屬性。本體的概念和方法進(jìn)人到知識組織和圖書情報領(lǐng)域是在2000年初。引人本體的目的是要解決信息檢索、資源組織等問題。

1.1本體的概念

斯坦福大學(xué)的Gruber最早提出本體的定義,其后Borst 對Gruber的定義做出修正。兩個定義合并以后為:“Itisan explicitformalspecification of a shared conceptualization.\"中文含義:本體是一套得到大多數(shù)人認(rèn)同的、關(guān)于概念體系的明確的、形式化的規(guī)范說明。

使用最廣泛的本體定義是波音公司MichaelUschold等提出的:“It is a vocabulary of terms andsome specification of theirmeaning.”中文含義:本體是一套術(shù)語詞表以及術(shù)語含義的規(guī)范說明。

通過對國內(nèi)外學(xué)者觀點(diǎn)的歸納,筆者早在其博士論文(2004)中就指出,本體的定義雖然有諸多表述,但是有關(guān)它的必要條件也應(yīng)該在定義中得到體現(xiàn)。筆者認(rèn)為:本體是一個關(guān)于某些主題的、層次清晰的規(guī)范說明。是一個已經(jīng)得到公認(rèn)的形式化的知識表示體系,它包含詞表(或名稱表/術(shù)語表)。詞表中的邏輯聲明全部是用來描述這些術(shù)語的含義和術(shù)語間關(guān)系的,即它們是怎樣和其他術(shù)本體能夠作為不同系統(tǒng)之間進(jìn)行互操作的邏輯底層,構(gòu)建本體的作用在于:

(1)在用戶間或軟件代理間達(dá)成對于知識組織表達(dá)的共同理解和認(rèn)知[1,4]。

(2)可對專業(yè)術(shù)語、常識、通用知識,計(jì)量單位進(jìn)行復(fù)用。例如,在農(nóng)業(yè)、生物醫(yī)藥、中醫(yī)藥,環(huán)境保護(hù)等多個領(lǐng)域中,植物學(xué)基礎(chǔ)知識都是通用基礎(chǔ)必備知識。如果以植物分類法為基礎(chǔ)框架,以植物學(xué)詞表作為概念表示的基礎(chǔ),以此來構(gòu)建植物學(xué)本體,則該本體可以在農(nóng)業(yè)、生物醫(yī)藥、中醫(yī)藥和環(huán)保等多個領(lǐng)域中被復(fù)用。如果需要構(gòu)建一個大規(guī)模本體,可以將幾個已有本體進(jìn)行集成,還可以復(fù)用現(xiàn)成的通用本體框架,如UNSPSContology,將UNSPSContology(Skeleton)進(jìn)行擴(kuò)展和填充,就可以應(yīng)用到其他領(lǐng)域中去。

(3)通過斷言(如三元組、邏輯表達(dá)式)等形式(公式),使專業(yè)領(lǐng)域內(nèi)的學(xué)術(shù)觀點(diǎn)和假設(shè)變得更加明確。對專業(yè)領(lǐng)域知識進(jìn)行明確的形式化說明,對于那些必須理解該領(lǐng)域?qū)I(yè)術(shù)語含義的新用戶是十分必要的。

(4)將領(lǐng)域知識從知識管理的環(huán)境中剝離出來。用戶可按照必需的規(guī)范說明和執(zhí)行程序來實(shí)現(xiàn)檢索和查詢等功能,而用戶本身不必非要精通IT技術(shù)或各種算法。

(5)分析專業(yè)領(lǐng)域的知識體系結(jié)構(gòu)。在復(fù)用和擴(kuò)展現(xiàn)有本體的嘗試中,對術(shù)語進(jìn)行規(guī)范的形式語義分析,具有重要價值和意義

1.3本體的研究進(jìn)展

1.3.1國外研究進(jìn)展

從20世紀(jì)90年代至今,三十多年來,歐美發(fā)達(dá)國家持續(xù)地支持基于本體的知識組織體系建設(shè)與開發(fā)。近十年來,更加重視知識組織體系在網(wǎng)絡(luò)環(huán)境下的發(fā)展與應(yīng)用,如普林斯頓大學(xué)開發(fā)了WordNet(初級本體),美國國會圖書館開發(fā)了ClassificationWeb,OCLC開發(fā)了DeweyWeb,斯坦福大學(xué)開發(fā)了Ontolingua、Protégé本體開發(fā)工具,以及在醫(yī)學(xué)領(lǐng)域享有盛名的MeSH和UMLS等。這些知識組織體系已成為網(wǎng)絡(luò)環(huán)境下信息開發(fā)利用必不可少的重要基礎(chǔ)設(shè)施和工具,而且正逐步從西文向多語言信息處理方向發(fā)展,其搶占信息處理主導(dǎo)地位的戰(zhàn)略意圖顯而易見。

著名的基因本體由美國基因本體協(xié)會創(chuàng)建并維護(hù),在生物信息學(xué)領(lǐng)域中得到廣泛使用,業(yè)界利用GO提供的公共詞匯和語義描述基因產(chǎn)品,在不同數(shù)據(jù)庫中能夠體現(xiàn)基因產(chǎn)品的一致性描述。它主要包括3個分支:生物過程、分子功能和細(xì)胞組件。GO包含詞匯量90,261條。

在數(shù)字經(jīng)濟(jì)和全球化浪潮的席卷下,全球各大出版業(yè)巨頭都被裹挾在數(shù)字出版的浪潮之中。不管是出于主動還是被動,都在通過網(wǎng)絡(luò)化終端介入并滲透到對最終用戶的服務(wù)中,這種行徑不管是有意識或無意識,都已經(jīng)搶占了傳統(tǒng)圖書情報機(jī)構(gòu)的服務(wù)領(lǐng)地。幾乎所有的數(shù)字出版商都在面向最終用戶推出以內(nèi)容為核心的智能檢索、關(guān)聯(lián)揭示、數(shù)據(jù)挖掘與數(shù)據(jù)分析等知識服務(wù)。我國是科技文獻(xiàn)出版和使用的大國,國際出版界系統(tǒng)通過壟斷最終用戶提供知識服務(wù),從而實(shí)現(xiàn)對我國文獻(xiàn)信息服務(wù)市場的控制的戰(zhàn)略意圖。

1.3.2國內(nèi)研究進(jìn)展

2006一2008年,國內(nèi)在本體技術(shù)領(lǐng)域中的研究熱點(diǎn)包括:本體工具、本體學(xué)習(xí)、本體庫、本體提取、本體推理,本體翻譯和本體語言等。國內(nèi)的學(xué)者和機(jī)構(gòu)更傾向于算法、匹配、映射、建模,推理和抽取研究。所有相關(guān)研究中,語義分析和語義標(biāo)引都是關(guān)鍵性工作。2008年之后,單純以本體理論為研究主題的項(xiàng)目不再列人基金項(xiàng)目申請的范疇”。

2006—2009年的科技部支撐計(jì)劃項(xiàng)目“農(nóng)村知識本體構(gòu)建的共性技術(shù)研究”(2006BAD10A050104)中,發(fā)表論文基于花卉學(xué)科技文獻(xiàn)的大規(guī)模本體開發(fā)環(huán)境(LODE)的開發(fā),并實(shí)現(xiàn)了基于本體知識庫的半自動標(biāo)引(見圖1)。

圖1對中文科技文獻(xiàn)進(jìn)行半自動語義標(biāo)引的示例圖(系統(tǒng)自動生成頁面)

2011年,王穎[10]在中科院成都計(jì)算機(jī)應(yīng)用研究所讀博士期間,完成了《中醫(yī)藥領(lǐng)域本體及知識庫的研究與應(yīng)用》,對基于本體的中醫(yī)診斷系統(tǒng)進(jìn)行了實(shí)證研究(見圖2)。

圖2中醫(yī)藥相關(guān)知識點(diǎn)的語義網(wǎng)結(jié)構(gòu)示例和舌診辨證流程

2011年,國家科技圖書文獻(xiàn)中心(NSTL)承擔(dān)了科技部支撐計(jì)劃項(xiàng)目“面向外文科技文獻(xiàn)信息的知識組織體系建設(shè)與應(yīng)用示范”(2011BAH10B00,又稱“超級科技詞表項(xiàng)目”)。項(xiàng)目的建設(shè)目標(biāo)是:采用國際上先進(jìn)的知識組織技術(shù)和方法,在國內(nèi)外已有系統(tǒng)建設(shè)成果和應(yīng)用經(jīng)驗(yàn)的基礎(chǔ)上,爭取在“十二五”期間基本建成面向計(jì)算機(jī)應(yīng)用的科技知識組織體系,為我國海量外文科技文獻(xiàn)信息的組織和利用提供支撐,實(shí)現(xiàn)國家科技文獻(xiàn)信息戰(zhàn)略資源的有效組織,提供知識檢索服務(wù),揭示更深層次的知識關(guān)聯(lián),從而實(shí)現(xiàn)基于國家科技文獻(xiàn)信息戰(zhàn)略資源的知識發(fā)現(xiàn)、知識挖掘和知識計(jì)算應(yīng)用示范,整體提升我國科技文獻(xiàn)信息機(jī)構(gòu)的知識服務(wù)能力。其具體目標(biāo)中就包含:構(gòu)建以領(lǐng)域本體為目標(biāo)的外文科技知識組織體系,以及建立國家科技知識組織體系的可持續(xù)發(fā)展機(jī)制。

由此可見,2010年后,本體相關(guān)項(xiàng)目更注重于構(gòu)建基于本體的知識組織體系(又稱“實(shí)用分類體系”),并側(cè)重于知識組織體系的應(yīng)用和實(shí)踐。

2 本體理論在文獻(xiàn)工作中發(fā)揮的作用

2.1本體是唯一可以作為系統(tǒng)間互操作的底層知識庫

本體中至少要包括其概念和概念間關(guān)聯(lián),這是本體的核心。如果只具備簡單的概念和概念間上下位關(guān)聯(lián),如“梅花”,其上位概念為“李屬植物”,“李屬植物”的上位概念是“薔薇科植物”,“梅花”的下位概念有“骨紅垂枝”(梅花的品種之一)、“白碧垂枝”(梅花的品種之一),那么此類本體僅屬于輕量級本體。重量級本體中包括對概念的描述,以及以形式邏輯公式表示的概念間關(guān)系。最重要的,其間包括的概念不僅僅是簡單的術(shù)語表達(dá)和描述,而是多個屬性值的集合。例如概念“梅花”,對概念的描述,不僅僅是薔薇科李屬植物。具體到屬性,仍然有包括同義詞、別名、拉丁學(xué)名,上位分類,花期,品種,花色,栽培規(guī)程,經(jīng)濟(jì)用途等多個屬性,且每個屬性具備不同的屬性值。鑒于本體中概念的關(guān)系可以反映詞匯之間語義的映射關(guān)系,所以在智能檢索、文獻(xiàn)的結(jié)構(gòu)化拆分、語義標(biāo)注、機(jī)器翻譯,以及增強(qiáng)大模型性能這些方面,本體都具備無可替代的作用。但是本體的生成不能完全依賴于人工智能,其底層數(shù)據(jù)和知識鏈接的建立,目前仍然主要依賴于傳統(tǒng)數(shù)據(jù)加[11-15]工業(yè)務(wù)中基礎(chǔ)數(shù)據(jù)的完備和準(zhǔn)確。

2.2本體在標(biāo)準(zhǔn)文獻(xiàn)工作中的作用

標(biāo)準(zhǔn)文獻(xiàn)屬于科技文獻(xiàn)范疇,是一種特種文獻(xiàn),以其更新作廢替代周期快(標(biāo)準(zhǔn)具有標(biāo)齡)、技術(shù)內(nèi)容含量集中、數(shù)據(jù)公式圖表多、不同品種標(biāo)準(zhǔn)文本的體例格式有自己固定格式且各不相同等特點(diǎn),有別于一般科技文獻(xiàn)。基于上述特征,本體理論應(yīng)用于標(biāo)準(zhǔn)文獻(xiàn)服務(wù)工作中,能夠起到以下作用:

(1)提高用戶對標(biāo)準(zhǔn)文獻(xiàn)數(shù)據(jù)庫的檢索效率(查全率、查準(zhǔn)率)。建立基于本體的知識組織體系,作為標(biāo)準(zhǔn)文獻(xiàn)數(shù)據(jù)庫的檢索底層,并結(jié)合對標(biāo)準(zhǔn)文本的結(jié)構(gòu)化處理,以及對標(biāo)準(zhǔn)文本所進(jìn)行的知識對象(知識要素)標(biāo)引,能夠最大限度地揭示標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容。特別是能夠揭示標(biāo)準(zhǔn)文獻(xiàn)中的技術(shù)指標(biāo),并將指標(biāo)進(jìn)行比對,形成比對表,能夠令用戶充分了解同類產(chǎn)品在不同品種標(biāo)準(zhǔn)中的指標(biāo)基本情況,以此判定國際標(biāo)準(zhǔn)和不同國家的標(biāo)準(zhǔn)對同一產(chǎn)品規(guī)格要求的異同。能夠令用戶充分了解同類產(chǎn)品在同一系列標(biāo)準(zhǔn)的不同制定年代版本中的不同規(guī)定,以此掌握該產(chǎn)品在不同時期的行業(yè)技術(shù)發(fā)展走勢。

(2)在標(biāo)準(zhǔn)文獻(xiàn)數(shù)據(jù)庫中建立基于本體的知識關(guān)聯(lián),并基于此為用戶提供組合式檢索、打包服務(wù)和專題服務(wù)。

(3)應(yīng)用于參考咨詢服務(wù)中(專家系統(tǒng)),以基于本體知識庫的累積和更新,基于本體中概念間邏輯關(guān)系判斷,自動為用戶提供答案,并在自學(xué)習(xí)機(jī)制和自動校驗(yàn)機(jī)制下,不斷積累、更新,使得答案不斷完善,質(zhì)量不斷提高。

(4)在標(biāo)準(zhǔn)文獻(xiàn)資源建設(shè)中,基于本體的底層標(biāo)準(zhǔn)文獻(xiàn)知識庫的建立(作為提供各種應(yīng)用的基礎(chǔ))可以為標(biāo)準(zhǔn)文獻(xiàn)加工中的自動化概念標(biāo)引提供基礎(chǔ),并由此提升加工效率、拓展加工深度、改善加工準(zhǔn)確度。基于本體的標(biāo)準(zhǔn)文獻(xiàn)知識庫還能夠?yàn)槎嗾Z種標(biāo)準(zhǔn)文獻(xiàn)機(jī)器翻譯提供豐富的術(shù)語翻譯選擇并成為多語種概念間的映射。

3 實(shí)踐研究

3.1標(biāo)準(zhǔn)文獻(xiàn)語料庫建設(shè)

語料庫在語言學(xué)上指大量的文本經(jīng)過整理和加工,具有規(guī)范的格式與特定標(biāo)記,是存放原始語言材料的數(shù)據(jù)倉庫。一般來說,語料庫的語料來源可能會非常廣泛,包括詞典、叢書、專著、論文集等。標(biāo)準(zhǔn)文獻(xiàn)語料庫的來源主要包括標(biāo)準(zhǔn)和技術(shù)法規(guī),以及技貿(mào)措施相關(guān)信息。知識庫是用于知識管理的一種特殊的工具,用于領(lǐng)域知識的采集、整理和提煉揭示。知識庫中的知識對象是專業(yè)領(lǐng)域知識的集合,包括概念、事實(shí)、規(guī)則和其他有用信息。

語料庫、知識庫和知識組織體系(KOS)的構(gòu)建,是知識管理和知識服務(wù)的基礎(chǔ)、前沿和熱點(diǎn)。語料庫的用途包括實(shí)現(xiàn)數(shù)據(jù)挖掘、語義標(biāo)引、機(jī)器翻譯、知識關(guān)聯(lián)、智能檢索等功能和模塊[6-18]。

該項(xiàng)研究中研發(fā)的語料庫原型系統(tǒng),實(shí)現(xiàn)了按照簡單的知識組織體系(初級本體)進(jìn)行專業(yè)導(dǎo)航的功能(見圖3)。并在數(shù)據(jù)結(jié)構(gòu)中設(shè)置了“知識對象”這一字段,其作用是為建立復(fù)雜的基于本體的知識庫建立“知識對象”—“中文語料”—“英文語料”—“XX語種語料”奠定映射表基礎(chǔ)。以支持后續(xù)機(jī)器翻譯、自動標(biāo)引等多種功能的拓展。

圖3分專業(yè)瀏覽語料的原型系統(tǒng)頁面

3.2標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容指標(biāo)揭示數(shù)據(jù)庫建設(shè)

通過對我國食品、農(nóng)產(chǎn)品、環(huán)保領(lǐng)域相關(guān)的國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)以及法律法規(guī)文件的收集、分類、整理、數(shù)據(jù)加工,完成了1206個食品與農(nóng)產(chǎn)品領(lǐng)域、3777個環(huán)保領(lǐng)域標(biāo)準(zhǔn)和法律法規(guī)的內(nèi)容解釋、數(shù)據(jù)加工,建設(shè)了相應(yīng)的數(shù)據(jù)庫。與傳統(tǒng)的以查找文本為目的的檢索方法相比,除直接查詢技術(shù)指標(biāo)和關(guān)鍵技術(shù)內(nèi)容外,還可獲取相關(guān)系列產(chǎn)品和相關(guān)標(biāo)準(zhǔn)體系,提高了技術(shù)標(biāo)準(zhǔn)查詢精度與效率,使檢索結(jié)果有更大的利用價值。

傳統(tǒng)檢索方式,主要根據(jù)主題詞、分類號等進(jìn)行檢索,檢索結(jié)果的反饋集中體現(xiàn)在篇目信息(即文獻(xiàn)的標(biāo)題),不能針對標(biāo)準(zhǔn)正文內(nèi)容中所涉及的具體指標(biāo)和關(guān)鍵技術(shù)內(nèi)容進(jìn)行檢索。以“乳制品中六六六殘留量規(guī)定”這一檢索目標(biāo)為例:

如果使用普通的主題詞檢索,設(shè)定檢索詞為“六六六”和“乳制品”,僅得到一個結(jié)果,即《出口乳及乳制品中“六六六”“滴滴涕”殘留量檢驗(yàn)方法》(SN0127—1992,已作廢的商檢行業(yè)標(biāo)準(zhǔn))。如果輸入檢索詞“乳制品”,得到32條乳制品國家標(biāo)準(zhǔn)與行業(yè)標(biāo)準(zhǔn),將其中有可能涉及衛(wèi)生指標(biāo)的標(biāo)準(zhǔn)逐篇進(jìn)行閱讀分析,查找對六六六殘留量的限定值。這樣不但查找速度慢,而且因?yàn)闊o法實(shí)現(xiàn)系列乳制品產(chǎn)品標(biāo)準(zhǔn)的體系查詢,檢索結(jié)果可能會存在較多缺失。

如果使用標(biāo)準(zhǔn)內(nèi)容揭示系統(tǒng)進(jìn)行檢索,輸人檢索詞“乳制品”和“六六六”。因?yàn)閮?nèi)容揭示檢索對技術(shù)指標(biāo)進(jìn)行了分解,而且利用本體框架對系列產(chǎn)品進(jìn)行了分類,所以得出國家標(biāo)準(zhǔn)與行業(yè)標(biāo)準(zhǔn)給出的8個不同乳制品產(chǎn)品中六六六殘留量的限定值,檢索結(jié)果定位準(zhǔn)確完備。如表1所示。

在構(gòu)建標(biāo)準(zhǔn)文獻(xiàn)揭示指標(biāo)檢索體系的過程中,吸納了本體技術(shù)的基本方法,構(gòu)建了以專用本體分類表為基礎(chǔ),以概念屬性關(guān)系描述為重要手段的標(biāo)準(zhǔn)知識內(nèi)容與技術(shù)指標(biāo)的揭示檢索系統(tǒng),解決了標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容指標(biāo)的體系查詢與關(guān)聯(lián)檢索的問題。

在研究的基礎(chǔ)上,重點(diǎn)開展了食品、農(nóng)產(chǎn)品、環(huán)保領(lǐng)域部分重要標(biāo)準(zhǔn)內(nèi)容揭示數(shù)據(jù)庫建設(shè)。建立了標(biāo)準(zhǔn)文獻(xiàn)內(nèi)容揭示基礎(chǔ)支撐數(shù)據(jù)庫,包括:揭示詞表數(shù)據(jù)庫、本體類表數(shù)據(jù)庫、揭示范疇表數(shù)據(jù)庫、中標(biāo)分類數(shù)據(jù)庫、國際分類法數(shù)據(jù)庫、標(biāo)準(zhǔn)體系表數(shù)據(jù)庫。建立了應(yīng)用支撐數(shù)據(jù)庫,包括:主題對象數(shù)據(jù)庫、標(biāo)準(zhǔn)體例數(shù)據(jù)庫、計(jì)量單位數(shù)據(jù)庫、限定類數(shù)據(jù)庫和技術(shù)指標(biāo)揭示數(shù)據(jù)庫等,實(shí)現(xiàn)了標(biāo)準(zhǔn)中特定技術(shù)指標(biāo)的檢索、系列產(chǎn)品的檢索,以及與產(chǎn)品相關(guān)的技術(shù)標(biāo)準(zhǔn)體系的檢索。檢索效果見圖4、圖5。

表1乳制品國內(nèi)標(biāo)準(zhǔn)技術(shù)指標(biāo)列表
圖4主題“荔枝”指標(biāo)“毒死蜱”檢索界面
圖5荔枝(主題對象)的“毒死蜱”(指標(biāo))含量比對結(jié)果

3.3基于初級本體的專題集成

按照已有的分類體系(如標(biāo)準(zhǔn)分類法、海關(guān)分類編碼等)建立家電產(chǎn)品初級本體,并將相關(guān)標(biāo)準(zhǔn)文獻(xiàn)按照已經(jīng)建立的家電產(chǎn)品本體進(jìn)行分類歸納(見圖6)。按照這種方式建立的專題集成,其優(yōu)勢是便于查詢和瀏覽,符合一般讀者的閱讀習(xí)慣。

圖6家電產(chǎn)品專題集成產(chǎn)品分類頁面

3.4標(biāo)準(zhǔn)化術(shù)語質(zhì)量分析與語料庫應(yīng)用研究

繼“標(biāo)準(zhǔn)文獻(xiàn)語料庫建設(shè)(3.1)”之后,在以下方面開展探索:

(1)在語料記錄數(shù)上,從現(xiàn)有的4500條增加到10,000條,并繼續(xù)以基礎(chǔ)標(biāo)準(zhǔn)化領(lǐng)域、家電和電工領(lǐng)域的標(biāo)準(zhǔn)文獻(xiàn)為基礎(chǔ),進(jìn)行語料的提取和加工。(2)現(xiàn)有的已建成的語料庫原型系統(tǒng)中的語料素材,基本是以術(shù)語為主,在ⅡI期中,將嘗試對自由詞、詞組、短句、標(biāo)準(zhǔn)文獻(xiàn)中常見的標(biāo)準(zhǔn)句型進(jìn)行基于本體中知識對象的著錄標(biāo)引加工。因?yàn)樾g(shù)語只是語料素材的一部分而已,要想進(jìn)行翻譯,后面所說的這些(自由詞、詞組、短句、標(biāo)準(zhǔn)文獻(xiàn)中常見的標(biāo)準(zhǔn)句型)才是更重要和有價值的,也是標(biāo)準(zhǔn)文獻(xiàn)語料加工中沒有開展過嘗試的。(3)2011年開發(fā)出的語料庫原型系統(tǒng)(prototype),只具備簡單的語料記錄查詢功能和語料錄入功能;后續(xù)將開發(fā)完備的語料記錄數(shù)據(jù)庫管理系統(tǒng)(初具雛形的基于本體的知識庫),具有簡單檢索、高級查詢和標(biāo)準(zhǔn)文獻(xiàn)數(shù)據(jù)庫的接口功能,輸入和編輯復(fù)雜語料記錄(不僅僅是術(shù)語)的功能,并預(yù)留和翻譯平臺軟件的接口。(4)后續(xù),將嘗試和成熟的翻譯平臺軟件進(jìn)行對接,驗(yàn)證機(jī)器翻譯效果。

3.5標(biāo)準(zhǔn)技術(shù)指標(biāo)與產(chǎn)品基礎(chǔ)信息知識關(guān)聯(lián)關(guān)鍵標(biāo)準(zhǔn)研究

2013一2017年依托質(zhì)檢行業(yè)公益專項(xiàng)“標(biāo)準(zhǔn)技術(shù)指標(biāo)與產(chǎn)品基礎(chǔ)信息知識關(guān)聯(lián)關(guān)鍵標(biāo)準(zhǔn)研究”主要開展了基于產(chǎn)品基礎(chǔ)信息的標(biāo)準(zhǔn)技術(shù)指標(biāo)抽取分析統(tǒng)計(jì)等方法的研制,研究通用的標(biāo)準(zhǔn)技術(shù)指標(biāo)體系分布規(guī)律,通用普適的分析方法和模式,建立對比規(guī)范和元數(shù)據(jù)加工規(guī)范;開展產(chǎn)品標(biāo)準(zhǔn)技術(shù)指標(biāo)跟蹤技術(shù)的研究,并建立指標(biāo)跟蹤模型。之后,在建立和完善標(biāo)準(zhǔn)技術(shù)指標(biāo)體系與產(chǎn)品標(biāo)準(zhǔn)技術(shù)指標(biāo)跟蹤模型的基礎(chǔ)上,以可再生能源相關(guān)產(chǎn)品(如太陽能光伏發(fā)電產(chǎn)品)企業(yè)和產(chǎn)品標(biāo)準(zhǔn)技術(shù)指標(biāo)體系為例,完成產(chǎn)品、標(biāo)準(zhǔn)、指標(biāo)與企業(yè)信息等知識要素關(guān)聯(lián)(基于本體的)概念模型和產(chǎn)品標(biāo)準(zhǔn)指標(biāo)數(shù)據(jù)統(tǒng)計(jì)分析模型的研發(fā)和構(gòu)建工作。開展了業(yè)務(wù)功能測試和試點(diǎn)工作,檢驗(yàn)并測試概念模型的邏輯性和原型系統(tǒng)的實(shí)用性。太陽能光伏電池與技術(shù)標(biāo)準(zhǔn)和企業(yè)形成的輕量級本體邏輯關(guān)系圖如圖7所示。

目前,相關(guān)成果和基于標(biāo)準(zhǔn)文獻(xiàn)的技術(shù)指標(biāo)揭示技術(shù)已經(jīng)成功申報,并于2021年度正式出版成為國家標(biāo)準(zhǔn)GB/T39872—2021《標(biāo)準(zhǔn)文獻(xiàn)技術(shù)指標(biāo)揭示數(shù)據(jù)規(guī)范》 [19]。

4結(jié)語

綜合上述,在相關(guān)研究中,“標(biāo)準(zhǔn)化術(shù)語質(zhì)量分析與語料庫應(yīng)用研究”注重基于本體的標(biāo)準(zhǔn)文獻(xiàn)知識庫的構(gòu)建。“技術(shù)標(biāo)準(zhǔn)知識關(guān)聯(lián)研究”注重基于本體的知識關(guān)聯(lián)關(guān)鍵技術(shù)的研發(fā)。“標(biāo)準(zhǔn)技術(shù)指標(biāo)與產(chǎn)品基礎(chǔ)信息知識關(guān)聯(lián)關(guān)鍵標(biāo)準(zhǔn)研究”注重基于本體的技術(shù)標(biāo)準(zhǔn)內(nèi)容指標(biāo)揭示和知識關(guān)聯(lián)研究,并體現(xiàn)“企業(yè)-產(chǎn)品-標(biāo)準(zhǔn)-技術(shù)指標(biāo)”這四大類知識要素之間知識關(guān)聯(lián)的展示和應(yīng)用。

結(jié)合企業(yè)和市場需求,以上研究會持續(xù)推進(jìn)和支持標(biāo)準(zhǔn)文獻(xiàn)翻譯、面向服務(wù)的標(biāo)準(zhǔn)文獻(xiàn)知識關(guān)聯(lián)以及標(biāo)準(zhǔn)文獻(xiàn)知識庫構(gòu)建方面的工作。

圖7太陽能光伏電池與標(biāo)準(zhǔn)和企業(yè)的本體邏輯關(guān)系圖

基于本體的知識組織體系建設(shè)和相應(yīng)的關(guān)鍵技術(shù)研發(fā)將會極大地促進(jìn)標(biāo)準(zhǔn)文獻(xiàn)信息系統(tǒng)知識服務(wù)能力的提升;促進(jìn)標(biāo)準(zhǔn)文獻(xiàn)檢索從傳統(tǒng)檢索查詢模式向具有內(nèi)容相關(guān)揭示、跨庫檢索、多語言檢索等功能的智慧模式轉(zhuǎn)變;促進(jìn)標(biāo)準(zhǔn)文獻(xiàn)服務(wù)工作從傳統(tǒng)的標(biāo)準(zhǔn)文獻(xiàn)信息提供向科技對象實(shí)體的關(guān)聯(lián)發(fā)現(xiàn)、熱點(diǎn)監(jiān)測、趨勢分析的知識服務(wù)進(jìn)行轉(zhuǎn)變;促進(jìn)標(biāo)準(zhǔn)文獻(xiàn)和科技文獻(xiàn)的融合與關(guān)聯(lián),發(fā)揮合力,更好地為國家科技圖書文獻(xiàn)中心(NSTL)用戶群體提供集成化、多元化的知識服務(wù)。

參考文獻(xiàn)

[1] GRUBER T R.A. translation approach to portable ontology specification [J]. Knowledge Acquisition, 1993(5): 199- 220.

[2] BORST P,AKKERMANS H. An ontology approach to product disassembly [P]. EKAW 1997, Sant Feliu de Gu5xols, Spain, October: 15\~19.

[3] USCHOLD M,MICHAEL G. Ontologies: Principles, methods and applications [J]. Knowledge Engineering Review.1996 (2): 93-136.

[4] MUSEN M A.Dimensions of knowledge sharing and reuse [J]. Computers and Biomedical Research, 1992(25): 435- 467.

[5] UNSPSC. United nations standard products and services code [EB/0L].(2003-02-01)[2025-01-10]. http://www. unspsc.org/.

[6] MCGUINNESS D L,WRIGHT J. Conceptual Modeling for Configuration: A description Logic-based Approach [J]. Artificial Intelligence for Engineering Design, Analysis, and Manufacturing - special issue on Configuration.1998(4): 333-344.

[7] MCGUINNESS D L,F(xiàn)IKES R,RICE J.et al. An environment for merging and testing large ontologies. principles of knowledge representation and reasoning [P]: Proceedings of the Seventh International Conference (KR2000). A. G. Cohn, F. Giunchiglia and B. Selman, editors. San Francisco, CA, Morgan Kaufmann Publishers.

[8] ASHBURNER M. Gene ontology: Tool for the unification of biology[J]. Nat. Genet,2000(1): 25-29.

[9]李景,孟憲學(xué),蘇曉路.領(lǐng)域本體的構(gòu)建方法與應(yīng)用研 究[M].北京:中國農(nóng)業(yè)科學(xué)技術(shù)出版社,2009.

[10]王穎.中醫(yī)藥領(lǐng)域本體及知識庫的研究與應(yīng)用[D]成 都:中國科學(xué)院成都計(jì)算機(jī)應(yīng)用研究所,2011.

[11]張曉林.走向知識服務(wù):第一版[M].成都:四川大學(xué)出 版社,2001.

[12]李景,錢平,蘇曉鷺.構(gòu)建基于Ontology的知識門戶[J] 現(xiàn)代圖書情報技術(shù),2004(2):18-21+41.

[13]李景.多語種文獻(xiàn)數(shù)據(jù)庫的設(shè)計(jì)考慮[J].情報學(xué)報, 2003(3):321-324.

[14]劉曉霞.概念圖知識表示方法的研究[J].計(jì)算機(jī)應(yīng)用 與軟件2001(8):56-59

[15]董振東,董強(qiáng).知網(wǎng)和漢語研究[J].當(dāng)代語言學(xué), 2001(1):33-44+77.

[16]教育部語言文字應(yīng)用研究所計(jì)算機(jī)語言學(xué)研究 室.語料庫在線[EB/0L].(2010-11-10)[2025-01-12]. http://124.207.106.21:8080/.

[17]北京大學(xué)中國語言學(xué)研究中心.漢英雙語語料庫[EB/ OL]. (2011-01-10)[2025-01-15].http://ccl.pku.edu.cn/ yuliao_contents.asp.

[18]清華大學(xué).漢語均衡語料庫.TH-ACorpus[EB/OL]. (2012-01-10)[2025-01-15]. http://www.lits.tsinghua.edu. cn/ainlp/source.htm .

[19]全國科技平臺標(biāo)準(zhǔn)化技術(shù)委員會.標(biāo)準(zhǔn)文獻(xiàn)技術(shù)指標(biāo) 揭示數(shù)據(jù)規(guī)范:GB/T39872—2021[S].北京:中國標(biāo)準(zhǔn) 出版社,2021.

猜你喜歡
概念數(shù)據(jù)庫標(biāo)準(zhǔn)
2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
Birdie Cup Coffee豐盛里概念店
幾樣概念店
忠誠的標(biāo)準(zhǔn)
美還是丑?
學(xué)習(xí)集合概念『四步走』
聚焦集合的概念及應(yīng)用
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
主站蜘蛛池模板: 动漫精品中文字幕无码| 青青青国产在线播放| 久久精品人人做人人爽97| 亚洲男人天堂2020| 国产成人无码AV在线播放动漫| 中文字幕色站| 东京热一区二区三区无码视频| 久久这里只精品热免费99| 99热这里只有精品免费国产| 免费无码AV片在线观看中文| 高清码无在线看| 日本午夜精品一本在线观看| 国产精品爽爽va在线无码观看| 亚洲男人在线| 色妞www精品视频一级下载| 亚洲人成影院在线观看| 欧美a级在线| 最近最新中文字幕在线第一页| 久久青草热| 欧美天天干| 国产一在线| 激情网址在线观看| 亚洲天堂网2014| 亚洲欧洲日韩综合| 99re热精品视频中文字幕不卡| 国产福利免费视频| 亚洲最猛黑人xxxx黑人猛交| 高清大学生毛片一级| 亚洲国产中文精品va在线播放| 欧美成a人片在线观看| 亚洲第一成年人网站| 欧美成a人片在线观看| 国产精品成人啪精品视频| 欧美黑人欧美精品刺激| 久久久久无码国产精品不卡| 亚欧乱色视频网站大全| 免费无码网站| 欧美精品一区二区三区中文字幕| 亚洲国产成人自拍| www亚洲天堂| 久久综合国产乱子免费| 亚洲av无码人妻| 欧洲亚洲一区| 香蕉伊思人视频| 亚洲一级毛片在线播放| 黄色国产在线| 欧美精品亚洲精品日韩专区va| 亚洲91在线精品| 91久久国产成人免费观看| 国产国产人成免费视频77777 | 成人国产精品2021| 一区二区三区高清视频国产女人| 制服丝袜国产精品| 亚洲激情区| 在线视频97| 天天综合网在线| 亚洲一区精品视频在线| 欧美激情一区二区三区成人| 亚洲综合色婷婷中文字幕| 国产成人91精品| 亚洲国产天堂久久九九九| 欧美国产中文| 亚洲综合色区在线播放2019 | 91口爆吞精国产对白第三集| 中文字幕欧美日韩| 亚洲欧洲国产成人综合不卡| 日本在线欧美在线| 国产SUV精品一区二区| 最新亚洲人成网站在线观看| 国产精品免费久久久久影院无码| 40岁成熟女人牲交片免费| 中国美女**毛片录像在线| 国产欧美在线观看精品一区污| 日本国产在线| 激情爆乳一区二区| 国产成人精品日本亚洲77美色| 欧美午夜网| 狠狠操夜夜爽| 久久人人97超碰人人澡爱香蕉| 无码日韩视频| 91日本在线观看亚洲精品| 国产日本视频91|