999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于web3.0的高校數(shù)字圖書館信息服務(wù)平臺構(gòu)建研究

2012-11-08 09:45:08許建林
關(guān)鍵詞:語義圖書館服務(wù)

許建林, 毛 燁

(江蘇畜牧獸醫(yī)職業(yè)技術(shù)學(xué)院,江蘇 泰州 225300)

數(shù)字圖書館的發(fā)展,對高校圖書館提供的服務(wù)要求也越來越高,圖書館海量資源的數(shù)字化、服務(wù)手段的網(wǎng)絡(luò)化,使圖書館由傳統(tǒng)的資源管理、資源服務(wù)向知識化、個(gè)性化管理和服務(wù)轉(zhuǎn)變。知識化、個(gè)性化業(yè)已成為現(xiàn)代高校數(shù)字圖書館信息服務(wù)工作的重要內(nèi)涵,那么提供怎樣的知識化、個(gè)性化的信息服務(wù),這需要構(gòu)建與之相適應(yīng)的信息服務(wù)平臺。傳統(tǒng)的信息服務(wù)平臺大多是基于web1.0和web2.0技術(shù),而實(shí)現(xiàn)知識化、個(gè)性化信息服務(wù),則需借助于web3.0技術(shù)。構(gòu)建基于web3.0的數(shù)字圖書館信息服務(wù)平臺,可以實(shí)現(xiàn)圖書館信息服務(wù)的個(gè)性化、智能化、精準(zhǔn)化和高效化。

1 web1.0、web2.0、web3.0的發(fā)展

web1.0是一個(gè)靜態(tài)的、以資源為中心并單向傳遞信息的網(wǎng)絡(luò),讀者需主動訪問基于web1.0的網(wǎng)站,才會獲取相關(guān)信息,否則不會產(chǎn)生信息的流動,此時(shí)讀者只是單純的信息接受者。即在高校圖書館信息服務(wù)中,高校圖書館提供什么樣的信息,讀者只能被動的、單方面的接受什么樣的信息,這種基于web1.0的信息服務(wù)是信息服務(wù)的機(jī)械化階段。

web2.0是一個(gè)動態(tài)的、以讀者為中心并雙向互動的網(wǎng)絡(luò),讀者在這里不僅可以接受服務(wù),也可以參與到圖書館提供服務(wù)的過程中。基于web2.0的信息服務(wù)網(wǎng)站不僅具有信息推送、訂閱、篩選等功能,它還允許讀者上傳信息、建立個(gè)人空間。在這里,讀者既是信息的接受者,也是信息的生產(chǎn)者。這種信息服務(wù)模式,體現(xiàn)了人機(jī)的雙向互動,實(shí)現(xiàn)了信息服務(wù)的半智能化。

web3.0是繼 web1.0、web2.0后的進(jìn)一步提升,它具有更好的互動性,可以為讀者提供一個(gè)智能化、知識化、個(gè)性化的信息服務(wù)平臺,是更加智能化的人機(jī)雙向互動的網(wǎng)絡(luò)模式。這種基于web3.0的信息服務(wù)平臺具有強(qiáng)大的語義概念,使計(jì)算機(jī)能夠智能化的滿足讀者的需求。讀者只需要登錄平臺就可以獲得個(gè)性化的服務(wù),通過輸入自然語言就可以迅速檢索到一整套范圍廣、準(zhǔn)確率高的信息。

2 構(gòu)建基于web3.0信息服務(wù)平臺的關(guān)鍵技術(shù)

傳統(tǒng)的信息獲取方式是基于關(guān)鍵詞的匹配技術(shù),對被檢索的語義并不需要了解,因此檢索結(jié)果就會因歧義、多義等因素而出現(xiàn)偏差。基于web 3.0信息平臺的信息獲取方式不再是單純的關(guān)鍵詞匹配模式,它理解檢索者的需求,自動分析、篩選出符合要求的信息,使檢索到的信息更為精確。下面是兩種不同獲取信息方式,如圖1、圖2所示:

信息服務(wù)平臺能夠理解檢索者的需求,這需要借助于 web3.0中的語義網(wǎng)(Semantic Web)技術(shù),它是一種能理解人類語言的智能網(wǎng)絡(luò),不同于因特網(wǎng),它是因特網(wǎng)的擴(kuò)展與延伸,而且因特網(wǎng)是面向文檔的,而語義網(wǎng)的對象是文檔所表示的數(shù)據(jù),語義網(wǎng)相對于因特網(wǎng)更利于計(jì)算機(jī)理解讀者的真實(shí)想法。在web3.0時(shí)代構(gòu)建基于語義網(wǎng)的高校數(shù)字圖書館信息服務(wù)平臺,讓計(jì)算機(jī)為讀者實(shí)現(xiàn)個(gè)性化、智能化的信息服務(wù)。這需要解決兩個(gè)關(guān)鍵的技術(shù),即 本 體 (Ontology)和 概 念 圖 (Conceptual Graph)。

(1)本體一詞起源于哲學(xué),是研究客觀事物存在及其本質(zhì)的通用理論,本義為對世界上客觀存在物的系統(tǒng)地描述、解釋或說明,在圖書館信息服務(wù)平臺中,它是對某一專業(yè)領(lǐng)域知識的共同理解。通過對某一領(lǐng)域知識定義其領(lǐng)域術(shù)語,用相同的術(shù)語對資源進(jìn)行詳細(xì)準(zhǔn)確的描述,從而在具體應(yīng)用中可以通過共享語言達(dá)到相互的理解,進(jìn)而對其進(jìn)行語義標(biāo)注,使其具有語義功能,就能在計(jì)算機(jī)系統(tǒng)中表征和交換知識,并能夠被自動解析和識別。所以本體的構(gòu)建是實(shí)現(xiàn)語義網(wǎng)的根本,即要實(shí)現(xiàn)語義網(wǎng)首先要構(gòu)建領(lǐng)域本體。

一個(gè)本體的構(gòu)建一般也是針對現(xiàn)實(shí)生活中的某一特定的領(lǐng)域,構(gòu)建時(shí)首先是掌握本體應(yīng)用的背景、需求,以確定好本體應(yīng)用的領(lǐng)域;其次是查詢正在構(gòu)建的領(lǐng)域本體與已存在的本體庫是否重復(fù),如有重復(fù)則直接可以套用;第三是盡量列舉出該領(lǐng)域內(nèi)所有的重要術(shù)語,經(jīng)過領(lǐng)域?qū)<业姆治觥⒄恚崛〕鲈擃I(lǐng)域重要的、精準(zhǔn)無二義性的術(shù)語并編輯形成概念匯總表;第四是對收集來的術(shù)語進(jìn)行定義成類及各類之間的關(guān)系;第五是對領(lǐng)域本體進(jìn)行編碼,以便于計(jì)算機(jī)理解和處理,目前本體描述語言使用較多的是 OWL(Web Ontology Language)語言;最后就是需要進(jìn)行檢驗(yàn)和評價(jià),以便發(fā)現(xiàn)問題進(jìn)行完善。

(2)概念圖是一種圖形化的表示工具,是自然語言和計(jì)算機(jī)領(lǐng)域之間的橋梁,作為自然語言和計(jì)算機(jī)之間的語言,它為計(jì)算機(jī)進(jìn)一步處理語句,理解語句的語義作了很好的鋪墊。概念圖的構(gòu)造是由結(jié)點(diǎn)經(jīng)有向弧連接而成的,其結(jié)點(diǎn)有兩類,分別是概念結(jié)點(diǎn)和關(guān)系結(jié)點(diǎn)。概念結(jié)點(diǎn)一般由兩實(shí)體構(gòu)成,包括概念類型及實(shí)體對象,一般采用矩形來表示,用來表示實(shí)體、屬性、狀態(tài)或事件,關(guān)系結(jié)點(diǎn)一般用橢圓表示,用來表示概念間的交互關(guān)系。它們之間通過有向弧連接起來,這是三元組結(jié)構(gòu)。

本體論從一定程度上來說其實(shí)就是一種特殊的概念圖,將本體其中的類、實(shí)例及屬性值與概念圖中的結(jié)點(diǎn)相對應(yīng),類間的關(guān)系與概念圖中的弧相對應(yīng)。這樣,本體的概念就可以通過概念圖進(jìn)行表達(dá)。從兩者之間的關(guān)系,就可以使用基于概念圖的匹配算法來計(jì)算本體論中用戶查詢請求和事實(shí)數(shù)據(jù)的相關(guān)度。所以,概念圖在信息服務(wù)平臺中起著承前啟后的作用,如何準(zhǔn)確判斷出概念圖中概念之間的關(guān)聯(lián)關(guān)系對于計(jì)算機(jī)能否理解語義,實(shí)現(xiàn)語義的推理和計(jì)算有著關(guān)鍵的意義。

3 基于web3.0的信息服務(wù)平臺模型構(gòu)建

在高校數(shù)字圖書館中,由于web3.0技術(shù)的引入,使檢索服務(wù)由傳統(tǒng)的基于關(guān)鍵詞匹配的模式上升到了語義知識的層次。讀者在使用數(shù)字圖書館的過程中,使計(jì)算機(jī)能夠理解讀者的真實(shí)想法,與讀者進(jìn)行良好的人機(jī)交互,從而能夠達(dá)到更好的共建共享、信息交流的服務(wù)。

圖3 基于web3.0的數(shù)字圖書館個(gè)性化信息服務(wù)Fig.3 Web3.0based digital library personalized information service

構(gòu)建基于web3.0的高校數(shù)字圖書館信息服務(wù)平臺模型(圖3),其操作流程是先由讀者登陸平臺界面開始,平臺根據(jù)讀者賬號調(diào)動讀者偏好庫里相關(guān)數(shù)據(jù)自動構(gòu)建個(gè)性化界面;讀者在該平臺界面里提出信息檢索需求,平臺系統(tǒng)根據(jù)對其進(jìn)行語義分析處理,生成概念圖形式;根據(jù)生成的概念圖,平臺一方面將其與個(gè)人偏好庫進(jìn)行匹配,若偏好庫中包含與之相同的數(shù)據(jù)則增加其權(quán)重,否則對讀者行為庫進(jìn)行更新,另一方面平臺在領(lǐng)域本體庫中采用概念圖匹配算法進(jìn)行匹配及相似度計(jì)算,然后對檢索結(jié)果進(jìn)行相關(guān)性排序后輸出,最后平臺還需將讀者對檢索出結(jié)果的評價(jià)、使用情況等信息反饋給個(gè)性偏好庫,以更新并完善個(gè)性偏好庫。

信息服務(wù)平臺模型主要由語義分析處理、個(gè)性化、信息資源整合處理三個(gè)主要模塊組成。

3.1 語義分析處理模塊

本體可通過類、實(shí)例及其屬性組成的三元組來表示,概念圖中的結(jié)點(diǎn)可以與本體中的類、實(shí)例及其屬性相對應(yīng),概念圖中的弧可表示為類間的關(guān)系,所以本體可看做是一種特殊的概念圖,而概念圖也可看做是一種特殊的本體表現(xiàn)形式。于是,語義分析處理模塊通過對讀者的檢索需求進(jìn)行分析處理,通過對檢索式進(jìn)行抽詞、詞性標(biāo)注、句法分析、概念識別等操作抽取出檢索式中的詞語,并向概念圖進(jìn)行映射,表示成概念圖的模式,以便進(jìn)行語義檢索。

讀者采用自然語言的方式來進(jìn)行檢索,語義分析處理模塊在對讀者信息需求進(jìn)行抽詞處理時(shí),利用領(lǐng)域知識本體庫所含有的專業(yè)詞典,對檢索式中包含的專有詞匯進(jìn)行一一映射、挖掘,提煉出檢索表達(dá)式中有意義的詞。抽詞之后,將抽詞結(jié)果進(jìn)行詞性標(biāo)注處理,并進(jìn)一步進(jìn)行語法分析,然后通過概念識別,從而了解讀者檢索的類型,并最終可將讀者需求表達(dá)為概念圖模式,通過概念圖匹配算法來計(jì)算讀者查詢請求與事實(shí)之間的相關(guān)度,反映出讀者的真實(shí)需求。

3.2 個(gè)性化模塊

個(gè)性化模塊主要根據(jù)讀者專業(yè)的側(cè)重、檢索的歷史行為等,實(shí)現(xiàn)為不同的讀者提供全面的、準(zhǔn)確的個(gè)性化需求的信息。實(shí)現(xiàn)該功能需要對讀者進(jìn)行長期行為的跟蹤,當(dāng)讀者登錄信息服務(wù)平臺時(shí),平臺會自動生成適合讀者的個(gè)性化頁面和內(nèi)容。同樣,在檢索時(shí),平臺也會根據(jù)讀者的個(gè)性偏好,即使不同讀者提出相同要求,平臺也會輸出不同的檢索結(jié)果。

讀者在初次登錄該平臺時(shí),須先進(jìn)行注冊,通過提供個(gè)人興趣方向、專業(yè)背景、研究領(lǐng)域等信息,以便信息平臺系統(tǒng)對讀者進(jìn)行個(gè)性化設(shè)置。當(dāng)然,未免讀者所填信息不全或者后期興趣的轉(zhuǎn)移,還需要求讀者對自己提供的信息進(jìn)行更改外,信息服務(wù)平臺也可以根據(jù)讀者的檢索行為、檢索結(jié)果的反饋、瀏覽記錄等進(jìn)行挖掘,實(shí)現(xiàn)對個(gè)性化偏好庫的更新。

3.3 信息資源整合處理模塊

目前,高校數(shù)字圖書館都擁有了大量的信息資源,傳統(tǒng)的關(guān)鍵詞檢索方式,需要其檢索對象,也就是這些資源提煉出相應(yīng)的詞語以供檢索匹配。而基于web3.0的信息服務(wù)平臺則需要通過語義方式檢索,所以需要對圖書館中存儲的信息資源創(chuàng)建本體模型,進(jìn)而構(gòu)建領(lǐng)域本體庫。

在創(chuàng)建領(lǐng)域本體庫的過程中,需要創(chuàng)建人員與領(lǐng)域?qū)<疫M(jìn)行溝通,在領(lǐng)域?qū)<业膮f(xié)助下,充分挖掘領(lǐng)域的知識,達(dá)到對領(lǐng)域概念的一致性理解,形成一致認(rèn)可的領(lǐng)域詞匯。同時(shí),由于元數(shù)據(jù)所描述的結(jié)構(gòu)化數(shù)據(jù)容易被計(jì)算機(jī)所理解及處理,所以對數(shù)字圖書館信息資源元數(shù)據(jù)信息的挖掘也顯得尤為重要,因?yàn)閿?shù)量龐大,我們可以使用圖書館中成熟的元數(shù)據(jù)(MARC)。領(lǐng)域本體庫的構(gòu)建并不是一勞永逸的,隨著數(shù)字圖書館的信息資源不斷的積累發(fā)展,讀者的信息需求也在不斷發(fā)展,因此,領(lǐng)域本體庫也需要不停的維護(hù)更新。

4 結(jié)束語

web3.0作為 web1.0與 web2.0的繼承與發(fā)展,使計(jì)算機(jī)的運(yùn)用達(dá)到了語義的級別,計(jì)算機(jī)所識別的不再是簡單的一堆字符標(biāo)志及字符處理,更能夠理解字符中所包含的語義。本文探討基于web3.0時(shí)代的語義網(wǎng)技術(shù),改善目前高校數(shù)字圖書館信息資源服務(wù)中利用傳統(tǒng)技術(shù)難以查全、查準(zhǔn)相關(guān)資源的狀況,并探索本體構(gòu)建的方法和過程,利用概念圖匹配來表示 語義網(wǎng)的理論和方法,提出開發(fā)基于本體的語義信息服務(wù)平臺的框架,體現(xiàn)信息聚合的個(gè)性化、信息檢索的精準(zhǔn)化和智能化、信息服務(wù)的整合化和高效化。當(dāng)然由于基于web3.0的數(shù)字圖書館個(gè)性化信息服務(wù)平臺是建立在語義網(wǎng)技術(shù)之上的,平臺的建立和完善還需要進(jìn)一步完善領(lǐng)域知識本體的構(gòu)建,這是一個(gè)工作量很大也很復(fù)雜的工程。

[1]朱巧明,李培峰,吳嫻,等.中文信息處理技術(shù)教程[M].北京:清華大學(xué)出版社,2005.

[2]陳剛.基于Web3.0的數(shù)字圖書館個(gè)性化信息服務(wù)平臺的研究[D].南京:南京信息工程大學(xué)計(jì)算機(jī)與軟件學(xué)院,2011.

[3]吳一平.基于 Web3.0思想的圖書館3.0服務(wù)新模式的研究與應(yīng)用[J].圖書館,2011(1):90-92.

猜你喜歡
語義圖書館服務(wù)
語言與語義
服務(wù)在身邊 健康每一天
服務(wù)在身邊 健康每一天
服務(wù)在身邊 健康每一天
圖書館
招行30年:從“滿意服務(wù)”到“感動服務(wù)”
商周刊(2017年9期)2017-08-22 02:57:56
飛躍圖書館
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
圖書館里的是是非非
認(rèn)知范疇模糊與語義模糊
主站蜘蛛池模板: 国产女人喷水视频| 99热这里只有精品免费国产| 国产成人三级在线观看视频| 日韩无码视频专区| 亚洲男人在线| 国产全黄a一级毛片| 青青草91视频| 99热亚洲精品6码| 亚洲另类色| 国产精品30p| 麻豆国产精品视频| 国产精品不卡片视频免费观看| 国产丰满大乳无码免费播放| 99视频在线观看免费| 狠狠色香婷婷久久亚洲精品| 国产人成在线视频| 区国产精品搜索视频| 亚洲综合经典在线一区二区| 91在线中文| 特级做a爰片毛片免费69| 国产chinese男男gay视频网| 日本人又色又爽的视频| 美女毛片在线| 免费啪啪网址| 狠狠色综合久久狠狠色综合| 真人免费一级毛片一区二区| 国产欧美网站| 久久99蜜桃精品久久久久小说| 国产精品自拍露脸视频| 婷婷成人综合| 免费看黄片一区二区三区| 99在线免费播放| а∨天堂一区中文字幕| 亚洲精品无码在线播放网站| 91久久偷偷做嫩草影院精品| 蜜桃视频一区| 一本大道无码日韩精品影视 | 又大又硬又爽免费视频| 日韩无码精品人妻| 美女扒开下面流白浆在线试听| 九九这里只有精品视频| 二级特黄绝大片免费视频大片| 99国产在线视频| 狠狠躁天天躁夜夜躁婷婷| 日韩精品无码一级毛片免费| 国产日韩欧美视频| 成人午夜网址| 国产精品漂亮美女在线观看| 日韩毛片基地| 污网站在线观看视频| 国产原创自拍不卡第一页| 九色最新网址| 久久国产精品国产自线拍| 福利在线不卡一区| 57pao国产成视频免费播放| 免费观看成人久久网免费观看| 欧美a在线看| 国产精品妖精视频| 白浆免费视频国产精品视频| 国产91精选在线观看| 精品一区二区久久久久网站| 亚洲欧美成人网| 男女精品视频| 四虎国产永久在线观看| 国内丰满少妇猛烈精品播| 无码久看视频| 在线观看亚洲天堂| 国产精品一区在线麻豆| 国产色伊人| 91亚洲免费视频| 国产成人精品高清不卡在线| 欧美精品二区| 54pao国产成人免费视频| 中文字幕第1页在线播| 色综合狠狠操| 欧美日韩国产在线观看一区二区三区| 久久久久亚洲av成人网人人软件 | 91免费观看视频| 日本一本正道综合久久dvd| 午夜在线不卡| 亚洲成人在线网| 欧美性久久久久|