999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義關聯的高校圖書情報檔案數字資源整合研究?

2016-02-12 18:49:37譚靜
圖書館學刊 2016年11期
關鍵詞:關聯語義資源

譚靜

(天津城建大學圖書館,天津 300384)

基于語義關聯的高校圖書情報檔案數字資源整合研究?

譚靜

(天津城建大學圖書館,天津 300384)

分析了資源整合的內涵及作用,介紹了基于語義關聯的海量數字資源整合方法。詳述了高校圖書、情報、檔案資源整合的前提條件,主要包括:高校圖書、情報、檔案知識資源的數字化存貯,工作流程的革新化改造和高校組織之間基于協議的知識聯盟。最后,重點論述了基于語義關聯的圖書、情報、檔案數字資源整合模式。

語義關聯 數字資源 資源整合模式

信息社會的到來使得數字圖書館的服務模式發生了巨大轉變,更加專注于深度挖掘知識的內容和關聯性。隨著互聯網技術的不斷發展,數字資源的增長速度也在不斷加快,數字圖書館的知識資源也逐漸虛擬化,由此改變了用戶的使用習慣和交流方式[1]。為了將分散的數字資源進行整合,數字圖書館嘗試構建基于語義關聯的數字資源整合模型,從而進一步提高數字圖書館的知識服務效果。具體來講,數字資源整合技術就是利用相關技術將異構的數字資源進行整合,并通過后期的加工和排序處理將數字資源形成一個統一的整體,并將數字資源的規律性和知識性表現出來。筆者所研究的基于語義關聯的數字資源知識整合技術,就是利用語義處理相關技術,分析隱藏在數字資源中的知識,挖掘出語義關聯性,然后利用聚類和重構的方式將基于語義關聯的數字資源整合為一個有機整體,從而為用戶展現出豐富的知識關聯性。

1 資源整合的內涵及作用

資源整合技術就是根據特定需要將具有一定關聯性的數字對象、個體以及相應的功能進行重組、融合以及聚類處理,從而形成為同一種類的數字資源體系[2]。一般將描述資源的規范稱為元數據規范,而用于描述數字資源整合的規范又稱為數字資源整合的元數據規范。元數據規范已經成為基于語義關聯的數字資源管理系統的重要規范,甚至可以直接將該規范認定為各種數字資源的統一規定。寬泛地講,數字資源的整合描述在分布式資源檢索、資源定位以及基于異構系統的相互操作等方面有著積極的作用。

1.1 分布式信息檢索

在分布式數字資源環境下,為了更好地滿足用戶關于信息系統的資源檢索需求,本研究根據數字資源開發原則為不同領域的數據資源以及不同網絡檢索技術提供數字整合描述,這也是在分布式數字資源中知識發現的重要方式。與此同時,針對數字資源進行有效描述不僅可以將異構數字資源的聯合范圍擴大,從而形成一種有機整體,而且還可以為用戶提供資源整合工具和相互操作機制,以此擴大影響范圍,并進一步提高信息檢索水平。

1.2 異構信息系統間的互操作

與關于資源對象的描述不同,關于資源整合的描述具有顯著的分布式特點,而且層次性特征也十分明顯,描述的對象可以存儲在不同的物理空間,甚至可以存儲在不同的信息系統之中,因此關于這些描述對象的數據存儲結構、存在方式以及檢索模式都是異構的。此外,基于資源對象的動態描述規范還能夠幫助實現異構資源對象的無縫鏈接,從而為整個異構信息系統的相互聯系提供支持。

2 基于語義關聯的海量數字資源整合方法

2.1 海量數字資源采集、描述與整合機制

海量數字資源的來源方式多種多樣,存在的類型也繁多復雜,已經呈現出分布式的特點。針對數字資源的采集方式應該結合自身的分布特點進行,利用合適的數字資源采集工具,并且制定相應的數字資源采集方案。具體來講,可以在數據庫資源中利用轉化和抽取技術以及分檔分析軟件,來提取異構數字資源的特征向量,并進行必要的語義標引[3]。數字資源的采集方式可以按照由近到遠的方式,也就是首先采集日期較近的數字資源,然后對日期較晚的數字資源采用回溯的方式,從而保證較新的數字資源優先被采集和整理。當然,在具體描述數字資源之前,還要根據元數據模塊進行語義描述,從而讓異構的數字資源更容易被計算機識別。在語義整合階段,還可以利用已經存在的先驗數字資源進行語義分類處理,接著分析數字資源的內容差異和語義相似度,然后將較為相似的數字資源整合為一個整體;或者參照基于領域本體的映射關系進行數字資源重組,進一步揭示數字資源的內在語義關聯,從而將隱藏的知識資源進行深度整合。

2.2 以引證與概念為基礎的知識整合方式

引證關系反映出數字資源的流通情況,而且是一種單向流通。通過引證關系可以挖掘出數字資源的語義關聯性,比較常用的方法主要以引證耦合以及引證路徑為基礎構建通用模型,從而實現關于數字資源的語義分級和整理處理[4]。如果數字資源之間存在直接的引證關系,就可以直接在引證聯系網中搜索相似的數字資源,并進行多維度分析和評估。如果數字資源之間存在間接的引證關系,就需要利用分析引證方法來分析關聯的強度,進一步確定數字資源之間的關聯性,為資源的深度整合提供支持。此外,還可以利用數字資源的概念聯系進行資源整合,可以借助語義表達方式的不同來區分數字資源,利用不同的語義單元探討其關聯性;還能夠根據不同類型的數字資源關系和映射方式,并結合用戶的資源需求特征,利用語義關聯和概念關系來挖掘數字資源中的內在規律性。針對知識組織系統,可以根據知識粒度來分析語義關聯,并在應用過程中挖掘不同知識粒度的語義關聯性,從而得到在不同知識粒度條件下的知識整合效果。

3 高校圖書情報檔案資源整合的前提

3.1 高校圖書情報檔案知識資源的數字化存貯

一體化方式的知識組織、知識編碼以及知識挖掘的主要對象不僅包括了在線網絡信息,而且還包括數字化圖書、檔案和情報信息等[5]。數字資源的來源主要分為兩個部分,其一為文檔文獻形式的數字資源,該類型在整個資源中占有的比例較大;其二為視聽形式的數字資源。比如文檔文獻形式的數字資源主要包括以檔案、情報以及圖書數字化形式進行存儲,還包括經過數字化存儲的紙質文獻。基于文獻文檔的數字化存儲方式主要有兩種方式:第一種為構建基于圖像的存儲方式,第二種為構建基于文本的存儲方式。值得注意的是,第一種存儲方式占用的物理空間較大,成本較高,不利于長遠的存儲規劃;第二種存儲方式需要人工進行數字化,也就是將文獻的資料,主要是圖像、文字以及數據表格等以Word、PDF、TXT或者GIF格式進行存儲。如果需要數字化的圖像、文字或者數據無法用人工輸入的方式完成,就可以利用復制或者掃描的方式將數字資源進行存儲;如果需要處理視聽類數字化資源,就需要利用相關設備和技術進行轉錄、降噪以及壓縮處理,并最終實現以MP3和AIV等格式進行存儲。

3.2 高校圖書情報檔案工作流程的革新化改造

一體化過程本身就是一種科技創新活動,是將圖書類、檔案類以及情報類資源進行結構調整和整合處理,而且要求這些工作流程與創新機制相一致。高校工作業務再造思想是進行一體化科學充足的重要參考依據,也就是強調整體性工作與業務分工的相互連接,減少多余重復的構建過程,重視基于決策的業務建設,從而實現從職能管理到業務流程管理的轉變,堅持效能最優以及性能最強的宗旨,進一步保證每個工作環節的增值最大化[6]。根據上述的高校工作業務員再造思想倡導的宗旨,并結合一體化結構組織原則,設計了一體化業務流程圖,如圖1所示。

3.3 高校組織之間基于協議的知識聯盟

知識聯盟主要指社會各界的組織機構以及單位系統為了更好地分享知識資源,加快知識交流以及實現知識創新,而利用各種協議和契約鏈接為一個團體,從而達到知識優勢互補的目的。高校的知識聯盟的主要鏈接方式為知識共享協議或者知識交換契約。通過知識聯盟渠道,一體化機構可以直接從外界的高校知識環境中交換獲得本校所需的文獻資源,比如圖書資料、檔案資料以及情報資料等,從而更好地充實本校的知識體系。一體化機構還可以利用知識聯盟的知識集約性,改進機構的知識吸收能力,加強資源結構調整能力以及追蹤能力等,從而為知識整合提供便利條件。

4 基于語義關聯的圖書情報檔案數字資源整合模式

若要實現基于語義關聯的圖書、檔案以及情報等數字資源的整合,必須要處理好數據共享問題以及知識互操作問題等。為了保證向用戶提供一個統一、高效的知識發現機制,筆者嘗試將OAI-PMH協議應用到以圖書、檔案以及情報等數字資源為主要內容的系統中,并將數字資源中的元數據進行集成,從而構建一個基于語義關聯并且為用戶提供統一、高效的知識服務整合模式[7]。具體來講,本研究將語義關聯的應用程序接口定義為HTTP格式,經過格式擴展后還能以Slash或者Hash格式轉發。利用語義關聯技術可以針對數字資源訪問模式進行統一的標準化,也就是用戶或者代理機構無需了解語義關聯發布網站的運行模式、體系架構以及存儲方式等內容,只需利用SPARQL技術根據Web服務器的IP地址進行訪問即可。需要注意的是,基于圖書、檔案以及情報等資源的元數據存在兩個方面的問題:(1)OAI-PMH協議只為用戶提供基于Identifier等參數規定范圍的收集服務,目前還不允許用戶自行設定收集參數,比如用戶不能按照作者或者資料語種收集,但這恰好是用戶所熟悉的收集方式。(2)在基于OAI的數據庫中,每個元數據條目都有唯一的標識符,但是這個標識符并不能直接被HTTP識別,因而無法利用元數據條目直接收集數字資源。

因此,如果要利用語義關聯技術實現關于圖書、情報以及檔案等數字資源的整合,首先要針對OAI-PMH元數據進行語義關聯處理,也就是將OAI的數據庫的元數據轉化為具有語義關聯性,從而幫助解決用戶在收集元數據時遇到的技術障礙。

4.1 OAI-PMH元數據的語義關聯化

如果要實現基于OAI-PMH元數據的語義關聯性處理,就需要參照語義關聯的原則進行,以此來確定關于URL的分配方式、關聯規則以及相應的關聯信息生成方案等。接著根據OAI的存儲特點利用基于URL收集技術來收集元數據,并把收集結果存儲在本地的元數據庫中,然后借助D2R等工具根據收集結果生成相應的映射文件,從而讓存儲在本地元數據庫中的數據具有語義關聯性。根據上述的原理,圖書、情報以及檔案等資源都可以將OAI-PMH類型元數據轉化為具有語義關聯性,然后利用URL就可以直接訪問元數據資源,當然用戶還可以參照SPARQL協議設定數據查詢條件,從而實現針對元數據的有效檢索。值得注意的是,一定要針對圖書、情報以及檔案等資源構建專門的OAI數據庫,資源需要按照元數據的標準統一進行存儲,只有這樣才能夠真正實現關于圖書、情報以及檔案等資源的語義關聯處理。

4.2 基于語義關聯的圖書情報檔案數字資源整合模式

在關聯開放數據項目的推進下,現在已經有超過140億的傳統數據轉換為具有語義關聯的數據。語義關聯技術讓圖書、情報以及檔案等數字資源的相互交流和共享更加便利。現階段,大部分的政府機構和組織機構已經認識到數字資源整合的重要性,并有意識地利用語義關聯技術來實現數字資源整合的目的。當然,圖書、情報以及檔案等資源需要將資源之間的語義關聯性數據存儲起來,因此數據存儲服務機構(比如云端服務提供商)將在數字資源整合服務占有更加重要的地位。

隨著圖書、情報以及檔案等數字資源的數據量不斷增長,急需針對這些數字資源進行整合,而利用語義關聯技術以及相應的Web應用框架機制,并通過URL將不同類型數據資源進行語義關聯,筆者根據用戶和系統功能需要嘗試設計一種基于語義關聯的圖書、情報以及檔案等數字資源整合模式,具體如圖2所示。

從圖2中不難看出,基于語義關聯的圖書、情報以及檔案等數字資源的整合模式主要分為數據應用層、數據關聯層以及數據發布層等。具體來講,數據應用層的服務對象為SPARQL以及語義關聯等相似的網絡應用。例如國外數字圖書館已經嘗試開發資源的語義檢索服務,該服務可以根據檢索詞關聯到更多的信息,如關聯出題名、摘要以及作者等信息,從而為用戶提供更有價值的檢索信息;數據關聯層的服務對象為圖書、情報以及檔案等數字資源內部存在關聯性,比如一個作者可以有多部著作,一部電影可以有多個制作人等,可以利用RDF技術將這些聯系進行關聯,形成一個關聯數據網絡,不同的資源利用關聯數據進行鏈接;數據發布層的服務對象為圖書、情報以及檔案等數字資源,主要以圖像、音頻、視頻以及檔案類資源為代表,設計人員可以將這些數據按照語義關聯的原則進行處理并上傳到網絡中,從而讓用戶可以方便地進行學習和交流。需要注意的是,與傳統的圖書、情報以及檔案等數字資源不同,在基于語義關聯的整合模式下的資源都是按照語義關聯原則進行描述的。

5 結語

筆者嘗試利用語義關聯技術來處理圖書、情報以及檔案等數字資源,借助于語義關聯的鏈接性針對數字資源進行有效的組織和整合,還能夠進行數字資源的深層聯系挖掘和展示,并在互聯網平臺上為用戶提供統一、高效的數字資源整合服務。如今人們對于信息的需求愈加強烈,借助于先進的信息處理技術進行數字資源整合符合其發展要求,而語義關聯技術則為數字資源整合起到了非常重要的推動作用。

[1]丁楠,潘有能.基于關聯數據的圖書館信息聚合研究[J].圖書與情報,2011(6):50-53.

[2]李琳.關聯數據在圖書館界的應用與挑戰[J].圖書與情報,2011(4):58-61.

[3]劉瑜.當代圖書館信息資源整合的若干模式[J].圖書館雜志,2010(3):8-41.

[4]樓白宇.公共圖書館圖書檔案情報一體化數字網站的實踐效應[J].蘭臺世界,2013(4):99-100.

[5]賀德方,曾建勛.基于語義的館藏資源深度聚合研究[J].中國圖書館學報,2012(7):79-86.

[6]肖希明,田蓉.國外公共數字文化資源整合的現狀與發展趨勢[J].國家圖書館學刊,2014(5):48-56.

[7]徐翠艷.網絡環境下圖書、情報、檔案一體化建設研究[D].鄭州:鄭州大學,2013.

譚 靜 女,1978年生。學士,館員。研究方向:高校圖書情報、檔案管理。

G250.73

2016-09-29;責編:姚雪梅。)

*本文系2014年天津市教育委員會高等學校人文社會科學研究項目“高校圖書、情報、檔案一體化管理模式研究”(項目編號:20142155)成果。

猜你喜歡
關聯語義資源
基礎教育資源展示
“苦”的關聯
當代陜西(2021年17期)2021-11-06 03:21:36
一樣的資源,不一樣的收獲
語言與語義
資源回收
奇趣搭配
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
智趣
讀者(2017年5期)2017-02-15 18:04:18
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
主站蜘蛛池模板: 国产欧美自拍视频| 凹凸国产熟女精品视频| 日本黄色不卡视频| 高清亚洲欧美在线看| 国产白浆视频| 九色视频在线免费观看| 亚洲最大综合网| 亚洲资源站av无码网址| av一区二区三区高清久久| 国产精品刺激对白在线| 国产91视频观看| 熟女日韩精品2区| 欧美 亚洲 日韩 国产| 欧美精品亚洲日韩a| 高清免费毛片| 国产爽爽视频| 欧美另类视频一区二区三区| 99er这里只有精品| 国产日产欧美精品| 一级毛片在线免费视频| 久久青草视频| 2019国产在线| 99无码熟妇丰满人妻啪啪| 国产va免费精品| 国产成人精品综合| 亚洲欧美一区在线| 999在线免费视频| 久草中文网| 国产成人麻豆精品| 美女被操91视频| 久久综合激情网| 色婷婷视频在线| 67194在线午夜亚洲| 国产永久免费视频m3u8| 日本黄网在线观看| 无码av免费不卡在线观看| 国产成人1024精品| 欧洲亚洲欧美国产日本高清| 天天色综网| 国产福利小视频在线播放观看| 老司机精品久久| 一区二区在线视频免费观看| 四虎精品黑人视频| 毛片网站在线看| 欧美在线观看不卡| 国产主播一区二区三区| 国产精品蜜臀| 日本不卡视频在线| 欧美a级完整在线观看| 亚洲色精品国产一区二区三区| 九九热在线视频| 少妇极品熟妇人妻专区视频| 亚洲国产精品日韩专区AV| 日本午夜在线视频| 色婷婷电影网| 亚洲成人黄色在线观看| 亚洲精品波多野结衣| 看av免费毛片手机播放| 久久夜夜视频| 一本大道无码日韩精品影视| 欧美区一区二区三| 国产小视频网站| 波多野结衣久久高清免费| 国产91av在线| 四虎精品国产AV二区| 欧美翘臀一区二区三区| 久久精品午夜视频| 欧美一区二区三区欧美日韩亚洲| 欧洲精品视频在线观看| 在线a视频免费观看| 日本人又色又爽的视频| 最新国产高清在线| 欧美成人精品在线| 欧美日韩导航| 欧美α片免费观看| 久久精品人人做人人爽电影蜜月 | 久久亚洲精少妇毛片午夜无码| 五月婷婷亚洲综合| 香蕉eeww99国产在线观看| 色综合五月| 无码有码中文字幕| 91亚洲精品国产自在现线|