馬 燦(浙江工業職業技術學院 浙江紹興 312000)
?
基于信息聚合技術的高校圖書館館藏資源優化分析*
馬 燦
(浙江工業職業技術學院 浙江紹興 312000)
〔摘 要〕針對我國高校圖書館館藏資源的個性化服務難題,文章指出提高我國高校圖書館館藏資源利用率的優化策略。結合元數據方式和語義方式對其進行信息聚合,使其更加優化,并對優化前后的使用狀況,采用抽樣調查的方法獲取200份調查問卷,通過對問卷的數據進行數據分析研究,其結果為優化我國高校圖書館館藏資源提供了充分的科學依據。
〔關鍵詞〕高校圖書館 館藏資源 元數據 語義 信息聚合 優化
〔引用本文格式〕馬燦.基于信息聚合技術的高校圖書館館藏資源優化分析[J].圖書館,2016(6):50-53
·專題研究·
高校館藏資源,就是高校圖書館所收藏的所有資源,是圖書館存在和提供信息資源服務的基礎,是一個動態發展的有機體,是各學科師生獲取知識信息資源的重要途徑,是高校各學科建設與發展的重要文獻支柱,也是間接衡量一所高校整體綜合實力和辦學水平的重要標志。隨著網絡信息技術和數字化技術的快速發展,高校圖書館的館藏資源越來越豐富,尤其是數字化資源,包括自建資源數據庫、外購資源數據庫和網絡資源等多種資源,其資源覆蓋面包括工學、力學、經濟學、管理學、法學、文學、藝術學、歷史學、農學等多種學科[1-3]。面對如此巨大的數據信息量,如何提高館藏資源的利用率成為一大難題。
文章借助元數據方法和語義方法對高校館藏資源進行聚合,并對其進行優化分析,形成一個統一的元數據標準下的數據源,并為高校師生提供統一的檢索服務。另外,采用問卷調查的方式就聚合優化前后的館藏資源使用情況對浙江省杭州市四所高校(浙江大學、浙江工業大學、杭州電子科技大學和浙江工業職業技術學院)200名在校師生進行問卷調查,發現聚合優化后館藏資源利用率遠遠高于優化前的利用率。
對館藏資源的優化是通過元數據和語義聚合技術來實現的,這種聚合是通過對各類館藏信息資源的內容特征來進行分析、選擇、標引和處理等過程,從學科、分類、主體和著作等多個維度對館藏資源進行融合、匯聚和重組,最終形成有序化的館藏資源集合,充分顯示出各類知識間的關聯性[4],以達到高校圖書館實現個性化知識推送的服務目的,真正使其從只能提供文獻需求和一般性信息需求的物理館藏到提供知識服務的數字化館藏,也真正提高了高校圖書館館藏資源的利用率,且優化前后的資源服務理念有著很大的差異,如圖1所示。

圖1 館藏資源優化前后的服務理念
相關研究表明,館藏資源聚合是對館藏數據、信息、知識的重新整理調配和優化組合,而且這種整理調配和優化組合的過程是由簡到繁、由淺到深的逐步細化和深化的過程。具體可以分為四個層面[4]:針對館藏實體文獻的整理;針對館藏數據的集成;針對館藏信息的整合;針對館藏知識的聚合。顯然,這四個層面是從館藏資源的傳統聚合到深度聚合的過程,是以可視化方法客觀地呈現文獻資源的聚合結果,最終實現個性化知識推送的服務目的,提高館藏資源的利用率。該四個層面間的邏輯關系如圖2所示。

圖2 館藏資源四個層面間的邏輯關系
2.1館藏實體文獻的整理
首先采用傳統的聚合模式,基于文獻編目和元數據等方式針對館藏資源的結構類型展開的資源聚合,實現了對館藏資源的內容特征和外部特征在形式語法上的聚合,但這種聚合程度不夠深入,還需要進一步聚合優化,才能真正的滿足用戶的需求,實現個性化知識推送的服務目的[5, 6]。針對館藏實體文獻的整理主要由兩大步驟組成,第一個步驟是基于文獻編目的文獻整理聚合,第二個步驟是基于元數據的聚合,通過這兩個步驟可以實現館藏實體文獻的聚合整理,實施流程如圖3所示。

圖3 館藏實體文獻聚合整理的實施流程
2.1.1基于文獻編目的文獻整理聚合
基于文獻編目的文獻整理聚合,是按照一定的著錄格式和規則對傳統印本的實體文獻進行整序,它多是停留在用手工整理的紙質形式上,并且,它只是體現出文獻的內容、形式等特征,提供文獻的檢索途徑和方法,為文獻的管理工作提供依據;也就是說,它只是滿足了用戶館藏資源的收藏、整理和檢索等方面的需要[7]。
2.1.2基于元數據的聚合
基于元數據的聚合,是將館藏資源的屬(主要為館藏文獻資源的MARC數據和館藏數字資源的DC元數據)性作為描述對象,通過對描述性、結構性和非結構性的元數據進行集成加工,使其以描述館藏資源主體和內容的形式作為館藏資源聚合的基礎保存下來;換句話說,它是借助靈活的著錄格式來標引和表述數字化館藏資源的內容及形式特征,從而起到優化館藏資源的作用,達到提高用戶獲取和使用館藏數字化資源利用率的目的[8-10]。
目前,我國對于元數據館藏資源的聚合研究主要集中在元數據的描述和存儲兩個方面。在元數據的描述方面,很多研究學者認為DC元數據是將大型館藏文獻數字化項目中的數字化對象元數據作為標準,通過對其來源、時間、主題和關系等多元素的描述、整理和控制,再對其添加貢獻結構和權限管理等元素,充分體現出館藏數字化信息資源之間的層次關系和衍生關系,提高了館藏資源信息檢索的效率,也為館藏數字化資源的深度聚合奠定了堅實的基礎。在元數據的存儲方面,有研究學者認為是將圖書館現有的、外購的及通過互聯網搜索引擎而來的各類數據資源整合在基于DC元數據存儲的一站式檢索系統;也有研究學者認為是借助主動數據的收割方式來收集包含館藏資源、OAIPMH的開放資源和網頁資源等在內的元數據,再將其按照統一格式來進行轉換并存儲到同一個數據資源庫中,同時,對該數據資源庫中的所有數據進行多維度的分析,構建出一個標準的元數據格式,由此來實現統一的檢索服務。
2.2館藏數據信息的聚合整理
館藏資源內容上的語義聚合是通過對館藏資源知識組織分析來深度挖掘知識關聯,最終實現從多維度來對館藏資源中的顯性知識和隱性知識進行分析,借助詞匯概念、概念關系和引證關系來達到知識融合與個性化知識推送的服務目的[11-13]。目前,我國基于語義的館藏資源的深度聚合研究主要是從技術驅動和服務驅動兩個方面進行,并通過基于本體、關聯數據、主題模型和計量分析復合模式的形式來實現的[14,15]。
技術驅動是借助語義網格和Super-peer技術等來構建館藏資源的深度聚合模型,它可以從抽取信息、標注語義、構建知識庫、建立用戶模型、檢索語義和本體間的構建、映射與整合的維度來構建一個相對應的三維模型,該模型包含了對館藏資源本體的開發、信息表示、元信息和元數據等內容,最終實現了異構資源在統一的語義層次上的知識資源智能檢索和利用。
服務驅動是通過建立對館藏資源間各種語義間關聯的資源進行描述并建立描述模型,并從可視化的角度開展基于語義的館藏資源聚合服務,包括面向資源主題和科研決策的聚合服務。
針對館藏數據信息的聚合整理主要由四個步驟組成,第一個步驟是從語義和知識層面的聚合,第二個步驟是采用關聯性元數據的聚合,第三個步驟是從圖形圖像和文本知識方面實現聚合,第四個步驟是采用計量分析學對語義關系進行聚合,通過上述步驟可以實現館藏數據信息的聚合整理,實施流程如圖4所示。

圖4 館藏數據信息的聚合整理的實施流程
2.2.1語義和知識層面的聚合
目前,國內基于本體的館藏資源深度聚合主要是通過各種各樣的本體知識庫的建立,將把所有知識進行核實的知識表示和知識組織,并準確的從語義和知識層面來描述抽象的知識內容,由此實現資源的深度聚合。很多學者也對此模型的具體構建紛紛提出自己的見解,比如,從理論整合層面、應用擴展層面和知識檢索層面的本體構建模型,從基于關系數據模式來自動建立局部本體及每個本體間的映射方法等[16]。
2.2.2關聯性元數據的聚合
關聯數據是元數據在網絡信息空間中表達語義和功能實現的最好方式,基于關聯數據的聚合模式更加靈活、更好實現,用戶只需要關心自己所需要的信息本身就好,圖書館的信息系統會通過關聯數據功能將館內外數據資源自動整合在一起,并提取出用戶所需的信息,在這個過程中會涉及用戶交互、資源整合及隱私保護等方面內容。
2.2.3圖像和文本方式的聚合
基于主題模型的深度聚合模式主要是從圖形圖像和文本知識兩個方面來進行的。其中,圖形圖像的主題模型是將搜索引擎獲得的圖片表示為文檔模型,并借助主題模型進入低維度的語義空間進行聚合,達到對圖像信息的優化聚合。文本知識的主題模型是利用LDA主題模型或Topic Author概率主題模型對館藏資源知識進行發掘、發現和分析,通過文本信息和作者信息的聯合模型來對文本知識進行聚合[17]。
2.2.4基于計量分析復合模式的語義關系聚合
基于計量分析復合模式的深度聚合模式是將計量學分析中的語義關系直接用語義網中的語言進行替換,最終形成描述館藏資源元數據的一個關系網絡,該模型也能夠通過基于主題的語義標引來達到通過主題對館藏數字化資源的多維度聚合的目的。該模型能夠有效避免本體的不能重復使用問題及元數據對語義關系揭示相對較淺等問題,能夠更好地實現館藏資源個性化知識推送的服務目的,更好地提高館藏資源的利用率[18, 19]。
綜合以上的館藏資源優化策略,以江蘇大學圖書館為例,對截至2015年上半年圖書館內的館藏資源進行優化分析,所需的資源數據均通過江蘇大學的聯機公共查詢目錄系統(OPAC)進行查詢獲得,針對分析結果采用調查分析方法對200名師生(其中,老師10名,博士研究生20名,碩士研究生26名,本科生105名,專科生39名)做了詳細的隨機調查問卷,問卷實行百分制,60分以下表示不滿意,60-80分之間表示一般,80-90分之間表示滿意,90分以上表示非常滿意,該問卷所涉及內容與評分結果如表1所示(因涉及問卷較多,評分結果為平均結果,且四舍五入只保留整數)[20, 21],為了進一步考查優化策略達到的效果,分別對比了優化前,經過傳統優化后,也即第一步驟優化以及經過傳統和深度兩步驟優化的評分結果,具體結果如表1所示。

表1 調查問卷內容及評分結果
經過對表1的調查問卷結果分析可知,聚合優化后對高校圖書館館藏資源各方面的滿意度明顯優于優化前,且經過兩步驟深度優化后的滿意度明顯高于傳統優化后;另外,隨著優化程度的加深,不僅僅是數字化館藏資源的滿意度大大提高,而且紙質版館藏資源的滿意度也在提升。也就是說,我國高校圖書館館藏資源在紙質資源和數字化資源方面的內容都在快速的被豐富,滿足了高校師生對館藏資源的各種需求,為高校各學科的創新教育提供了良好的文獻資源保障[22, 23]。
通過對館藏實體文獻的聚合整理和館藏數據信息的聚合整理,實現對我國高校館藏資源的優化,結合筆者所做的實地調查分析可以看出,館藏資源的不斷優化發展,使高校圖書館的館藏資源由“以圖書館為中心的文獻服務”快速轉變為“以用戶為中心的知識服務”。在信息化時代,高校圖書館館藏資源急劇增多,深度聚合的館藏資源能夠更好地實現我國高校圖書館館藏資源進行個性化知識推送的服務目的,并提高我國高校圖書館館藏資源的利用率,為高校實現各學科的創新教育提供了文獻資源保障。
(來稿時間:2016年2月)
參考文獻:
1.黃文碧. 基于元數據關聯的館藏資源聚合研究[J]. 情報理論與實踐,2015(4):74-79
2.呂紅,邱均平,李小濤,等. 國內館藏資源可視化研究進展分析[J]. 情報資料工作,2014(1):20-26
3.王慶雯,孫丹霞.高校圖書館學科建設中的館藏資源配置[J]. 圖書館雜志,2015(5):66-69
4.趙蓉英,王嵩,董克.國內館藏資源聚合模式研究綜述[J]. 圖書情報工作,2014(18):138-143
5.高惠榮,孫曉玫. 元數據及其在數字圖書館發展中的作用[J]. 圖書情報工作,2012(S1):170-172
6.高靜萍,徐萍,何靜. 高校圖書館館藏資源建設存在問題分析[J]. 新世紀圖書館,2013(3):50-53
7.毛燕梅,張秋萍,李麗華.網絡資源的組織與DC元數據[J]. 情報雜志,2002(1):27-28
8.成全,許爽,鐘晶晶.館藏資源元數據語義描述及關聯網絡構建模型研究[J].情報理論與實踐,2015(4):124-129
9.張宏偉,許慧. 基于DC元數據倉儲的數字資源整合研究[J]. 圖書館學刊,2014(6):32-34
10.徐榮華. 基于元數據倉儲的資源整合應用[J]. 圖書館雜志,2012(4):67-73
11.李勁,程秀峰,宋紅文, 等. 基于語義的館藏資源深度聚合模型探析[J]. 湖北民族學院學報(自然科學版),2013 (2):212-215
12.沈秀麗,牟冬梅. 數字圖書館知識組織語義互聯論綱[J]. 情報科學,2010(3):379-383, 429
13.賀德方,曾建勛. 基于語義的館藏資源深度聚合研究[J]. 中國圖書館學報,2012(4):79-87
14.成蔭. 高校檔案館館藏資源開發利用創新研究[J]. 蘭臺世界,2015(2):51-52
15.何超,張玉峰. 基于本體的館藏數字資源語義聚合與可視化研究[J]. 情報理論與實踐,2013(10):73-76, 39
16.丁楠,潘有能. 基于關聯數據的圖書館信息聚合研究[J]. 圖書與情報,2011(6):50-53
17.王濤. 基于關聯數據的館藏信息資源聚合研究[J]. 圖書館學刊,2012(8):44-46
18.王薇. 基于關聯數據的圖書館數字資源語義融合研究[D].南京:南京大學碩士論文,2013
19.杜志銀,趙曦,肖婷超, 等. 館藏資源鏈接與高校圖書館信息服務研究[J]. 現代情報,2010(3):64-66
20.劉桂賓. 館藏資源建設與圖書館服務質量定量評價——以南開大學數學科學學院為例[J]. 圖書館工作與研究,2015 (1):67-71
21.高麗,王良超. 大學圖書館特色館藏資源建設研究——以西南石油大學圖書館為例[J]. 四川圖書館學報,2012 (3):32-35
22.陳麗娟. 基于創新教育的高校圖書館館藏資源建設研究[J]. 教育與職業,2012(9):191-192
23.陳磊,陳惠蘭,詹司佳, 等. 學科競爭力視角下的館藏資源建設探析——基于Scival跨學科科研評價工具[J]. 圖書館,2015(5):83-86
Analysis of Collection Resources Optimization ofUniversity Library Based on InformationAggregation
Ma Can
( Zhejiang Industry Polytechnic College )
〔Abstract 〕For personalized service problem of university library collection resources in China, this paper studies to improve the utilization ratio of university library collection resources optimization strategy in China at present. With its information aggregation of metadata and semantic mode, and making it more optimized. 200 questionnaires were obtained from sample survey of working condition before and after optimization, and analysis was based on the data of the questionnaire. The results indicate that utilization ratio of university library collection resources is much higher than before,and the aim of push of personalized knowledge is achieved, resulting in rising of library resources utilization ratio, and the results provide the scientifc and technical basis for improvement of the library collection resources optimization in China.
〔Keyw ords 〕University library Library resources Metadata Semantics Information aggregation Optimization
〔分類號〕G258.6;TP311.13
* 本文系國家社科基金項目“用戶信息素養教育與信息消費能力長效互動機制研究”(項目編號:13XTQ002)研究成果。
〔作者簡介〕馬燦(1974-),女,館員,發表核心文章10余篇,研究方向:數字化信息服務。