999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

三種發現服務系統的比較研究

2012-03-14 07:09:06秦鴻錢國富鐘遠薪
大學圖書館學報 2012年5期
關鍵詞:數據庫圖書館資源

□秦鴻 錢國富 鐘遠薪

1 數字資源整合的發展

隨著數字圖書館的蓬勃發展,全球范圍內的數字資源激增,資源的種類和內容日益豐富,普通的學術圖書館引進幾十個數字資源系統已非罕見,然而,不同的數字資源系統因其不同的系統結構、信息內容、呈現界面與使用方式,形成一個個“信息孤島”,給用戶檢索帶來困擾。因此,近年來,圖書館界一直在尋求一種數字資源的整合之道,為用戶提供一個實現各類學術資源發現與獲取的一站式解決方案,以提升用戶利用資源的有效性與友好性。

所謂數字資源整合,是指依據一定的需要和要求,通過中間技術(數字資源無縫鏈接整合軟件系統),將不同來源和不同通信協議的信息完全融合,使不同類型、不同格式的數字資源實現無縫鏈接。通過整合的數字資源系統,具有集成檢索功能,是一種跨平臺、跨數據庫、跨內容的新型數字資源體系[1]。常見的數字資源整合形式有:

(1)基于OPAC系統的數字資源整合,是以紙質資源為基礎整合數字資源,只是目錄級別的整合;

(2)基于資源導航系統的數字資源整合,以數據庫導航系統和電子期刊導航系統為代表,只是形式上的整合,沒有深入到內容層面;

(3)基于鏈接服務器的數字資源整合,以開放鏈接服務系統SFX為代表,通過Open URL框架實現數據庫之間的無縫鏈接,主要解決檢索結果到全文的鏈接問題,揭示至篇對篇的層級,沒有檢索平臺,且只適用于發展比較規范的國外數據庫;

(4)基于跨庫檢索系統的數字資源整合,也稱聯邦檢索,以 MetaLib、ResearchPro、MUSE、Swets-Wise等為代表,是將一個檢索請求同時轉換并發送到多個異構的數據庫,將檢索結果進行歸并和統一展示的整合系統。聯邦檢索解決了數字資源一站式檢索的問題,然而在檢索速度、檢索結果的去重和排序等方面存在難以克服的缺陷,且只能整合本館資源。

2 發現服務系統

鑒于以上整合系統的種種不足,新的整合方式應運而生,基于元數據預索引的網絡級發現服務系統即是其中的佼佼者。

發現服務系統是通過對海量的來自異構資源的元數據和部分對象數據通過抽取、映射、收割、導入等手段進行預收集,并通過歸并映射到一個標準的表達式進行預聚合,形成統一的元數據索引,通過單一但功能強大的搜索引擎向終端用戶提供基于本地分布或者遠程中心平臺的統一檢索和服務的系統[2]。

它內建海量數據的元數據倉,整合各種圖書館資源,包括內部的、外部的、紙質的、電子的、自有的、許可的以及可自由獲取的數據源,使用統一標引的數據格式,提供簡單、單一的檢索入口,通常是類似Google的一框式搜索,通過檢索預先設定的元數據倉來快速返回結果,通過鏈接解析器鏈接到全文,提供分面和高級檢索功能,在用戶體驗層面全面超越了聯邦檢索。

發現服務系統自2008年面世(World Cat Local)后,發展很快,本文僅就其中廣受注目且在大陸市場比較活躍的三個國外產品進行比較研究,分別是:Serials Solutions的Summon(2009年7月發布)、EBSCO 的 EBSCO Discovery Service(以下簡稱EDS,2010年1月發布)、Exlibris的Primo Central(以下簡稱Primo,2010年6月發布)。

完整的評估框架如表1所示,限于篇幅,本文僅對其中重點的指標進行評測。

表1 發現產品評估框架

3 元數據

3.1 商家自述的元數據指標

集中的元數據倉儲是發現系統的基礎,表2羅列了商家自述的元數據相關指標,僅為階段性數據。三大商家都在快速推進發現服務系統的建設,數據規模不斷擴展。如:Summon增加了對HathiTrust庫的全文檢索功能,可開放獲取HathiTrust約200多萬種電子圖書的全文[3],OCLC和EBSCO通過數據交換增強發現服務[4],國際著名咨詢公司Freedonia的產業研究報告將進入EDS發現系統[5]等。

3.2 元數據指標測評

3.2.1 元數據規模

測試方法:

Summon:提供空檢功能。默認空檢結果是館內資源,可通過分面選擇納入館外資源。使用悉尼大學①悉尼大學圖書館.http://sydney.edu.au/library/的Summon系統進行測試。

EDS:因有IP限制,只能在電子科技大學的EDS測試系統②電子科技大學EBSCOhost平臺.http://search.ebscohost.com中檢測。在高級檢索中使用檢索詞“i*”,限制可在全文中檢(因“is”是文章中最常出現的單詞)。

Primo:不支持空檢,不支持檢索“i*”,使用元數據的記錄類型值”article OR articles”作為檢索詞,大致可以檢索到文章元數據記錄的數量,使用“book”作為檢索詞并限定資源類型為圖書可檢索到圖書元數據的數量。測試系統為清華大學的Primo系統③清華大學 Primo系統.http://discovery.lib.tsinghua.edu.cn/primo_library/libweb/action/search.do?vid=thu。僅做參考。

檢索結果如表3。(注:本文所有測試的檢索時間均為:2012年5月31日)

分析:

(1)Summon的檢索結果有6億多條,離商家所說的9億多條有較大差距,這主要是因為各館自有的OPAC和自建數據庫的元數據并不能被其他館檢索;EDS在不完全檢索的情況下元數據總量達到5.5億,數據規模與Summon可以比肩;Primo文章級的元數據約為2.1億條,其中期刊文章約占60%,報紙文章約占40%。

(2)Summon的元數據中,報紙占的比例很大,約為4.3億,占66%;EDS的新聞類記錄(包含但不限于報紙)有3.3億,占60%,可見其海量倉儲中有相當大一部分是非學術的元數據。Primo的報紙元數據為8430萬條。

(3)按期刊文章來看,Summon有1.5億,EDS有1.4億,Primo有1.2億,差距不大。按同行評議的期刊文章看,Summon有5223萬,EDS有6686萬,Primo有4706萬。按圖書看,Summon有1249萬,EDS有1895萬,Primo有993萬。

(4)即使是像悉尼大學這樣規模的高校,其全文資源也僅占46%,可見學術資源浩如煙海,單獨一館的文獻保障力度總是有限的。在文獻傳遞渠道暢通的前提下,發現系統的“發現”作用可以彰顯。

(5)對中文數據庫的支持方面,Summon、EDS已與維普簽約,但尚未在元數據倉中部署中文期刊元數據。清華大學和山東大學的Primo系統已經裝載了維普元數據,使用“的”字進行檢索,返回的記錄約為2900多萬條。

表2 元數據對比表

表3 元數據測試結果對比表單位:萬條

3.2.2 元數據質量

元數據的質量有兩個層面的含義,一是數據深度,一是數據規范性。數據深度有“薄、厚”之分,所謂“薄”元數據,是指包含字段非常少的元數據,一般只包括“題名、作者、來源、標識”等基本信息。如果包含了主題、摘要等信息,就是典型的“厚”元數據。厚元數據在基于題名、來源、作者等簡單檢索中體現不出優勢,但在數據分析、重組以及重用、數據挖掘等方面呈現出明顯優勢[6]。數據的規范性則決定了結果集是否能較好地進行歸并和去重。

因發現系統的元數據來源復雜,數據量巨大,對其質量做全面評估是非常困難的。我們試圖從三個途徑進行評測:一是我校(電子科技大學)主流數據庫的期刊文章;二是我校一流學者的學術成果;三是OA資源。觀察三個指標,資源覆蓋度、元數據質量和資源更新速度。因評估過程相對繁雜,本文不予描述。

3.2.3 對本館資源的覆蓋度

資源發現系統首先是一個本館資源的統一檢索系統,然后才是一個更廣泛資源的發現系統。本館資源是用戶真正能夠直接獲取的資源,所以發現系統元數據對本館資源的覆蓋度需要重點考量。

目前國外的發現系統在對中文數據庫的整合方面都有所欠缺,在外文資源方面則可提供對本館資源覆蓋度的比對(數據庫級),針對電子科技大學的外文數字資源,比對結果大致如下(未經驗證):

電子期刊:對主流的期刊數據庫能夠很好覆蓋,如:ScienceDirect、Springer、Wiley、IEL、T&F等,據Summon提供的期刊級別的比對結果,Summon對我校電子期刊的覆蓋率超過97%;

電子圖書:除Springer外一般需通過上載電子書MARC來實現覆蓋;

索引數據庫:一般不能實現完全覆蓋,如EI、INSPEC、DII、OCLC Firstsearch等。

因數據庫商之間的沖突,目前Proquest的國外學位論文數據庫只有Summon可以覆蓋,而EBSCO的ASP&BSP也只有EDS覆蓋得最全面。

此外,Summon不能覆蓋ASME,Primo不能覆蓋OSA、APS。

4 架構與功能

對比如表4所示。

表4 架構與功能對比表

從部署模式上看,Summon和EDS采用了目前流行的云服務模式,而Primo將元數據倉部署在云端,將本館館藏和自建資源數據部署在本地。云服務模式不占用本地資源,減少維護工作量,是目前軟件即服務(SAAS)發展的大勢所趨,然而,“云+本地”的模式也不無可取之處。首先,可以消除某些圖書館不愿意將自有數據提供給商業公司的顧慮,其次,可將某些中文數據庫的元數據納入本地元數據倉(因放在本地而容易獲得數據庫商的許可),部分解決國外發現產品不支持中文數據庫的問題。如上海交通大學將超星數字圖書的元數據部署在本地,使發現系統增加了對中文電子圖書的支持。

至于發現系統是否應該集成聯邦檢索的問題,不同商家的觀點有所差異。一方面,因為版權和商業利益的原因,單個發現產品很難覆蓋所有數據庫,特別是對中文數據庫的覆蓋度不佳,因此嵌入聯邦檢索有利于集成發現系統不能覆蓋的資源;但另一方面,對于用戶而言,這種嵌入的模式增加了使用的復雜度。因而提升發現系統的數據覆蓋率,使之真正成為一站式的整合檢索系統才是未來的發展方向。

在對本館OPAC的整合方面,Primo憑借其集成系統廠商的優勢,達到更深的整合度,除顯示館藏位置和在架狀況外,還可進行預約、續借、寫評論,加標簽等操作,并集成了個人圖書館的相關功能,目的是真正實現圖書館的一站式服務(取代OPAC)。

特色功能方面,Summon和EDS提供分學科的元數據集,有利于用戶從一開始就定位在本學科范圍內進行檢索,體現了學科化服務的思想。EDS的受控主題詞表是其獨有的特色,使EDS在相關度排序、按主題分面檢索等方面能夠提供更細粒度的更精準的效果。Primo依托其獨有的SFX日志數據形成b X學術推薦服務和熱點文章推薦服務,前者利用數據挖掘分析文獻之間的關聯,將全球其他研究者也關注過的相關論文無縫地推送到讀者面前,彌補了個人依靠檢索詞搜索進行資源發現的不足,后者側重于提供某個主題最近幾個月內的熱門文章,以體現某個領域的研究趨勢,這兩項服務使“搜索”更接近“發現”。

5 檢索與界面

因檢索功能和分面功能可由后臺定制,不同用戶的呈現方式可能有所不同,此處僅以大陸地區的幾個用戶為例進行考察,結果僅供參考。

5.1 簡單檢索與分面

元數據是發現系統的基礎,而檢索功能是發現系統的核心,它決定了資源能否全面、準確地揭示給用戶。表5是三家產品簡單檢索時的分面功能對比。

表5 簡單檢索分面功能對比表

表6 高級檢索功能字段對比表

分析:

(1)三家產品的簡單檢索默認是在所有字段中檢索,但EDS還在簡單檢索中提供了標題和作者的檢索字段。

(2)在時間限定方面,Summon最靈活,有時間滑動條,也可設定查找具體日期的文獻,EDS和Primo都是按起止年篩選,Primo可預設幾個時間段。

(3)Summon提供二次檢索功能,其他產品僅用分面來精減結果。

5.2 高級檢索功能

檢索方式:

(1)Summon(北京大學):一個條件行固定為一種檢索字段,字段之間默認AND關系,如一種字段中有多個檢索詞,需輸入布爾運算符進行連接。

(2)Primo:清華大學的設定與Summon類似;山東大學使用4個條件行(后臺設定行數),默認AND關系,每個條件行的檢索字段可選擇,可設定檢索詞的出現方式是“包含”、“精確”、“前方一致”。

(3)EDS:與EBSCOhost平臺的高級檢索功能一致。用戶可靈活增減檢索條件行,每行用下拉框選擇邏輯關系和檢索字段,如一種字段中有多個檢索詞,可增加檢索行。

總體來看,EDS的高級檢索功能更精細化,其檢索方式更符合不熟悉布爾檢索式的普通讀者的使用習慣。

5.3 相關度排序

從在廣州大學城開展的一項關于發現系統的調研可見,檢索結果的相關度排序被用戶認為是最有用的功能[7]。

(1)SUMMON

動態排名:詞語出現頻率、字段權重、術語詞干、對詞組和智能關鍵詞處理。

靜態排名:文獻類型、出版日期、學術性/同行評論狀態、本地資源、被引用次數。

(2)EDS

同時運用“受控詞匯的主題詞表”以及出版社原始提供的內容(如作者提供的關鍵字、文摘、全文等)進行排序。以主題詞表優先,其優先順序如下:命中專業主題的控制詞表、命中文章題名、命中作者提供的關鍵字、命中文摘提供的關鍵字、命中文章全文中提供的關鍵字。

(3)Primo

申請了相關性排序技術的專利—Scholar Rank-TM,對結果記錄的以下三個方面進行評價,以判斷該記錄的排列順序。

記錄內容跟檢索式的匹配程度。不僅要判斷檢索詞本身的匹配度,也要判斷檢索詞出現的位置(字段)。

記錄的學術價值評分(Scholar Rank評分)。該評分主要依靠b X服務的海量使用統計數據以及論文的被引情況進行計算。

讀者的信息以及讀者實時的研究需求。

Scholar Rank技術還會根據讀者的專業、學歷等信息來判斷檢索結果的相關性,也可以給圖書館本地館藏數據更高的權重。

5.4 用戶界面

Primo提供的頁面結果排序功能最豐富,包括相關性、最新日期、受歡迎度、作者、題名等,其中按“受歡迎程度”排序較有特色;Summon提供相關性排序、最新時間排序和最早時間排序;EDS提供相關性排序、按時間降序和按時間升序排列。

對于OPAC信息,Summon和EDS需要調用OPAC系統的功能與界面,對在線全文鏈接也需要另外打開一個窗口,而Primo在檢索結果界面即可以標簽窗口的形式完成所有附加功能的展示,包括預約、評論/標簽,甚至直接查看電子全文,更好地詮釋了一站式的含義。

6 商務因素

6.1 用戶情況

用戶規模從一個側面反映了軟件的成熟度以及應用發展潛力,三種產品的用戶情況如表7所示。

從用戶規模上看,Summon在國內外的發展勢頭強勁,26%的北美研究型圖書館(ARL)及八所長春藤大學中的五所采購了Summon;而Primo依托其集成管理系統的用戶群也在快速擴張。

6.2 價格因素

資源發現系統面世不久,目前價格比較昂貴,一般采取“實施費+年訂購費”的定價模式,費用計算主要根據圖書館需要配置的資源量、服務對象的規模和圖書館的類型來確定。年訂購費類似于數據庫采購,會給圖書館帶來持續的資金壓力。

表7 用戶情況對比表

三種產品都需要借助鏈接解析系統來鏈接到全文,EDS和Primo還提供聯邦檢索的集成,對于已購買了鏈接解析系統和聯邦檢索系統的圖書館來說,考察發現產品與已有系統的兼容性可以很好地保護前期投資。

6.3 本地支持與定制開發

軟件產品的部署和實施需要密切的溝通與配合,而且三種產品都是國外產品,產品廠商是否能夠提供本地化的技術支持與服務支持也是產品考察中必須重點考慮的問題。

目前三家廠商都在中國設有專業的營銷隊伍,提供本地化的售后服務支持。在技術支持方面,Primo略勝一籌,可進行本地化的項目實施,并針對用戶需求進行個性化定制開發,包括:二維碼、OAI倉儲收割、本地知識庫、數據挖掘服務、學科趨勢分析服務、DeepSearch集成等。已在清華大學開展了數據挖掘和深度分析等實踐。

7 結語

發現服務系統將圖書館的所有資源和館外學術資源納入了統一的架構和單一的索引體系,這種統一的索引結構決定了它在檢索速度、易用性、相關度排序、個性化設定的靈活度、資源獲取的完整性以及系統的穩定性方面超越了所有以往的統一檢索產品。是圖書館學術資源深度整合和便捷獲取的發展方向。

然而作為一個新興事物,發現服務系統目前還存在著價格昂貴、資源覆蓋不足(尤其對中文資源)、自有數據收割困難等問題。隨著發現產品的不斷發展,數據規模將不再是一個主要的瓶頸,功能、架構、服務與價格將會成為比拼的重點,而用戶體驗是最終的決定因素。

針對發現系統的選型,不同的發現產品有不同的優勢,應綜合考慮本館的資源狀況(資源規模、外文資源數量、自建資源數據格式等)、與已有系統的兼容性(集成管理系統、聯邦檢索系統、鏈接服務系統)、性價比等,選擇最適合本館的發現產品和服務。

1 胡新穎.數字資源統一檢索系統現狀分析.情報探索,2010(6):107-109

2 聶華,朱玲.網絡級發現服務——通向深度整合與便捷獲取的路徑.大學圖書館學報,2011(6):5-10

3 Serial Solutions的Summon服務系統增加對HathiTrust庫的全文檢索功能.現代圖書情報技術,2011(4):34-34

4 OCLC和EBSCO通過數據交換增強發現服務.現代圖書情報技術,2011(1):51-51

5 EBSCO Discovery ServiceTMCustomers Gain Access to Industry Insights and Analysis due to agreement with The Freedonia Group,Inc.[2012-05-22].http://www.librarytechnology.org/ltg-displaytext.pl?RC=16828

6 竇天芳,姜愛蓉.資源發現系統功能分析及應用前景.圖書情報工作,2012(7):38-43

7 劉頡頏等.用戶對圖書館資源發現系統功能的期望——基于廣州大學城高校圖書館學生用戶的調研.圖書情報工作,2012(7):27-31

猜你喜歡
數據庫圖書館資源
基礎教育資源展示
一樣的資源,不一樣的收獲
資源回收
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
數據庫
財經(2017年2期)2017-03-10 14:35:35
飛躍圖書館
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 亚洲黄色成人| 亚洲成人播放| 久久国产乱子伦视频无卡顿| 全午夜免费一级毛片| 日韩欧美高清视频| 色婷婷亚洲综合五月| 国产一级精品毛片基地| 欧美区国产区| 国产高清在线观看91精品| 找国产毛片看| 在线欧美一区| 亚洲Va中文字幕久久一区| 无码'专区第一页| 狠狠五月天中文字幕| 亚洲成人网在线观看| 丁香五月婷婷激情基地| 国产精品欧美激情| 国产a v无码专区亚洲av| 国产精品浪潮Av| 亚洲第一视频区| 尤物午夜福利视频| 国产av色站网站| AV无码一区二区三区四区| 好紧好深好大乳无码中文字幕| 亚洲无码熟妇人妻AV在线| 最新亚洲av女人的天堂| 亚洲国产高清精品线久久| 久久久久人妻一区精品色奶水| 亚洲首页在线观看| 最新国产午夜精品视频成人| 亚洲综合中文字幕国产精品欧美| 狠狠亚洲婷婷综合色香| 亚洲三级成人| aⅴ免费在线观看| 国产视频大全| 中国成人在线视频| 久久精品娱乐亚洲领先| 激情午夜婷婷| 国产日韩欧美在线播放| 蝌蚪国产精品视频第一页| 99精品福利视频| 国产三级成人| 99久久国产综合精品女同| 欧美特黄一免在线观看| 亚洲六月丁香六月婷婷蜜芽| 亚洲欧美另类视频| 91国内视频在线观看| 日韩东京热无码人妻| 日韩在线永久免费播放| 日本不卡在线视频| 国产真实乱了在线播放| 99热在线只有精品| 99这里只有精品6| 91无码视频在线观看| 婷婷亚洲最大| 一级毛片在线免费看| 在线不卡免费视频| 无码免费的亚洲视频| 手机在线免费毛片| 在线国产三级| 永久成人无码激情视频免费| 亚洲色成人www在线观看| 波多野结衣一区二区三视频| 凹凸精品免费精品视频| 中美日韩在线网免费毛片视频| 色老二精品视频在线观看| aⅴ免费在线观看| 九色在线视频导航91| 国产剧情国内精品原创| 亚洲成A人V欧美综合天堂| 97色婷婷成人综合在线观看| www.99在线观看| 99精品国产电影| 欧美www在线观看| 国产在线视频欧美亚综合| 一本久道久久综合多人 | 国产精品白浆无码流出在线看| 成人国产一区二区三区| 日韩午夜片| 欧美激情第一欧美在线| 91精品网站| 亚洲精品另类|