陳嘉懿 周鋒 郭晶



[摘要][目的]在協同創新的工作宗旨下,目前的學科信息系統逐步向協同工作性、信息資源的高度集成化、服務的主動性方面發展,圖書館在選擇上遇到了困難,需要有一種合理的分析方法對其進行比較分析。[方法]從協同工作下的信息資源集成化趨勢分析,剖析云環境服務體系架構,以協同性、主動性、集成性、云環境、資源獲取等多角度比對分析現有平臺的特點。[結論]總結出建設面向學科協同創新的信息資源集成與服務系統的特征與趨勢.為未來系統構建提供建設框架與參考。
[關鍵詞]協同創新;云計算;信息資源;學科平臺
DOI:10.3969/j.issn.1008—0821.2017.06.017
[中圖分類號]G250.72 [文獻標識碼]A [文章編號]1008—0821(2017)06—0107—06
2015年,黨的十八屆五中全會通過的“十三五”規劃建議明確提出“提高高校教學水平和創新能力,使若干高校和一批學科達到或接近世界一流水平”,充分體現了黨中央對建設世界一流大學和一流學科的高度重視和堅定決心。高校要充分認識建設世界一流大學和一流學科、加速實現教育現代化的重要性和緊迫性,把全面建成小康社會新的目標要求以及“創新、協調、綠色、開放、共享”的發展理念,落實到建設當中,貫穿到改革當中。圖書館作為重要的文化教育機構和信息資源匯集地,為高校院系部門服務,在學科協同創新與信息資源的管理上也有獨到之處,致力于將原有的被動的知識傳播方式轉化為主動式的與學科融合的資源集成與推送方式。
另一方面,隨著云計算技術與大數據技術的日益進步與發展,對信息資源的集成與揭示也提升到了一個前所未有的高度。由于讀者行為分析判斷、以及海量數據資源的集中式存儲和智能化揭示的需求,信息資源的集成融匯逐漸成為了大勢所趨,由此而涌現出了不少跨學科信息集成融匯的系統平臺,這些平臺各有特點,也存在著不足之處,本文希望從不同平臺的比較中總結出一些應用模式與規律,從而為今后建設面向學科協同創新的信息資源集成與服務的通用框架與規范奠定基礎。
1協同工作下的信息資源集成化趨勢
從信息資源發現系統到學科導航系統,從信息資源管理系統到學科服務系統等這幾年的變遷過程中不難發現,這些系統正在逐步向信息資源的多元化、集成化方向發展,并且呈現出了更加豐富的資源展現方式,不同學科、不同知識領域的信息呈現多元化的交互,并且信息的建設方也開始逐步擺脫傳統單一建設者的模式,有不少平臺像學科服務系統、薦購系統等已經盡可能地將協同建設的工作方式引入進來,大家一起協同工作,使得學科信息自由的來源更加多元化。
在當今知識創新的時代,傳統被動式的信息獲取方式現在日趨被智能化、主動化的信息推送方式所替代,融合涉及各學科領域的多個機構的主動式、個性化和多元化的服務模式已初見端倪。國內外有關機構紛紛開展了以社區服務、推拉式服務、一站式服務為特色的信息資源共享服務理論與方法研究,一些國外著名高校也相繼建立了所謂“自助式”的信息資源共享建設項目,例如美國康奈爾大學圖書館的Mylibrary@comell、北卡羅萊納州立大學圖書館的Mylibrary@NCState以及中國科學院國家科學數字圖書館所推出的“我的數字圖書館”等。同時在這些系統平臺中我們可以看到多種學科信息的資源被集成融匯到了一起,盡可能地一站式的將所有資源都揭示并推送給用戶,使得用戶查找信息資源變得更為方便,無需再通過多個途徑進行查找。
因此,面向協同學習、協同研究的交互式信息資源集成模式無疑已經是當前的應用趨勢,這些系統平臺都普遍呈現出以下一些特征:
1.1協同性
協同性所展現出的一個最大特點就是擁有比較強的交互性。傳統的信息資源門戶網站所呈現的特征是“你給什么我看什么”,用戶往往沒有選擇的權力,只能被動接受網站所提供的內容,即使不滿足口味也無法可施。而新模式下給了用戶交互的權力,用戶可以進行主動式的推薦甚至參與到資源的建設過程中來,這種協同創新的工作模式大大提升了信息資源的豐富程度與針對性。
1.2集成性
在信息大爆炸時代,海量信息資源如何獲取成為了一個新的難題,因此新平臺都呈現了一種“海納百川”的氣概,盡可能多的將相關的學科信息資源都進行集成融匯,通過不同的途徑進行信息資源數據的抽取、分析與集成,最終展現給用戶的就是一個應有盡有的聚寶盆,從資源獲取的方便角度來看這也是一種主流趨勢。
1.3主動性
主動性體現的是信息資源的主動推送,能夠通過數據分析獲取用戶的行為習慣,從而為其推薦其可能感興趣的信息資源。目前一些大型購物網站如亞馬遜、淘寶網等都做了顧客行為分析的研究,根據顧客的購物興趣主動推薦相關產品;而對于學科信息資源網站來說,采用主動性服務的還不多,不過相信也是未來的應用趨勢。
2云環境體系架構
這幾年云計算技術得到了長足的發展,得益于計算機技術與存儲技術的突飛猛進,全球的信息資源數量呈現幾何級數的增長,知識大爆炸的時代已經來臨,各種大數據、海量數據的概念被擺上了桌面,傳統“單機”版模式的系統平臺架構已經無法滿足海量資源的存儲與展示需求,不少系統平臺已經開始架設在云端。
云計算是一種利用互聯網實現隨時隨地、按需、便捷地訪問共享資源池(如計算設施、存儲設備、應用程序等)的計算模式。簡單來說就是利用大量的集群服務器與存儲資源來為某個應用進行服務,因此相比傳統的軟件部署應用具備顯著的應用優勢:
1)服務方式更加彈性化:由于云端資源的劃分相對較容易,因此服務的規模可快速伸縮,以自動適應業務負載的動態變化。這樣用戶使用的資源同業務的需求相一致,避免了因為服務器性能過載或冗余而導致的服務質量下降或資源浪費。
2)計算性能與存儲性能更強:一些大型的系統平臺之后往往有著成千上萬臺服務器與存儲資源的支撐,這種規模不是單機服務模式的運算資源所能匹敵的,因此計算性能與存儲性能呈幾何級數增長,更適用于海量信息資源的集成融匯。
3)集中式管理,用戶部署簡化:云環境是以服務的形式為用戶提供應用程序、數據存儲、基礎設施等資源,并可以根據用戶需求,自動分配資源,而不需要系統管理員干預;而對用戶來說只接觸前端界面,只要考慮應用即可,無需再去進行繁瑣的軟硬件配置,部署應用變得非常方便。
4)泛在化接入:由于信息架設在云端,用戶可以使用各種終端設備(如PC電腦、智能手機、平板等)隨時隨地通過互聯網訪問云環境,獲取想要的數據信息資源。
正是因為云環境擁有如此巨大的應用優勢,因此利用云環境來搭建基于云的信息資源集成系統無疑是最合適的,一方面海量的信息資源能利用云環境的計算能力與存儲能力進行快速匯聚與查詢;另一方面部署應用與協同工作也會變得非常簡單,只需要制定好應用模式,環境的部署與前端應用的協同操作將會變得前所未有的容易。
如圖1(原創)所示,本文勾畫出在云環境下,信息資源集成系統的架構圖。
1)服務器、存儲層。這一層是底層硬件,包含網絡/計算機集群與大規模存儲設備,通過虛擬化技術,實現對底層硬件資源的一體化管理與操作。
2)數據資源層。在信息資源集成平臺上,存儲著海量的信息元與數據,在這一層會對這些信息資源進行聚合化處理,可用于后續的分類、查詢與檢索操作;同時通過從前端扶取到的日志文件、信息文件中獲得的用戶信息進行分析處理,獲知用戶的偏好信息、情景信息等,對這些數據進行挖掘,預測用戶行為;然后這一層會設定并實現資源的揭示方式。
3)信息調度層。這一層將數據資源層里整理好的相關資源,按照前端應用層的要求進行調度與分配,是整個架構中的控制中樞,對系統的穩定性與算法的精準性有較高要求
4)應用服務層。之前三層體系都由云環境的提供商直接管理,這一層主要用于服務與應用的部署,大部分工作可由應用提供商米完成,用戶也可介入到部分應用配置過程中去。這一層實現了應用的管理與服務模式的沒定。系統可基于服務效率和服務滿意度等指標評價服務質量,對應用與服務過程進行優化進而模式化、模塊化,建立服務模式庫。
5)接人沒備層。這一層是最終面向個人用戶的層面,用戶可通過各種設備實現云端系統的接入,包括計算機、平板電腦、手機或其它電子設備。
3支撐學科協同創新的云系統平臺
雖然協同創新的理念在最近幾年才逐漸開始流行,但是之前許多學科系統平臺在建設之初已經整合了協同工作的理念,希望把與學科相關的各個部門的人士都拉入到系統平臺的建設工作中來。目前業界所知的學科建設類資源平臺大部分都由圖書館所主導引進或建設,少部分由高校其它部門承擔建設。筆者通過調研,大致列舉一下目前廣泛使用的學科資源平臺。
CALLS重點學科網絡資源導航庫,由CALLS在2003年創建,實現了多館參加共建的學科信息資源共建共享模式;學科博客與學科微博,利用開源軟件或者云服務商,實現學科信息資源的匯聚與推送;SubjectPlus和Libguides,兩個比較專業的學科資源服務平臺,國外很多圖書館正在使用;CNKI機構學科子館,依托CNKI的海量文獻資源建設的學科資源平臺;MediaWiki,最著名的開源維基百科軟件,不少高校利用其知識存儲與社區協作的特點來搭建學科資源平臺;Myhbrary、Libdata、Research Guide、Li-brary Course Builder,這幾個是針對圖書館學科信息資源服務的開源系統,國外有不少圖書館利用其搭建平臺;Drupal,新興的開源系統,是一套殲源內容管理框架,使用者可在其上任意搭建想要的系統,目前也已經推出了針對信息資源集成相關的模塊;YADDA,2008年由華沙大學開始使用,系統包含靈活的數據倉庫聚集機制,多層次的支持和全文索引功能,適合數據資源的存儲與展示;英國的Intute、美國的Infomine、澳大利亞的AARLIN、德國的SSG-FI,分別是各個國家的若干高校聯合所成立的學科信息資源門戶網站,整合了多個知名的學科信息資源門戶,提供個性化服務。
雖然國內外提供學科信息資源服務的平臺非常多,但是基于云環境的系統平臺目前其實并不是很多,主要原因有兩個:一是因為云計算技術還屬于新生事物,從傳統的單機平臺轉變到云環境需要時間過渡;二是因為信息資源的存儲是一個敏感話題,很多信息資源擁有機構不太愿意接受資源不為自己掌控的情況。本文僅對基于云的系統平臺做一些比對研究,希望能從中總結出一定的應用模式,為今后建設面向學科協同創新的信息資源集成與服務的通用框架與規范奠定基礎。
3.1 AARLIN
Intute、Infomine、AARLIN等系統平臺性質類似,都是學科資源門戶類的站點,而且均以“中央館-成員館”的模式實現了信息資源的云端匯聚,支持云環境下的資源檢索與共享,在此僅以澳大利亞的AARLIN系統作為范例進行解析。
AARLIN平臺利用匯聚的資源,向前端用戶提供一個統一的檢索界面,支持對內部集成的多種電子數據庫、Web站點、在線圖書館目錄及其它電子信息資源的分布式檢索,并能使用同一格式進行檢索。平臺借助OpenURL的協議框架和相關軟件技術,向最終用戶提供內容敏感的參考鏈接服務或擴展服務,如全文文獻的深度鏈接服務等。更人性化的是,系統能夠根據認證過的用戶資料,向每個用戶推送相關的信息,并且每個用戶都可以個性化定制并精煉“搜索環境”,只訪問和自己的興趣愛好相關的信息資源,還能支持用戶縮小或擴展門戶推送的“信息圖景”,并予以設定。系統還會提供最新的文獻報道服務或定題服務,向用戶定期通告與他們預先設定的搜索特征相匹配的最新的可利用信息資源。
從之前提到的協同創新資源集成平臺的3個特征來分析:在協同性方面,AARLIN系統由19所大學圖書館與澳大利亞國家圖書館共同合作建設,具備一定的協同工作性質,但是缺乏用戶的直接參與建設,在協同創新性上稍有欠缺,資源來源的多元化程度不夠。在集成性方面,系統在云端環境下集成了多種途徑的信息資源,并且按照學科進行分類,支持應用Z39.50、HTIP、SQL等協議對各種類型的數據庫、信息資源及網站進行統一形式的檢索,集成度相對較高,體現了云計算架構的優勢。在主動性方面,平臺做得比較好,能夠根據不同用戶的資料分析其特點與特征,例如身份標識,為其定制個性化的檢索方式,推送其感興趣或對口的信息資源,體現個性化定制與信息主動推送的特點。該系統在云架構方面略有不足,本地如要使用還需架設本地服務器與資源,無法完全依賴中心的云環境。
3.2學科博客/微博
學科博客/微博有兩種類型,一種是利用開源軟件搭建的本地學科博客資源,不在本文的探討范圍內;另一種是利用第三方云服務商提供的博客/微博平臺來實現信息資源的匯聚與推送。本文要分析的是第二種類型,以學科微博為例。
平臺主要可用于學科信息資源的集中匯聚,進行發布與推送,但缺乏信息資源的存儲功能。可以向用戶主動推送各類的學科服務類信息,在微博上關注了平臺賬號的用戶只要登錄就可以看到,相比于其他眾多的學科信息資源類平臺,用戶登錄微博的頻次與偏好顯然更有優勢,這樣無疑可以大大提高學科信息資源的推廣效率,同時這些信息通過轉發可以迅速遍布有相同興趣愛好的小組與群,甚至用戶之間也發生互動,因為他們也可能把信息轉發給其他好友。平臺在資源薦購的協同參與上也具備優勢,可將資源列表直接發送到平臺上,只要讀者關注了資源薦購相關的微博,就能第一時間了解到資源采購情況,通過微博的轉發大量用戶都可以看到并根據需求提出自己的建議,對于學科信息資源的準確購買顯然有很大的幫助。另外平臺通過與手機的無縫結合,使服務的時間和地點幾乎不受任何限制,用戶可隨時隨地訪問平臺所提供的信息資源。
在協同性上,博客/微博平臺具備一定的先天優勢,由于架設在云端,因此只需提供賬號密碼即可由任何人進行管理,這樣與學科相關的各種機構、甚至用戶都可以參與到平臺的建設中來,另外用戶還可以通過信息資源的推薦方式直接參與進來。在集成性上,由于博客/微博平臺的特點是信息的推送與發布,而非信息存儲,因此該平臺無法用于倉儲大量的資源信息,只能起到資源整理與匯集的作用,往往需要通過超鏈接的方式訪問其它平臺獲取數據。在主動性上,平臺可以通過訂閱方式將信息主動推送給用戶,但是目前尚沒有用戶行為分析與個性化服務的功能。該平臺屬于完全的云架構應用,資源獲取非常方便快捷。
3.3 Libguides
Libguides是由美國Springshare公司推出的基于云環境的學科服務平臺,提供的交互界面是Web方式,用戶對系統的所有操作都是通過瀏覽器來進行,而無需關心后臺的硬件配置。由于Libguides的應用對象比較專業,因此全球已有數千家圖書館使用該平臺來進行學科信息資源的匯聚與推送。
Libguides的設計理念非常超前,可以建設子站點,采用了框架與模塊化的設計,頁面上的布局與樣式都可以由使用者任意調整,用戶甚至可以用鼠標自由拖動每個模塊進行自由排列。平臺中內置了多種類型的模塊,稱為“box”,包括文本型box、RSS型box、多媒體型box、投票反饋類box等等,其中對于文本型box,用戶還可以進行二次編程,將html、Javascript代碼直接嵌入box中,可以實現對其它信息資源平臺的嵌入式引用,實現一站式檢索與信息集成的目標。另外,平臺還支持對模塊與頁面的引用與復制,Srpingshare公司建設了分享社區供用戶交流使用經驗,在征得同意的情況下,甚至可以直接復制與引用其它高校站點的頁面與模塊,大大提高工作效率。與博客/微博系統類似,Libguides也不擅長于信息資源的倉儲,而更多地被用于信息資源的發布與推送。每個學科點都可以建設獨立的子站點,進行個性化服務。
在協同性方面,Libguides平臺做得非常出色,每個學科指南都有單獨的賬戶權限控制,并且可以開設臨時賬號給其它機構的人員,使其參與到指南的制作中來;頁面上的評論功能與反饋模塊可以供用戶提供參考建議,幫助資源的進一步完善。從不少高校的使用情況來看,很多院系已經參與到Libguides學科子站點的建設中來,豐富了信息的多元化來源。在集成性方面,平臺可通過資源嵌入的方式實現一站式的資源推薦與檢索,但同樣需要利用第三方的系統界面來實現,不過無需跳轉到其它頁面,在站內即可完成檢索與資源查看。在主動性方面,平臺稍顯欠缺,平臺可通過不同學科子站點的資源建設,向各個不同學科的用戶提供個性化的服務,但沒有用戶行為分析與主動推送的服務。該平臺完全架設在云端,用戶管理與建設非常方便。
3.4 Summon
Summon、Primo、EDS等系統同屬于信息資源發現系統,將海量的信息資源匯聚于一體,提供一體化的檢索與資源獲取,可包括實體書資源與電子資源。這一類系統通常采用本地+云服務相結合的方式,本地有實體書的信息資源,云服務提供電子資源的信息。本文以Summon為例進行分析。
Summon擁有39個Open Access數據庫及平臺,來自73個機構的257個特藏數據庫可以通過Summon公開檢索并訪問,HathiTrust中超過200萬冊公開版權的圖書可以在Sum.mon中做全文檢索并免費獲取,全部800萬冊圖書可以做全文檢索。信息資源來源非常多樣化,全文主要來自Else-vier、Sage、Wiley,主題詞和摘要來自于Gale、PorQuest,DOI來自CrossRef,同行評審狀態來自Ulrichs,文章被引用次數、主題詞來自WebofScience。系統還提供專門為查詢館藏OPAC資料的特設功能,用戶可以將檢索結果限定為來自館藏目錄中的結果,還有瀏覽和查詢OPAC書目數據的分面導航。基于用戶輸入的檢索內容還可以推薦相關的數據庫,這樣讀者可以直接去相關的數據庫中檢索,提高數據庫的曝光率和使用率。Summon與Web of Science整合之后,可以顯示檢索結果的被引用次數,而引用次數會影響到這篇文章的相關性排序,且引用這篇文章的其他文獻也會顯示出來。
在協同性上,Summon平臺主要由供應商進行資源的維護與建設,少量個性化工作可由本地用戶完成,其它機構用戶基本無法參與到資源的建設當中去,在協同創新方面比較欠缺。在集成性上,這是資源發現系統的最大優勢,能夠匯聚各個來源的海量信息資源,實現一站式的查詢檢索,并且資源內容相當豐富,包含了各類學科相關的信息。在主動性上,平臺能夠做一些用戶數據分析,基于用戶的檢索內容與記錄給用戶推薦關聯度較大的數據庫資源,實現了一定程度上的主動推送服務。平臺采用本地與云環境結合的方式,假如不需要檢索本地資源也可以采用獨立云環境的部署方式。
4多種系統平臺的比較
這些形形色色的學科信息資源系統各有特色,有些在資源的集成性方面具備優勢,有些主要致力于信息資源的揭示與推送,表1是對這些系統做出的對比分析。
通過對多種系統平臺的比對,我們可以總結出一些建設面向學科協同創新的信息資源集成與服務系統的特征與趨勢?首先系統在協同創新上應該給予足夠的自由度,能夠允許多方機構的人員共同參與到資源的共建共享中來,用戶也應當有一定的資源推薦或建設權力;其次應在資源集成性與一站式資源獲取方面做到極致,最大程度方便用戶對信息資源的獲取,包括移動端的建設,也是未來的應用趨勢;再次系統必須具備一定的前瞻性,在大數據分析與用戶行為分析方面做出深入研究,利用云環境的強大計算功能,給用戶智能化、主動化的體驗感受;最后系統需按照云平臺的架構進行建設,體現泛在服務、資源集成融匯的特色。
5結束語
本文對當前主流的一些云學科資源平臺進行了分析比對,總結出了一些建設面向學科協同創新的信息資源集成與服務系統的通用模式與特征;現在的系統在各方面還存在著或多或少的問題或缺陷,并不能完全滿足要求,希望通過這種特征與模式的提煉,給未來的系統建沒提供建設性的框架與參考依據,從而設計出更好用、更智能化的學科信息資源系統。