
(廣州鐵路職業技術學院圖書館,廣東 廣州510000)
關鍵詞:高校圖書館;大數據;應用服務模式;體系建設
摘要:文章主要針對高校圖書館大數據應用服務模式體系建設展開探討,對高校圖書館大數據應用服務的現狀作了分析,并系統研究了高校圖書館大數據應用服務模式的體系建設,以期能為有關研究提供參考。
中圖分類號:G258.6文獻標識碼:A文章編號:1003-1588(2017)04-0134-03
1高校圖書館大數據應用服務現狀分析
1.1高校圖書館大數據研究進展
圖書館應用大數據、服務需求以及相關的技術問題的討論,國外相關學者很早就已經開始關注。關于數據服務方面的討論,韓翠峰對組織數據、存儲數據以及數據的管理進行了相應的探究,他認為大數據時代的今天面臨的挑戰是多種多樣的,應提出相應的應對方案[1];秦嘉杭則認為在大數據環境下,圖書館更應該側重于挖掘數據、發現知識以及服務社區的數據構建及服務[2];關于應用技術方面,M.Teets和J.Qiu等人依據時間的先后順序依次提出了World Cat數據庫的應用框架和HPC-ABDS大數據時代的圖書館應用框架[3]。而近年來,國內很多知名學者也開始注意到大數據時代背景下高校圖書館的服務與技術問題,并引發了相應的討論。王顯燕對國內圖書館對技術的應用、知識的創新、圖書館的硬件設施等進行了多方面的比較,分析了國內高校圖書館面臨的問題與挑戰,并根據問題提出相應的應對策略,她認為在大數據時代高校圖書館發揮著重要作用,未來高校圖書館的服務更加精細、用戶的行為分析更加準確、決策更加智能化[4]。不管是國內的學者還是國外的學者,都是從多個視角探討了大數據背景下高校圖書館面臨的諸多問題與挑戰,高校圖書館需要更加明確的創新服務意識,策劃出合理的應對方案。筆者認為,上述很多方案更多的是偏向于對概念的解釋,缺乏相關理論以及從技術角度切入的應對策略。
1.2高校圖書館大數據應用服務目前面臨的問題
1.2.1高校圖書館數據整合問題。目前,由于受多種因素的限制,在知識服務領域中相關的企業數據開放程度不高,“信息孤島”便由此產生,所以,收集數據的難度較大。加上迥異的數據關聯、風格各異的數據存儲方式以及不同的數據格式,即使是進行簡單的數據堆砌,也很難挖掘有效的知識數據,這給高校圖書館整合大數據帶來了難題。除此之外,整合大量數據后,應使用什么樣的存儲方式,從而確保用戶的訪問速度不受限制,成了一個新的挑戰[5]。
1.2.2高校圖書館大數據技術問題。大數據環境下,傳統的數據挖掘方式已無法滿足對關系型數據、非結構化數據挖掘及深度分析的需求,這就需要高性能計算設備、軟件平臺作為支撐,提高處理速度,采用合適的數據挖掘算法進行知識挖掘和知識發現。目前,我國相關領域的技術發展還不平衡,一些知名互聯網企業,如阿里巴巴和騰訊等,都已構建了上萬節點的大數據計算集群和軟件平臺,也成功開展了大數據應用和服務,但由于企業之間競爭激烈,大數據的應用和開發技術通常技術水平不高、技術擴散不暢,優勢企業對開源社區的貢獻相對薄弱,從事圖書情報工作的研究者難以獲取所需的數據資料,造成高校圖書館大數據分析面臨技術壁壘。
1.2.3高校圖書館服務問題。目前,在大數據開放以及知識共享的時代背景下,高校圖書館需要進行針對性的知識服務,及時了解用戶的需求,通過搜索知識、組織文字、分析數據、重組詞語等搜索方式為用戶提供更為優質的服務,進而推動知識的應用與創新。目前,高校的個性化服務以及科研項目成為高校圖書館知識服務體系的兩個重要方向,但業界對此的研究缺少相應的理論支撐及相關的技術支持[6]。
1.2.4高校圖書館經費問題。高校圖書館是為高校教學和科研服務的。由于高校對圖書館計算機設備及資金投入有限,圖書館大數據服務面臨著較大的挑戰。隨著圖書館數據量的不斷增加,數據存儲及計算規模也隨之增大,服務器硬件設備及軟件設施的購置等需要大量的資金投入,對此,高校圖書館需爭取國家和學校的重視和支持,并尋求有效的解決方案。
2構建高校圖書館大數據應用服務模式
2.1大數據應用模式
“大數據應用模式”目前還沒有確切的定義。筆者通過互動百科搜索“模式”一詞,得到的結果是:“在生產和生活中產生的經驗,經過了人的升華以及核心知識的提取,形成了一種可以解決問題的方法?!睋影倏茖Α澳J健币辉~的解釋,筆者將大數據應用模式解釋為解決了高校圖書館大數據應用的方法。在大數據時代背景下,高校圖書館的大數據服務體系面臨著很多的難題,但在相關理論知識體系以及技術手段的支撐下,高校圖書館應深度分析這些難題并從中提出相關解決方案,經過總結得出理論,最后形成相關的知識理論體系[7]。
2.2大規模網絡分析方法
2.2.1網絡分析的知識理論。網絡分析方法需要與知識管理理論相結合,以學科的知識作為理論依據,通過對“語義網絡”模型的構建以及“顯性知識”的挖掘,搭建起分析“社會網絡”模型以及“隱性知識”的表達平臺,以達到共享和轉移“隱性知識”的目的,進而能夠起到輔助作用,創新知識理論以及使決策更加智能[8]。
2.2.2個性化推薦算法。在個性化推薦算法中,協同過濾是目前最為廣泛的算法之一,該算法為了給某個特定用戶進行個性化推薦,可根據用戶所提供的相關信息,計算出與該用戶相似度較高的最近鄰居,再分析最近鄰居的活動記錄等數據,預測出該用戶可能對何種資源比較感興趣,從而對該用戶進行個性化推薦。
2.3高校圖書館大數據應用模式
高校圖書館大數據應用模式框架的構建是基于大規模網絡分析方法,該框架包含了高校圖書館大數據的應用模式、應用實現方法、知識服務管理理論、支撐技術以及云計算支撐環境(見圖1)。
2.3.1收集、整合和存儲數據模式。①高校圖書館的資源存儲結構以及日常服務的半結構化和非結構化問題,可以采取人工手寫錄入數據或通過相關的軟件平臺接口存儲相關數據的方法解讀。②高校圖書館可以選擇與知名的文獻資源數據庫商簽約,以合作的方式獲得數據庫資源的下載、研究和使用權限。③高校圖書館可將本校的資源優勢以及特色學科與網絡數據相連接,以獲取有效的數據資源及相關文獻,在本校圖書館內構建學科數據庫,有效地收集學科的相關數據。
2.3.2大數據具備數據體量大、數據類型多、價值密度低和處理速度快四大特點。選擇和整合不同的數據資源,并對其采取什么樣的整合方法及整合的方式是這一問題的關鍵。①從資源整合的角度切入,根據特定的用戶需求進行大數據的應用研究。對此,數據整合需要考慮其類型的選擇,在整合時需要建立起相關性強、內容豐富的高質量數據庫。②從存儲和整合數據的方式上看,不同格式的數據需要建立起相應的數據模式,并建立統一、規范的表現形式,將數據存儲在分布式的云平臺之中,方便用戶通過網絡快速地檢索和查詢相關文獻和資料[9]。
蔡洪齊:高校圖書館大數據應用服務模式體系建設研究 2.3.3數據處理和分析模式。處理大數據有分析數據和挖掘數據兩種途徑。①分析數據是以文件形式或是以單個數據庫的組織方式為基礎,分析目標極為明確。②挖掘數據是需要在數據庫或是在分布式的存儲中建立數據庫。
2.3.4知識展現與服務模式。高校圖書館生存和發展的立足點是學科服務,評估高校圖書館的服務質量應依據其學科服務水平的高低,而學科服務又是圍繞科研和學科教學展開的,用戶能夠快速地獲取科研和教學資料,既提高了圖書館的知識服務水平,也對創新和應用知識起到了促進作用。高校圖書館個性化服務應針對用戶的行為習慣,以用戶的需求為主導,對不同的用戶采取相應的服務方式,具體實現技術包括個性化信息檢索、個性化信息推薦等。
2.3.5Hadoop大規模圖計算的云平臺。Hadoop大規模圖計算的云平臺破解了計算設備和經費投入等方面受限的難題。近年來,很多知識服務機構為了減少計算成本的支出,多利用中低端硬件設備集合成大規模的計算機集群,并搭建了相關的計算平臺,以此減少購置高端服務設備的費用。目前市場上出現的云操作系統有微軟公司開發設計的Windows Server2012系統、甲骨文的Solaris11系統以及華為自主知識產權的Fusion Sphere云操作系統等,這些操作系統都是由企業開發設計的,它們的優勢明顯、使用方便、性能穩定,但使用時需要支付相應的費用。而開源項目Apache下的hadoop系統功能強大且免費,因此被許多互聯網公司爭相采用,成為主流的分布式系統。Hadoop系統是運行于普通的服務器和計算機集群上的分布式存儲系統,它將普通的服務器與存儲在計算機的集群相連接,能夠完成計算機的存儲和運行調度。Hadoop系統的軟件開源特性能大幅降低大數據應用的成本,同時也使其迅速成為工業界和學術界開展大數據應用研究的主流平臺[10]。
3結語
在大數據背景下,高校圖書館的學科服務面臨著重大的變革,這既是挑戰又是機遇。在此背景下,圖書館要充分利用現代科學技術,不斷改進應用服務體系,才能為用戶和讀者提供更為優質的服務,以此推進高校圖書館更好更快地發展。
參考文獻:
[1]韓翠峰.大數據時代圖書館的服務創新與發展[J].圖書館,2013(1):121-122.
[2]秦嘉杭.大數據架構下的高校圖書館資源與服務建設研究[J].圖書館研究,2014(5):25-27.
[3]MTeets M,Goldner.Libraries role in curating and exposing bigdata[J].Future Internet,2013(3):429-438.
[4]王顯燕.大數據環境下高校圖書館信息資源建設與服務[J].農業圖書情報學刊,2015(10):26-28.
[5]牟靜.大數據環境下的高校圖書館閱讀推廣研究:利益相關者共贏視角[J].圖書館研究,2015(1):72-75.
[6]欒旭倫.大數據環境下高校圖書館個性化信息服務系統研究[J].圖書館學刊,2014(8):118-121.
[7]高建輝,李全華.移動互聯與大數據環境下高校圖書館在線服務體系研究[J].圖書館研究,2015(4):73-77.
[8]譚黔林.大數據時代高校圖書館特色數據庫建設研究[J].圖書館界,2014(2):18-20.
[9]曾文雯.大數據時代下高校圖書館的應對策略[J].高校圖書館工作,2014(4):41-43.
[10]胡云霞.大數據背景下的高校移動圖書館服務探索:基于在杭高校的實證研究[J].圖書館理論與實踐,2015(6):99-101.
(編校:馬懷云)
作者簡介:蔡洪齊(1981—),廣州鐵路職業技術學院圖書館副研究館員。