史微微
(黑龍江省政法管理干部學院,哈爾濱 150080)
?
試論大數據思維對圖書館信息服務的啟示
史微微
(黑龍江省政法管理干部學院,哈爾濱 150080)
摘要:大數據理念與實踐自商業領域向信息服務各個領域迅速擴展,圖書館是社會中服務于公共文化的一個重要機構,致力于引進及應用大數據理念與技術。本文基于大數據思維視角,初步探討了收集存儲有關數據,整合圖書館信息服務的作用,對于提高圖書館信息的創新具有十分重要的意義。
關鍵詞:圖書館信息;大數據思維;服務啟示
隨著不斷提高對大數據的關注,雖然大數據技術目前還不夠成熟,應用還無法做到廣泛,但大數據思維具有十分重要的作用,在大數據時代應基于此對該工具進行應用。本文以“圖書館立方”項目為例,對其在圖書館信息服務中的應用進行初步探討,研究應用大數據思維對圖書館信息服務工作的整合及完善。
一、大數據及其思維
大數據也被稱為海量數據,其劃分標準主要是根據數據的存儲容量是否達到PB或EB級。據國際數據公司統計報告顯示,全球信息總量增長速度每兩年可增長一倍,目前“大數據”的定義還缺乏統一的權威標準。但數據“大”與“大數據”是不同的,大數據在實際上不是定量描述數據規模,而是在多樣化的大容量數據中迅速提取信息的技術和思維[1]。
(一)大數據思維
大數據思維也就是指其哲學基礎或內在邏輯,具有無偏性、規律性、開放性及關聯性4個特征。海量數據表面上沒有什么聯系,但在背后邏輯上存在一些規律,客觀記錄真實個體的心理、行為等內容,相對于人類群體,個人在心理及行為模式方面具有穩定性,并具有規律性表現,若不是通過數據分析和挖掘是不可能清楚的。
統計是大數據技術的重要學科基礎之一,其思維能夠將統計學思維特點進行充分展現。對“代表性”問題的解決是統計的重要成就,過去受現實因素所限,很多調查只是采取抽樣方法,但這存在一定的偏頗,難以代表總體客觀情況,因此統計學應確保提高代表性[2]。隨著大數據技術的逐漸產生及應用,也發現對總體研究具有可行性。
數據、數據庫、數據集及數據群的累加構成大數據,數據量達到一定程度才具有更高的應用價值。在數據挖掘過程中,不僅要重視數據群內數據集之間的關聯,還要重視數據群之間的關聯,才能將更多的隱性價值挖掘出來。
開放性主要是指不預設、預期結論的可能性,而根據被驗證完成具有可靠性的科學方法和流程開展相關研究工作。大數據研究不具有預設性,在結論未得出前也不清楚預期結論應該是什么。很多商業情報工具都具有對已知的未知進行關注的特點,了解問題后再尋找答案,預先由分析人員對收集數據的形式和類型進行確定,這都是基于大數據及相應的分析技術或系統充分配備的情況下。
大數據不僅是技術,也是思維。借助大數據思維對圖書館信息服務模式進行創新、信息服務范圍不斷擴大及信息服務質量不斷提高是關鍵,也要將大數據源提供給其他社會組織并創造一定的信息價值,而大數據技術在本質上是將目標實現的一個重要工具。
(二)圖書館與大數據
在圖書情報研究領域,數據、知識及信息之間不僅存在一定聯系還存在明顯的區別。被調用分析前大數據通常處于無序狀態,難以直接進行利用,而論文數據庫等信息資源在圖書館中能夠進行直接閱讀、學習,但圖書館中的借閱記錄、用戶信息行為數據等屬于大數據或具有成為大數據的可能性。大數據思維表明在海量數據背后隱藏的一些規律性數據群之間存在一定的關聯,國內某一個圖書館的圖書借閱記錄數還難以達到PB級,在數據規模上與大數據存在一定差距,但不影響圖書館對大數據思維的應用。圖書館應該存在多于目前的數據信息,但因沒有進行大數據思維的學習及內化,每天對產生的用戶信息行為等大數據的收集、存儲也不夠及時,更難以實現對數據進行挖掘及研究[3]。
二、大數據思維的應用
(一)“圖書館立方”項目
某高校圖書館在2010年研發完成了“圖書館立方”,將學生應用圖書館的有關記錄關聯校內其他系統的數據庫,不僅實現對教學活動中圖書館的影響與價值進行評估,還能利用對信息的收集反饋使圖書館信息資源擴大影響,也使其價值得到提高,以實現對學校制定教學提供重要的數據支撐作用[4]。“圖書館立方”主要分為價值立方、營銷立方和流程改進立方三部分內容。
在價值立方方面,已開發應用并圍繞學科教學活動進行開展,用于對使用圖書館信息資源影響學生成績的客觀評價,利用該系統了解使用頻次不同的學生的信息特征。每學期應對此數據進行一次更新,并在期末匯總學生成績完成后導入。
通過分析“圖書館立方”的數據可知,高校學生的學習成績與其對圖書館信息資源的利用具有十分緊密的聯系。也就是說,高校學生對圖書館電子資源的利用時間越長,在學習成績方面具有更高的比例獲得好成績;或學生的學習成績越高,其對圖書館電子資源的利用時間也越長,在一定程度上使高校圖書館的重要性及價值創造作用得到充分體現。有關研究結果顯示,開展“圖書館立方”對圖書館將教學活動創造等向學校及上級機構進行展示具有重要作用;而且也將得到預期外的科學結論,為圖書館推廣相應活動提供比較準確的目標群體,使活動具有更高的執行效率及針對性。
(二)“圖書館立方”的思考
在數據規模上,“圖書館立方”使用的在校2萬名學生的成績數據、應用圖書館信息資源的記錄,與大數據還有一些差距,但全面體現出大數據思維特征。針對學生學習成績或學術成就與其對圖書館信息資源利用之間存在的關系研究思路還有待于創新,但采用問卷、抽樣調查等研究方法,增大研究結論的偏差及缺失一些信息,這都是難以克服代表性的不足之處。但隨著日新月異的信息技術,研究方法及分析技術明顯提高,全樣本研究已逐漸變為現實,這不僅使代表性難題得到有效解決,還基于“全樣本”研究框架,獲得預期外更多的信息量及研究成果。只針對讀者借閱數據,還能實現對館藏文獻流通的類型及借閱率等指標的分析,但目前還停留于分析結構化數據層次,分析報告難以向上級機構對圖書館的價值創造活動進行展示。研究成果獲得目標群體的細分具有一定針對性,可使圖書館服務推廣活動的價值得到提升。盡管國內圖書館還沒有此方面的要求或目標,但也都是未來必將面臨的一個重要的現實問題。所以,圖書館應加強大數據思維的學習并內化,不只是加強數據群,還應加強與其他組織數據群進行良好互動,對用戶信息行為改變后不斷變遷的信息需求加深理解,才能充分發揮大數據的應用價值。
三、圖書館準備“大數據”的相關工作
(一)相關數據的收集及存儲
圖書館目前主要應開展用戶信息行為數據的收集和存儲,不僅將其向大數據不斷累積,準備應用于將來的有關應用;而且借助目前的數據分析及研究方法,針對用戶信息行為數據加強對用戶需求變化的深入了解,以便于細分用戶群體,實現對整合圖書館信息資源及服務的有效指導。達到一定規模的公共圖書館,每天對用戶的服務次數類似于每天大型企業的客戶數量,都具有很多的用戶行為數據,圖書館應對此提高重視程度并進行收集。如在校園網IP范圍內,高校圖書館用戶僅能對圖書館系統進行直接登錄并應用其電子資源,但在目前情況下,很多圖書館還沒有提高相關意識,有目的地記錄存儲用戶信息行為數據。用戶的這些數據具有半結構化和非結構化特點,盡管不具有較大的價值密度,但若全面進行收集對于開展用戶相關喜好的分析研究是具有重要作用的,還可協助圖書館提供信息服務的有效性及針對性。
(二)大數據思維的學習
大數據及大數據技術并不是大數據時代最重要的,而大數據思維確是最重要的。創新源泉是思維,大數據思維的學習并內化對于圖書館適應大數據時代發展十分關鍵。在社會中圖書館是信息資源的集散節點,若用戶從圖書館難以得到所需服務就會轉向其他部門,用戶流失對于公益性機構的存在基礎產生動搖。所以,圖書館應積極組織開展大數據思維的學習,深入掌握其他領域大數據的發展及應用情況,不管是商業還是社會領域。在學習了解不夠深入前,圖書館管理人員容易產生理解大數據片面的問題,認為大數據技術十分深奧,從而產生一定的距離。
綜上所述,大數據與日常行為具有十分緊密的關系,評估圖書館經濟效益及信息服務離不開大數據思維的應用。圖書館如有條件就可以實施“圖書館立方”項目,對用戶信息行為及其需求的不斷變化加深了解,并對評估自身經濟價值進行客觀量化,進而使信息服務得到有效改善,圖書館也充分發揮其應有的重要作用。
參考文獻:
[1]韓翠峰.大數據時代圖書館的服務創新與發展[J].圖書館,2013,(8).
[2]楊繹.基于文獻計量的“大數據”研究[J].圖書館雜志,2014,(11).
[3]姜山,王剛.大數據對圖書館的啟示[J].圖書館工作與研究,2015,(9).
[4]張文彥.大數據時代的圖書館初探[J].圖書與情報,2013,(10).
[責任編輯:曲占峰]
收稿日期:2016-02-12
作者簡介:史微微(1975-),女,黑龍江哈爾濱人,圖書館工作人員。
中圖分類號:G250.7
文獻標志碼:A
文章編號:1008-7966(2016)03-0159-02