【摘要】:大數據時代,要主動應對大數據對傳統圖書館服務的沖擊和挑戰,重點建設數據資源網絡體系,打造公共數據存儲和服務中心,深化知識服務及增強圖書館服務的針對性和有效性,努力探索大數據技術和觀念的創新及應用,切實促進圖書館服務的發展和創新。
【關鍵詞】:大數據時代;數據挖掘;圖書館服務;知識服務
大數據時代的到來,必將對當前圖書館的發展理念、工作定位、服務模式等產生巨大沖擊,圖書館事業亦將面臨一個重大的抉擇和發展起點。圖書館界如何迎接大數據帶來的各種挑戰,如何利用大數據創新發展圖書館服務,如何提升圖書館在信息技術革命潮流中的競爭力,如何借助大數據帶來的機遇突圍圖書館事業發展的困境個瓶頸,成為當前圖書館界有待研究的重要理論和實踐問題。
1.建設動態、優質的數據資源網絡體系
(1)全面優化數據資源的手機存儲。過去,無論是傳統圖書館還是數字圖書館,主要側重數字資源庫、機構知識庫、語義化信息等結構化數據的收集和存儲,而對半結構化、非結構化數據關注較少。目前世界上非結構化數據占比高達80%以上,,如果對這部分數據忽視,將意味著對大部分有價值的信息視而不見。大數據時代,半結構化、非結構化數據的收集、存儲和開發運用技術得以突破和迅速發展。為此,圖書館數據收集存儲中應延伸到所有承載人類文明記錄的資源,即全媒體資源,要多關注半結構化、非結構化數據收集,包括郵件、視頻、微博、頁面點擊等數據。圖書館可以在服務中積極運用web2.0技術,開辟交互式共享平臺,開設用戶互助吧、論壇、社區等欄目,為館員和用戶、用戶與用戶之間開辟實時的交流通道,了解讀者的閱讀愛好和閱讀習慣。積極通過射頻識別〔RFID )、門禁通過等技術,收集日常用戶的身份關系、借閱記錄、存儲信息行為、搜索方式、行為痕跡等結構化和非結構化信息。由此,讓圖書館收集存儲的信息“活起來”,成為立體化、動態性、關聯性的知識譜系。
(2)聯通數據資源的共享網絡。大數據時代下,超體量的數據迅速增長,單個圖書館要對如此龐大的數據群進行收集、存儲不僅不可能,也毫無必要,必須形成協調合作網絡體系,才能真正實現數據的共有共享,提升信息服務能力。隨著分布式緩存、大規模并行處理〔MPP )數據庫、分布式文件系統、云計算平臺、各種NoSQL分布式存儲系統等大數據技術的運用,很大程度上加強了數據收集、存儲和共享能力,為圖書館在資源共享網絡建設方面提供了巨大的技術支持和發展前景。具體說,圖書館在推進數據資源網絡體系建設中,首先,深化圖書館數字化,把各類資源轉化為電子數據,在此基礎上,共同推進全國乃至全世界圖書館資源共享。雖然我國目前沒有任何一所圖書館占有的數據資源達到了PB級,但全國圖書館數據資源總量卻是一個龐大的數據集。
2推動公共數據的存儲、公開和挖掘
(1)搭建政府公共數據連接池。大數據時代,政府政務的數字化及政務數據的透明化迅速增強,政府作為公共數據“托管人”,為公眾提供訪問數據窗口成為不可逆轉的潮流。我國正處于城鎮化高速發展、民主法治迅速推進的轉型期,通過開發政府公共數據,對緩解交通擁堵、資源緊缺等問題,消除社會爭端、群體對抗等矛盾、顯得極為迫切。這也是大數據最具潛力的應用領域之一。圖書館作為法定的政府信息公開承辦單位、在當前管理體制下、就推動政府數據公開方面可作為的還很有限。但公開是一種趨勢、而且也正在不斷推進中、圖書館應該在可為的范圍內、充分利用大數據技術、積極搭建政府公共數據連接池、不斷推進公共數據的開放。
(2)做科研數據監護的引領者。我國除重大科研項目采取了有規劃的數據管理外、大部分科研數據仍處于無序狀態、這對于大數據時代下的科研創新將造成無法估量的損失。圖書館在數據監護工作中所承擔的職責包括分析數據集合的存儲、數據管理規劃、最佳實踐經驗傳播、收集與傳播數據集合以及完成數據保存標準的制定等。而大數據時代、在超大體量數據的收集、存管、共享技術方面有較大發展、為圖書館履行數據監護職責、嵌入到科研一線獲取數據、對數據進行持續系統性維護、根據科學研究需要推送數據服務等方面提供了重要支持。為此、我國圖書館特別是高校圖書館、應抓住這一發展機遇、創新服務業務、提升能力水平、通過為科研項目提供數據監護服務、搶占科研數據發布、存儲、利用和管理的重要陣地、擴大圖書館服務效益。
3大數據時代圖書館服務的發展與創新
3.1借助數據挖掘技術深化圖書館的知識服務
大數據時代、帶來了更豐富的數據資源和更專業的數據分析技術、形成了新的解決問題的思維模式、提供了更廣闊的信息合作視野,為數據分析業務帶來了重大變化和支撐、也為知識服務向專業化、個性化、決策與創新型發展、帶來了巨大的發展機遇。圖書館是人類社會的知識寶庫和智慧發源地、充分利用大數據的各種技術、迅速轉變數據處理的范圍、方式、對象、目的等理念和方式、積極推進圖書館信息服務等傳統業務向數據分析、數據挖掘方向轉移、開展更有深度、廣度的知識服務、把為政府、企業等做各類數據分析服務、數據挖掘服務變為大數據時代圖書館的常態服務內容。這將是大數據時代、圖書館服務發展和創新最具挑戰的領域、也將是催生圖書館服務創新發展的新的平臺和機遇、更是圖書館現代服務的生成及實現的基本途徑。
3.2提升圖書館服務的針對性和個性化
(1)增強閱讀推廣服務的效果。目前、圖書館在閱讀推廣方面的工作存在許多不足、特別是可持續性、實效性方面待提升。據資料顯示、亞馬遜網站充分利用大數據相關性分析、通過有效的圖書推薦使其圖書銷售量增加三分之一以上。人們之所以閱讀、也是基于推薦的理由。在大數據時代、圖書館也可以通過廣泛的數據分析、如通過對讀者借閱情況、書籍出版信息、社交網站評論、經濟社會發展狀況等各類數據分析、找出各類相關性、了解特定時期、特定群體的知識需求、閱讀薄弱點以及閱讀興奮點和關注點、主動創新方法有針對性地開展閱讀推廣工作。不僅可開展面上的閱讀推廣、也可開展點對點的閱讀推廣。例如、通過收集和分析讀者借閱情況、生活閱歷、工作崗位等方面的半結構化、非結構化數據、總體把握讀者的閱讀習慣和知識需求、有針對性地向其開展圖書推薦、知識推送等工作、增強閱讀推廣效果。
(3)提升社區圖書館、流動圖書館等工作效率。研究表明、當前、我國圖書館利用率低的一個重要原因是圖書館距離用戶太遠、當圖書館與用戶保持合適距離、可有效促進公眾對圖書館的利用。社區圖書館、流動圖書館等是圖書館深入用戶、親近用戶的有效載體、是圖書館服務的“神經末梢”、擴大了圖書館輻射范圍、本可以解決這一難題。但現實效果并不理想、普遍反應是“無法閱讀到合適的、需要的圖書”。造成這種情況的原因主要是社區圖書館、流動圖書館沒有根據用戶的需要有針對性地分派圖書、及時更新書籍。
參考文獻:
[1」肖強,鄭立新.關聯數據研完進展概述【J】.圖書情報工作,3011 (13): 72-75, 134.
[2」任瑞娟,等.分布式本體編輯系統〔ADORES)的設計與實現【J】.現代圖書情報技術,3011 (3):9一16.
[3」白海燕,喬曉東.基于本體和關聯數據的書目組 織語義化研究【J】.現代圖書情報技術3010(9):18一37.