胡瑋瑋
(周口師范學院圖書館,河南 周口 466000)
圖書館所需“大數據”發展及管理研究
胡瑋瑋
(周口師范學院圖書館,河南 周口 466000)
伴隨著互聯網以及各項網絡信息技術的迅猛發展,大數據時代沖擊著人們生活的方方面面。大數據給作為信息的搜集、處理與傳播的中心的圖書館帶來了新的機遇與挑戰,圖書館如何在大數據時代有效地處理信息、管理數據,直接關系到圖書館的可持續發展。
圖書館;大數據;管理
1.1 大數據相關概念
大數據(Big Data)作為信息時代的產物,也影響了信息時代的發展,最早對大數據做出定義闡釋的是美國的麥肯錫公司,“無法在一定時間內用傳統數據庫軟件工具對其內容進行抓取、管理和處理的數據集合。” 這一定義直接反映了大數據的“海量數據”這一特點,涉及了大數據段處理過程,但是,并沒有對大數據的其他特性或者發展軌跡有清晰的解釋。直到國際數據公司給大數據提出新的定義,也就是我們今天公認的4V特性。這一定義從大數據的屬性特點上入手,清楚地界定了大數據,筆者認為這一定義在解釋哪些數據更有價值或者如何判斷數據的分析難度以及判斷數據的分析方式方面更具合理性。
4V包括了容量(Volume)、速度(Velocity)、多樣性(Variety)以及價值(value)。4V不僅區分了大數據還指出了大數據的特點。容量特征是指大數據的數據總量很大,尤其是近年來數據朝著海量爆炸式發展,數據的計量單位也不再是KB、MB,而是GB、PB等,容量大是大數據的首要特征。速度特征是指大數據的產生、傳播、更新速度快,信息的有效期可能很短,例如電子商務中,數據的變化速度很快,又如期貨、股票交易中,數據的變化速度也是打破了傳統的計算周期。多樣性特征是指大數據的存在類型、傳播類型等方面的多樣化。已存在類型為例,大數據的數據包括了結構化數據、非結構數據、半結構化數據。數據傳播媒介包括了微博、微信等新媒體,也包括了圖書、報紙等舊的傳播媒介。就數據的生產與傳播上,數據不再停留在單一的來源,我們每個人都是信息的生產者與傳播者。價值特性跳出了3V的范疇,從是否有價值層面限定了大數據。在大數據的研究領域,還有學者認為大數據還有復雜性等特性,正是大數據這些特性給圖書館帶來了新的挑戰與機遇。
1.2 大數據帶來的挑戰
1.2.1 數據處理的難題
大數據時代對圖書館帶來的挑戰首當其沖的是數據的處理難度提高,因為大數據時代數據的容量大、更新速度快、數據的復雜性提高、數據類型過于多樣化,數據的利用步驟過多。以數據的復雜性為例,由于大數據的類型多,承載方式多等原因就造成了大數據的復雜性提高,數據的處理難度相較于以前進一步增大,同時由于數據的處理復雜程度高,也直接影響了數據的處理速度和處理深度。
以數據的利用為例,大數據的處理一般至少包括了采集、分析和解釋三個步驟。首先是數據的采集,從數據集成模型來看,現有的數據抽取與集成方式可以大致分為以下4種類型:基于物化或ETL方法的引擎、基于聯邦數據庫或中間件方法的引擎、基于數據流方法的引擎及基于搜索引擎的方法。而數據的分析作為大數據的重中之重,包括了如何分析數據,如何深度挖掘信息以及評估分析結果等多方面。這些繁復的步驟一定程度上限制了信息的處理速度。影響了圖書館對信息與數據的處理效率。
1.2.2 技術難題
大數據給圖書館帶來的另一發展難題就是技術難題,這就包括了科技技術難題與技術人才難題。科技難題是因為大數據時代下分析數據要求有先進的軟件技術支持與硬件設施的改善以及多學科的技術支持,包括了統計學、語言學、計算機科學、可視化技術等等.軟件上要求圖書館人員要會操作云技術以及計算機的相關軟件,包括數據庫的操作、云計算軟件的操作。硬件上要在資金情況允許的情況下最大可能的升級設備。另外,圖書館在大數據沖擊下面對的另一難題是人才難題,“我國目前IT人員本身配備不足的現狀與大數據需要IT人員增加的矛盾更加突出,大數據對我國人才的培養模式以及現有人才的儲備提出了嚴峻的挑戰”。所以,科學技術不成熟以及技術人才的缺乏是圖書館發展面臨的重要問題。
1.2 安全問題
雖然傳統圖書館中數據和信息的傳播速度低、傳播效率不高,但是,信息處理的各個環節相對比較安全,面對大數據時代復雜的網絡環境,信息的價值因素越來越被人們重視,對于一些高價值數據的保存與利用面臨著很大的安全隱患。實際應用中,很多圖書館通過云數據共享一個或多個數據庫,信息傳播的中間環節增多,這就產生了許多信息安全問題。包括了黑客攻擊、病毒等多重原因造成的信息泄露丟失、用戶信息篡改等方面。
1.3 大數據帶來的機遇
事物的發展是一把雙刃劍,大數據的迅速發展,數據的數字化、網絡化程度增高,使得數據的處理難度增大、對技術的需求增加以及數據安全受到威脅,但是,大數據時代也給圖書館帶來了新的發展機遇。包括深入分析用戶的使用、建立新的知識服務引擎、風險評估以及數據管理等。
首先是深入分析評價用戶的使用情況,預測用戶的下一步使用。大數據可以根據用戶的使用信息來分析用戶的行為、意愿、知識服務需求以及知識能力需求,進而對其使用行為展開預測,更好地滿足用戶的需求。其次是建立新的知識服務引擎,知識引擎直接關系到圖書館能否在大數據環境下的生存,對圖書館的發展至關重要。新型知識服務引擎包括了資源推薦引擎、學術搜索引擎、用戶資源及行為智能分析引擎、分析決策預測引擎,在這些引擎中,技術引擎是圖書館信息服務的技術核心。最后是風險評估與數據管理方面,大數據可以幫助圖書館建立各類知識服務及業務建設的風險模型,也可以幫助其他群體使用客戶建立相關的風險模型,例如圖書發行的收益與評估、企業的收支風險評估等,這些都可以經過大數據分析、預測及智能輔助決策技術建立具有自身機構特色的、科學的及實用的風險模型。至于數據管理方面,大數據在提高了對圖書館數據分析要求的同時,也給圖書館帶來大量有價值、以獲取的數據,這些數據對于圖書館提高數據分析的程度與質量有重要意義。
大數據沖擊著各行各業,圖書館也不例外。面對大數據時代的爆炸時數據,圖書館的發展呈現三種可能,一種認為大數據時代的到來對圖書館的發展沒有好處,不能對圖書館的基礎業務帶來有效變革,而且變革成本高。第二種認為大數據時代給圖書館的發展注入了新的活力,對圖書館的發展只有益處,沒有害處。第三種認為大數據對圖書館的發發展有利有弊,筆者認為第三種觀點比較妥當。
大數據時代的沖擊雖然給圖書館帶來了諸多挑戰,但同時又為圖書館未來的飛速發展注入了活力,使圖書館迎來了新的發展機遇。所以,圖書館必須直面大數據時代,在認清其帶來的價值與風險的同時,科學理性地看待大數據。努力從技術、軟硬件以及管理方面入手,提高了圖書館的運作效率,爭取最大程度利用大數據給圖書館帶來的發展可能性。
管理的程度、方法決定管理的效果。面對大數據時代,圖書館的管理者必須明確科學、高效、創新的管理理念,所謂科學、高效、創新就是在研究大數據以及相關理論的基礎上科學的設定管理目標,管理的具體措施,敢于打破陳規,銳意進取地打破傳統圖書館管理中的弊端,使整個圖書館的管理定位在高效有序的環境中。
2.1 完善技術、人才方面管理
首先是技術方面,加強管理不是一句空話,面對大數據,圖書館的管理人員也就是圖書館的技術人員,科學的發展始終離不開技術與人才。面對大數據的海量數據,圖書館的工作與人員只有不斷學習、利用技術、創造技術,才能保證圖書館永遠跟上大數據的步伐。大數據時代使圖書館對技術的要求更多,包括了云技術、數據庫技術等。
圖書館管理著首先必須明確技術至上的原則,開展知識培訓、積極組織開展技術學習與技術競賽,調動人員方面的積極性。其次是可以積極引進一些數據分析模型,拓展新的業務范圍。增強對于技術的操作能力,提高圖書館的核心競爭力。
2.2 完善軟件硬件管理
大數據時代要求圖書館具有良好的軟件與硬件設施,這直接決定了圖書館對數據的處理速度與處理質量,面對這一需求,圖書館管理者可以從兩個方面入手,第一,準確評估自身,只有準確評估圖書館的發展狀況、業務范圍、資金實力以及改革的目標才能了解圖書館是否升級現有的軟件與硬件設施以及升級的方式、改革的時間、改革的具體措施等多重問題。另一方面是面對投資與收益的問題,應該考察圖書館能否在下一次技術更新之前收回投入資金,獲得效益。圖書館可以根據自身的實際需要來引入大數據中的一些分析引擎與數據庫。對于資金不足、技術能力落后的圖書館,可以考慮不自己建立數據而是以付費的方式享受云技術或數據庫。
總之,在大數據時代完善軟件硬件設施是必須,但是,如何完善就要根據自身適用于發展的需求,不可盲目跟風,浪費圖書館資源,影響圖書館發展的長遠利益。
2.3 完善數據管理
大數據下的圖書館,“通常有三種角色:大數據的使用者或受益者、大數據的提供者或開發者及大數據的運營者或維護者。”所以,針對圖書館在大數據環境下面臨的海量、復雜、難以深入分析的數據,圖書館必須要不斷完善數據管理。圖書館可以在科學評估的基礎上改變現有的圖書館信息分析模型,爭取建立多重處理信息的方式,加強對于數據的綜合處理能力,通過分析眾多資源,包括網絡資源、信息資源、服務資源、知識資源以及硬件資源來更準確、高效地分析數據以及預測趨勢。例如,圖書館可以利用云計算技術進行數據分析和處理,科學分析其企業所面臨的客觀發展優勢和威脅,預測企業面臨的風險,幫助企業建立更好地風險模型,提高用戶的使用滿意程度。大數據時代,數據的分析是重中之重,不斷完善數據管理是圖書館下一步工作的重點,也是目前學界比較關注的問題之一。
綜上所述,面對大數據時代的變化速度快、復雜性高的爆炸式增長數據,圖書館必須明確其帶來的挑戰與機遇,從完善數據管理,完善軟件硬件管理,完善技術、人才方面管理等方面入手,爭取最大限度地發揮大數據給圖書館帶來的機遇,促進圖書館的可持續發展。
[1]嚴霄鳳,張德馨.大數據研究[J].計算機技術與發展,2013(4).
[2]嚴霄鳳,張德馨.大數據研究[J].計算機技術與發展,2013(4).
[3]樊偉紅,李晨暉.圖書館需要怎樣的"大數據”[J].圖書館雜志,2012(11).
[4].張興旺.大數據時代圖書館的服務創新與發展[J].情報資料工作,2013.
G252
A
1671-0037(2014)12-54-2
胡瑋瑋(1986-),女,本科,助理館員,研究方向:圖書館學。