付佳 石丹 閆實
摘 ?要: 大數據時代對于圖書館的建設來說是具有時代意義的,其面臨著時代賦予的挑戰和機遇。融合多種數字傳媒,擴大數字圖書館的建設顯然成為了目前圖書館建設的主流方向。數字資源共享、數字出版物、數字傳媒、多媒體、互聯網、云計算、大數據等信息特征必然的成為了數字圖書館的標簽。然而,融合帶來的問題是資源的種類多元了,但是對于圖書館的發展是服務于特定群體的。而讓融合不改變圖書館本質的則是利用了大數據的分析技術,建立數字圖書資源的分析評價模型,模型保持了圖書館的特征,讓傳統圖書館在不改變本質的條件下載數字空間中展現全新的面貌。
關鍵詞: 數字圖書館;圖書資源融合;數字圖書評價;大數據分析
中圖分類號: TP3 ? ?文獻標識碼: A ? ?DOI:10.3969/j.issn.1003-6970.2020.06.015
本文著錄格式:付佳,石丹,閆實. 大數據背景下圖書館數字資源融合及評價研究[J]. 軟件,2020,41(06):7173+90
【Abstract】: Big data era is of great significance to construction of library, which brings challenges and opportunities of times. Integrating various digital media, expanding construction of digital library has become mainstream direction of library construction. Information characteristics of digital resources sharing, digital publications, digital media, multimedia, Internet, cloud computing, big data has been bound to become labels of digital libraries. However, problem brought by integration is resources types are diverse, but library serves specific groups. Essence of library is to use analysis technology of big data and establish analysis and evaluation model of digital book resources, which integration can not change. The model maintains characteristics of library and enables traditional library to show new face under condition of downloading digital space without changing its essence.
【Key words】: Digital library; Book resource integration; Digital book evaluation; Big data analysis
0 ?引言
大數據時代對于圖書館的建設來說是具有時代意義的,其面臨著時代賦予的挑戰和機遇。傳統的圖書館已經經歷了信息時代的變遷,從傳統的圖書館到信息化圖書館,再到信息檢索技術的發展,數字圖書館的圖書索引系統的發展,數字圖書館已經將圖書館這個范圍擴大到了圖書共享和互聯網絡結合的巨大環境下。而融合多種數字傳媒,擴大數字圖書館的建設顯然成為了目前圖書館建設的主流方向。然而,融合帶來的問題是資源的種類多元了,但是對于圖書館的發展是服務于特定群體的。例如高校圖書館主要服務于科研和教學,如何科學合理的融合數字圖書資源、網絡資源、媒體資源是資源融合關鍵問題。而融合前對資源的評價是其融合過程中的科學方法體現[1]。
圖書館的核心是圖書,而圖書的選擇是需要以滿足服務人群為目標的,也就是閱讀人群的導向決定了圖書館。而數字圖書館的圖書是數字出版物和數字媒體,其范圍要比傳統圖書館寬廣很多。傳統的“訪”與“采”模式建設圖書館,已經無法適應當前的數字圖書館建設,因此數字圖書館面對的人群從線下走到了線上,傳統的面對面“訪”的模式發生了本質變化。而傳統“采”的模式主導方是由圖書館管理者決策,而線上模式圖書的共享、數字出版物和數字資源的多元化讓“采”的模式變的模糊了。在新的模式下數字資源和傳統圖書的融合成為了趨勢,數字資源的評價體系決定了“采”的方向。
1 ?大數據環境下的數字圖書館
隨著時代的發展,數字時代下的傳統媒體運營,已經把數字化建設作為其底層基礎。而傳統的圖書館也逐步將線下搬移到線上,因為其用戶群體越來越傾向于電子媒體,移動閱讀,快速搜索的使用習慣。人們的時間被越來越多的事務打散成了若干的時間片段,然而傳統的圖書館需要在固定時間到達固定地點,并且需要在圖書館停留很長時間進行圖書的檢索、借閱、閱讀、歸還等操作。這顯然不符合當前的用戶使用習慣,數字化遷移和融合成為了圖書館在大數據時代轉型的關鍵。圖書館的建設必須面對數字化、移動化、社會化、智能化的挑戰,同時與傳統圖書館模式相比數字化后產生的大量數據處理和分析能力,也決定了圖書館轉型的效果[2]。
比較基礎的數字化方式,是直接將圖書館的紙質藏書通過掃描儀轉換為圖像資料,在利用ORC(optical character recognition)文字識別技術識別,并人工校對和加工保留紙質資源的文本和版式,輸出元數據。最后,按照標準的電子圖書格式打包成電子書。由于這項工程進行的比較早,截止到目前大部分的紙質圖書、期刊、論文、文獻資料已經被數字化,新增的各類紙媒也通過數字化進行存儲和流轉。有了這項基礎工程,讓數字圖書館誕生具有了先決條件,但是隨著數字化的數量和規模的增長,每天將產生TB的數據規模,這讓傳統紙媒時代的圖書館管理措手不及。尤其是在數字資源以源的形式共享、發布就成了網絡式爆炸增長,規模呈幾何增長,并且其數據以非結構化的形式出現,如:圖片、圖像、音頻、視頻、地理位置信息、文本、符
號等等多元化的非結構化形式,而這些正是資源數字化的大數據特征。數據規模大,數據形式多樣,數據來源多元,而這些形式的數據據不完全統計目前非結構化數據已占數據總規模的80%以上。
以往圖書館會根據文獻建立文獻數據庫,這是早期圖書館信息化的產物,也是對傳統圖書館操作流程的信息化再造過程,而其本質依舊是傳統圖書館的管理模式,忽略了大數據時代下的數據多元化,數據海量化的特征。顯然,對于上述文獻數據庫以外的資源如何采集、處理、存儲、挖掘和服務還沒有形成管理思路,面臨大數據的調整采用何種技術作為手段也沒有面對措施。大數據時代下的圖書館,數據的產生是自然發生的,是基于共享、社交、網絡化產生的,而不僅僅是圖書館運營的業務數據和圖書信息本身。這是觀念的轉化,但不是本質的轉化。圖書館在大數據時代運營,需要從三個方面構建。第一,需要保留圖書館本身的特色,通過特色資源的數字化運營,利用大數據分析手段分析用戶特征和資源趨勢動態的適應。第二,數據的處理觀念要向數據挖掘、數據分析、數據再生等發掘信息價值的手段靠攏,通過海量信息產生對運營圖書館提供決策支撐。第三,以讀者為核心,研究讀者在閱讀過程中的使用數據和讀者的社交數據,以精準化、個性化服務為目標,充分利用數據,讓大數據成為圖書館管理的血液。這就需要建立讀者模型,以網絡化的結構分析用戶的趨勢、取向、習慣,從而為讀者設計更為針對性的閱讀產品,營造更定制化的閱讀分為,甚至引導用戶。
2 ?數字圖書館資源融合模式
以大數據為特征的數字圖書館建設帶來的必然產物是數據的多元化,將多元的數據融合、整合、加工和處理是數字化圖書館的重要工作之一。面向用戶的精準化定制服務,是傳統紙媒所不具備的,而這也是數字圖書館信息融合所能夠做到的。在進行數字化融合的探索過程中,可以參考“互聯網+”時代的其他產物。例如微博、微信、訂閱號、微信應用、移動社交、資源分享等用戶活躍的產品進行定制和創新。通過分析這些產品,可以發掘一個共同的特征,就是以滿足個性化需求為目標的“微”應用。傳統圖書館就像傳統的應用程序一樣是通用性較強的“宏”應用,缺乏個性化和定制化。隨著移動互聯網的發展,用戶的連續時間越來越少,片段化的時間成為了常態。顯然一個通用化的“宏”應用是無法滿足每一個用戶的。因此,圖書館的 ?數字資源融合模式應該是面向用戶特征的“微” ?應用[3]。
微應用的特點就是個性化、細微化、差異化,這是符合圖書館數字化建設目標的。圖書館數字化后,必然擁有了大量的用戶數據,根據用戶數據可以很好的量化分析,也可以根據圖書館自身建設需要定性分析,構成多維的用戶分析體系。根據用戶的閱讀習慣、閱讀過程數據、興趣點遷移、資源分享特點等信息建立用戶模型。通過用戶模型為支撐,針對用戶做數據融合。例如高校圖書館,以滿足科研和教學為目標,而高校本身的建設特色也決定了科研領域和教學重點。這些目標是可以通過建立用戶模型挖掘的,因為用戶本身就代表了高校的科研和教學方向,從而確定了數據資源的融合方向[4]。
從融合的基礎設施建設的角度來看,要滿足個性化、定向化的建設就需要依托云計算、大數據并與微服務技術體系結合。數字圖書館可以建設在云端,根據建設階段和數據融合的規模逐步擴大計算資源,充分利用云計算的彈性計算特征和可擴展計算邊界的能力以滿足建設運維一體化的構建思路。在大數據的處理方面發揮以Hadoop為基礎的各種數據處理套件,在融合數字資源的同時,可以更加豐富的滿足數字圖書的分布式存儲、非結構化存儲、高效的索引模式、信息檢索的基礎支撐等特征。而所有個性化的“微”應用則需要搭建在以微服務為代表的系統框架中。通過容器技術,讓系統可以隔離底層的部署環境,可以更好的劃分微服務單元建設更細的服務粒度,滿足更為個性的需求。例如可以根據閱讀習慣,定義手機終端用戶、PDA終端用戶等符合各類用戶習慣的微應用。
圖書館數字融合,一方面是建立在對用戶模型的分析上,圍繞用戶特征建設有特色的圖書館資源,另一方面需要大數據、云計算和微服務等支撐技術構建“微”應用滿足用戶的使用需求[5]。
3 ?融合價值評價
圖書館的評價一般包含服務質量評價、印刷館藏評價、綜合評價、構建圖書館整體評價指標體系、圖書館績效評價、電子資源評價和用戶服務評價七大主題。而數字圖書館如何評價,顯然不能直接套用上述主題。因為數字圖書館是建立在數字資源和虛擬空間上的產物,其底層的技術是大數據、云計算、微服務、數字融合、數據分析等信息技術環境下的。數字化可以很方便的收集統計數據,或者針對性的收集個性化數據,做到定量評價,而定量評價難免出現數據偏見導致評價系統坍塌,結合定的分析可以讓評價系統穩健又可以保留圖書館的特色和定位,兩者結合的關鍵是對評價主體的研究[6]。
數字圖書館的評價從根本上講是對其價值判斷的過程,一方面是服務價值,另一方面是圖書館的導向性價值。評價的目的和結果應該是以改進和適應數字圖書館建設和發展為出發點的。那么可以綜合的從數字資源總庫進行分析和歸納圖書館的資源評價視圖,從用戶模型進行分析和判斷服務質量,還可以從更多維度挖掘。例如可以通過系統的用戶評價、服務打分、借閱質量、文獻檢索效率、服務響應效率、國內外綜述、知識管理質量等多維度多指標進行評價。可采用的分析算法可以是libQUAL+,SERVQUAL、層次分析(Analytic Hierarchy Process,簡稱AHP)、網絡分析法(The Analytic Network Process,簡稱ANP)、用戶滿意度指數評測發(Customer Satisfaction Index,簡稱CSI)、模糊數學評價法、卡若模型、灰色關聯分析等。這些算法可以通過微服務接口獲取基礎支撐數據,在以Hive為底層的數據查詢服務,結合多維聯機數據分析技術實現分析結果。再通過大數據和數據可視化技術通過多個維度的呈現,可以更為直觀的評價數字圖書館的融合質效。從而改善數字圖書館的管理質效,具有社會教育功能、認知功能、導向功能、激勵功能和心理功能,促進圖書館的良性發展[7-8]。
4 ?結語
數字圖書館雖然是由傳統圖書館演進而來的,但是數字圖書館的誕生本身是在信息時代的產物。數字資源共享、數字出版物、數字傳媒、多媒體、互聯網、云計算、大數據等信息特征必然的成為了數字圖書館的標簽。分布式異構平臺讓應用之間互聯互通,讓數字圖書館打通了信息隔離構建共享型的數字圖書館雖然讓數字資源豐富了,但是給圖書館的管理帶來了問題。本文通過信息融合給傳統圖書館在數字時代賦予了新的價值,同時建立數字資源的評價體系讓數字圖書館即保留了傳統圖書館的傳媒偏好特征又利用到了新技術帶來的心機遇。融合離不開云計算作為技術支撐,利用云計算讓大量的紙媒數字化,豐富了紙媒的內涵。融合還讓紙媒在數字共享中產生了新的價值。而讓融合不改變圖書館本質的則是利用了大數據的分析技術,建立數字圖書資源的分析評價模型,模型保持了圖書館的特征,讓傳統圖書館在不改變本質的條件下載數字空間中展現全新的面貌[9-10]。
參考文獻
[1] 賀曉利, 郝艷紅, 白葆紅. 中國圖書情報學核心期刊的發展態勢研究——基于核心期刊的多指標比較分析[J]. 農業圖書情報學刊, 2014, 26(10): 165-172.
[2] 唐婷, 周沙莎. 高校圖書館聯盟服務與數字資源建設研究——以湖南省高校數字圖書館為例[J]. 圖書情報導刊, 2019, 4(01): 1-6.
[3] 郭亞珍, 許學軍. 我國金控銀行與非金控銀行的經營績?效比較——基于多維面板數據的因子分析[J]. 金融經濟,?2013(12): 112-114.
[4] 歐陽功成. 分析大數據時代高職圖書館數字資源推廣的創新路徑[J]. 數字通信世界, 2018(12): 278.
[5] 徐衛江. 分析比較高校圖書館圖書采訪模式[J]. 現代情報, 2006(03): 129-132.
[6] 王險峰. 數字化轉型背景下黨校圖書館學科數字資源整合研究[J]. 河南圖書館學刊, 2018, 38(11): 135-137.
[7] 宋春勝, 張志杰, 梁世民. 圖書館數字資源統計系統研 ? 究——以廣西壯族自治區圖書館為例[J]. 河南圖書館學刊, 2018, 38(10): 116-118.
[8] 吉宇寬. 圖書館數字資源永久保存權保障策略研究[J]. 圖書館建設, 2018(08): 22-27.
[9] 蘇金燕. 我國高校圖書館數字資源采購價格與經費現狀分析[J]. 大學圖書情報學刊, 2018, 36(04): 66-76.
[10] 李麗娟. 基于云計算的圖書館云服務模式研究[J]. 軟件, 2014, 35(03): 174-175.