999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于區塊鏈技術的圖書館大數據服務研究

2020-10-10 01:45:44張雪莉
圖書館學刊 2020年9期
關鍵詞:數據庫圖書館

張雪莉

(鄭州澍青醫學高等專科學校,河南 鄭州450000)

隨著信息的增長,海量數據正以迅猛態勢,全方位進入社會生活的各個領域,引起了諸多行業的巨大變革。實現大數據驅動的智慧信息服務成為圖書館轉型變革的必經之路,圖書館需要快速、高效、準確地從海量基礎數據中提取到有用的信息資源,將用戶所需的信息以直觀和豐富的表現形式智慧化地傳遞給用戶,這給圖書館帶來了巨大的挑戰。雖然圖書館也給予大數據較多的關注,但仍然存在著諸多現實問題,許多圖書館的大數據服務處于理論研究階段,在圖書館大數據服務實際運用中所面臨的資源、技術、安全、成本、人才等方面還存在著瓶頸。區塊鏈是一種網絡技術,可以讓用戶有機會安全地共享內容或進行交易,而無需中間人或中央管理系統,它是通過去中心化和去信任的方式集體維護一個可靠數據庫的技術方案,這不僅使區塊鏈和大數據有著緊密的聯系,甚至可以說,區塊鏈將重構大數據。借助區塊鏈技術,圖書館可低成本地實施大數據戰略,解決大數據環境下服務所面臨的問題,以進一步提升圖書館服務管理質量的效率和效能,實現大數據在圖書館領域更廣泛的應用。筆者擬探討圖書館在大數據環境下的瓶頸問題,闡述區塊鏈技術如何與大數據技術互補,并解決這些問題。

1 圖書館大數據概述

大數據(big data)是指規模巨大,在合理時間范圍內無法用常規軟硬件設備進行獲取、處理和管理的海量數據集合,這些大數據包括結構化、半結構化以及非結構化的數據,大數據通過深層分析和價值挖掘可以獲得洞察和決策的能力。它具有Volume(海量性)、Value(高價值)、Variety(多樣性)三大特征。隨著圖書館信息化、智慧化、數字圖書館建設進程的加速,圖書館數據也初步具備了大數據特征。圖書館大數據主要包括資源數據、用戶數據、感知數據[1],這些數據量大且增長迅速,僅以資源數據為例,平均每所高校圖書館的館藏資源記錄已接近1500萬條,并且每日都在增加。同時圖書館數據類型繁多,既包括了結構化的數字圖書館資源,也包括了非結構化圖書館感知數據以及讀者個人數據等,數據類型包括了音頻、視頻、圖片、位置信息、設備使用數據、監控數據等等,這些多類型的數據對圖書館數據處理能力提出了更高要求。圖書館大數據同樣具有較高的價值,大數據在圖書館領域可以被運用到讀者行為識別與串聯、讀者信息與服務需求預判、圖書館運行狀態描述、資源建設成效評估和文獻資源配置優化、圖書館管理助力等[2]。

2 大數據環境下圖書館面臨的現實問題

對信息數據的收集、處理、存儲、分析、利用,這是大部分現有的信息數據管理均遵循的流程,而大數據環境下圖書館在這一流程中也面臨著諸多的困境,例如數據收集、數據存儲、數據利用等技術方面的制約,也會受到如知識產權等法律方面的制約,具體如下所述。

2.1 數據源的問題

圖書館作為信息機構,收集、整合和共享資源是其根本任務,然而在實際工作中圖書館數據源的收集上卻存在著瓶頸問題,首先是數據源的完整性問題,它要求圖書館不能有漏收和間斷情況出現,但由于受到經費、渠道等因素的制約,圖書館并不能保證完整而系統地收集數據。一方面圖書館希望獲得更多更好的數據源進行深度挖掘,而另一方面雖然數據開放和共享是大數據時代的核心精神,但當前各個數據庫開放程度低,而數據庫商對于數據的共享猶豫不決,相關數據庫存在著壟斷現象,圖書館大數據中心在建設和使用過程中面臨著信息孤島、數據封閉、數據分享動力不足等實際問題,圖書館在與數據庫商的談判中往往處于劣勢,付出高昂成本。其次是數據可信度問題,圖書館數據本身往往被視為“可靠數據”,但實際上圖書館數據來源的不可追溯以及以中心存儲的方式也使得數據可以被修改,而無法證明其有效性,不利于科學研究。如圖書館書目數據的來源包括聯合編目、編目外包等等,書目數據的質量不能得到有效控制,影響了文獻的利用水平和讀者的時間成本。以上可以看出,在圖書館數據資源開發中,數據完整獲取存在困難,底層數據的缺失和混亂,使其數據的利用和分析也就缺乏基礎。

2.2 數據存儲的問題

大數據環境下,知識的存儲是圖書館的基本責任,國內數字圖書館建設的熱潮下,數字資源建設速度逐年遞增、規模急劇擴大、種類日益豐富,構建了海量的分布式數字資源庫群、大規模元數據和關聯數據群。而圖書館在數據存儲上的痛點主要包括數據量巨大,且不同類型的異構數據的存儲方式和數據格式也大相徑庭,圖書館傳統的單一形式的集中式的計算機系統面對如此龐大的數據量和異構數據,無論是儲存能力還是計算能力都難以勝任,而受到技術瓶頸和經費短缺的限制,大多數圖書館要想全面升級換代現有數據庫和提高現有存儲容量是不可能的。其次圖書館不同類型的數據的使用有著不同性能要求、不同容量要求,這些需求隨時會發生改變,需要有效地管理和按需分配存儲資源以提高利用率。這給圖書館基礎設施帶來了極大的壓力,由于成本的制約,越來越多的圖書館將應用由高端服務器向中低端硬件構成的大規模計算機集群轉換[3]。

2.3 數據安全的問題

圖書館需要存儲的大量數據還面臨著包括數據丟失、隱私泄露以及黑客攻擊等安全問題。一般來說,圖書館存儲著大量的讀者個人數據,其中不乏身份證號、學號、手機號、電子郵箱、讀者借閱信息、讀者閱讀行為數據等敏感數據,而對這些敏感數據的使用因易侵犯讀者個人隱私而存在很大的法律風險。圖書館對用戶個人信息的數據監控不能實時進行查看,日常安全防護管理不能有效進行。同時,圖書館存儲的數據需要保證數據不被丟失或者遭受攻擊造成的數據泄露,而沒有訪問權限的訪問者、第三方甚至黑客可能非法入侵、訪問、修改、下載和刪除相關信息,存儲的數據出現安全風險的幾率加大。

2.4 數據知識產權的問題

大數據環境下,圖書館也會面臨數據的知識產權問題,例如高校圖書館對本校特色和優勢學科,利用網絡數據自動抓取工具獲取感興趣的數據資源,自己構建該學科的文獻數據庫,完成數據的收集,可能會造成對下載作品的復制權、匯編權侵權,對館藏文獻數字化造成的著作權糾紛[4],網絡來源的數據也難以確權,造成著作者知識產權保護的困難。此外,圖書館自建數據庫將他人作品數字化也會可能會構成知識產權的問題,出于知識產權保護的原因,有些圖書館自建數據庫沒有完全對外來機構或個人開放,只在限定范圍內提供給讀者使用,或是根據資源的安全級別和其他使用限制,不同圖書館相互訪問數字資源也存在信任壁壘。以上種種原因都說明了圖書館在知識產權上存在的問題。

2.5 數據利用的問題

大數據功能實現的基本方法是通過對數據分析獲取所需要的信息,大數據技術發展很快,很多先進的大數據技術,如針對非結構化大數據處理的Hadapt數據庫等被開發出來,技術上的障礙主要表現在先進的大數據技術無法全部或部分在圖書館大數據中運用上。大數據分析是一項技術含量很高的工作,要求數據分析人員不僅要懂技術,還要精通圖書館業務,并具有靈活的思維能力和很高的信息意識,但很多圖書館都缺乏這樣的復合人才。圖書館受人才、經費和軟硬件條件的制約,很難將大數據技術全部引進并應用到大數據管理和數據挖掘中,而這對圖書館大數據功能發揮的影響是非常直接的,技術跟不上很難保證大數據功能得到充分實現。數據種類的多樣化給圖書館傳統常規分析帶來了極大的挑戰,大量的異構數據處理與分析需要有新的突破。其次,現有的圖書館之間的數據往往是各自創建和維護,彼此之間并沒有共享數據,即便是圖書館聯盟之間也是如此,這給數據利用也帶來了諸多不便。

3 區塊鏈對圖書館痛點的改進

3.1 區塊鏈概述

區塊鏈(BlockChain)是現代信息社會最前沿的技術之一,也是繼大數據、云計算、物聯網之后的又一項顛覆性技術。區塊鏈概念是2008年由Satoshi Nakamoto提出的,用于創建“純粹的點對點的電子貨幣”,區塊鏈技術的首次成功應用是比特幣加密貨幣,比特幣系統記錄了誰擁有比特幣,流通重每個比特幣的支付歷史,支持比特幣的系統因為同樣適用于其他領域而受到關注。從根本上來說,區塊鏈本質上是一個分布式數據庫,區塊鏈中每個用戶可以在這里讀取和寫入數據庫交易,沒有第三方來檢查這些交易,區塊鏈有一個內置的共識機制,可以檢查交易以確保它們的安全,由于區塊鏈采用一種單向哈希算法,傳遞的事務得到哈希,基本上,分配了一個標識事務的數字指紋。那些經過驗證的事務然后被組合成一個塊,該塊被分配了自己的哈希值。該哈希成為下一個事務塊的第一個哈希,將它們鏈接在一起。在正常情況下,區塊鏈理論上可以為我們提供一個值得信賴的良好交易數據庫,而無需人或機構進行干預以驗證這些交易。區塊鏈的主要特征可歸納如下:

①具有分布式結構。經驗證的交易信息作為塊生成并存儲在區塊鏈中,它是分散的數據分發存儲系統。此時,數據被復制并存儲在分布式節點中,而不是存儲在中央服務器中。由于所有節點都具有相同的數據,因此可以在不通過中央服務器的情況下直接在個人之間進行交易。任何人都可以參與系統,參與系統的所有節點共享相同的數據。

②數據難以被篡改。塊與前一個塊的哈希值鏈接在一起。如果數據被任意改變,則連接塊的哈希值將改變,并且在系統中不被識別。因此,幾乎不可能更改數據,因為所有節點都必須立即更改數據。區塊鏈作為可靠的分布式數據存儲技術受到了密切關注。區塊鏈是一種用于在不使用中央服務器的情況下將復制數據存儲和分發給參與系統的所有節點的技術。幾乎不可能對記錄進行任何更改,因為區塊鏈會不時地比較每個節點的數據以查找更改的部分。因此,區塊鏈保證了數據的完整性,并且可以保持永久記錄。

③智能合約實現了自動化和高效的工作流程。用戶可以通過簡單創建嵌入在區塊鏈中的腳本來創建應用程序。由于可以在線完成合同,因此它是有效的,因為它可以克服位置限制并用代碼替換合同所需的文檔和簽名。最重要的是,如果滿足預先編寫的代碼的條件,則自動執行合同以便可以快速處理業務。

3.2 區塊鏈對圖書館大數據服務的重塑

區塊鏈與大數據有著天然的關聯性,區塊鏈和大數據相互協作、相互推進,可以讓大數據更加活躍起來,從數據源、數據存儲、數據安全、數據知識產權以及數據利用上改善圖書館大數據服務,如表1所示。

表1 區塊鏈對圖書館數據服務的重塑

3.2.1 區塊鏈對圖書館數據源的改善

區塊鏈技術的分布式結構、數據難以被篡改以及智能合約實現自動化和高效化等特性,使得圖書館可以突破數據收集的瓶頸,在數據來源方面,可信任、安全的區塊鏈使得更多的數據被解放出來,圖書館得以獲取更多的數據。其次,區塊鏈技術在時間維度生成、傳播的完整鏈條,使得數據交易可以在不同主體之間直接進行,基于智能合約技術的區塊鏈使得圖書館可以直接從出版機構,甚至從作者處采購相關數據,從而打破原有的必須從數據庫商處購買數據的傳統方式,并且,也突破了數據庫商各自開發所造成的數據孤島現象。最后,由于區塊鏈的數據是可追溯的,任何一條數據的記錄都可以留存在區塊鏈上,一旦數據被寫入,區塊鏈對數據的準確性和質量負責,這就使得進入鏈中的數據質量得到保證,從而改善數據的來源和質量問題,保障數據收集的完整性和可信度。

3.2.2 區塊鏈對圖書館數據存儲的改善

區塊鏈本身可以看成是一套由多方參與的、可靠的分布式數據存儲系統,其獨特之處在于:一是記錄行為的多方參與,即各方可參與記錄;二是數據存儲的多方參與、共同維護,即文件的分散存儲。區塊鏈可以通過向人們提供具有貨幣價值的代幣來激勵人們托管數據,使得數據的存儲比集中式存儲或維護自己的服務器的方案更加便宜而得以改善。數據在P2P網絡上進行分片、加密、復制和分發。存儲數據的節點通常會因在網絡上托管數據而獲得加密貨幣補償。為了確保數據在需要訪問時是可用的,并確定節點的正常運行時間,可以要求存儲節點提供抵押品,由智能合約來保證和觸發,數據不可用時可以要求抵押品。這些節點的分布式特性還具有使分散存儲具有高度可擴展性的優勢。目前,國外的Storj.io和Sia.tech是兩種可用的區塊鏈存儲產品。據報道,Sia的分散式云存儲成本平均比現有云存儲提供商低90%;在Sia上存儲1TB文件的成本約為每月兩美元,而亞馬遜網絡服務的S3服務則為23美元。相信今后還會有更多的同類的區塊鏈存儲產品。這使得圖書館的部分存儲需求可以放到更加具有性價比的區塊鏈存儲產品上,從而改善圖書館數據存儲的技術和經費瓶頸的限制。

3.2.3 區塊鏈對圖書館數據安全的改善

各類型的數據是圖書館的重要資產之一,區塊鏈在數據安全上有著特有的優勢,區塊鏈對數據的安全性表現在以下幾個方面:①加密和驗證。區塊鏈平臺對數據進行加密,這意味著修改數據是一項艱巨的任務,這將為用戶提供一種確保文件不受篡改的方式,而無需將整個文件保存在區塊鏈上。由于其分散的性質,始終可以在網絡中所有節點上的所有分類賬中交叉檢查文件簽名,并確認它們沒有被更改,如果有人確實更改了記錄,那么簽名將變為無效。②分散式數據保護方式。由于區塊鏈技術本質上是分散的,因此它不依賴于一個中央控制點,使系統更公平、更安全。它是每臺擁有完整數據副本的計算機的交易數字分類賬。區塊鏈不依賴中央機構與其他用戶安全地進行交易,而是利用跨節點網絡的創新共識協議,以可靠的方式驗證交易和記錄數據。由于區塊鏈是信息的分類賬,因此存儲的信息真實、準確非常重要。由于數據保存在多臺計算機上,因此即使一臺或兩臺計算機出現故障,也可以確保數據的高度安全。③黑客難點。區塊鏈是包含交易記錄的數字“塊”鏈,每個塊都連接到它之前和之后的所有塊,盡管黑客可以闖入傳統網絡并在單個存儲庫中找到所有數據并對其進行泄漏或破壞,但區塊鏈使這變得難以實施。這使得圖書館所存儲的數據不可篡改、丟失以及被攻擊,從而保證了圖書館的數據的安全。

3.2.4 區塊鏈對圖書館數據知識產權的改善

區塊鏈還可以被應用到數據知識產權的保護上,這對圖書館來說也可以解決原有模式的瓶頸。區塊鏈是公開顯示的可信分類賬,使用區塊鏈建設的數據庫可以通過將哈希值安全地放在區塊鏈上來保護所有類型的知識產權,例如數據、文本、圖像、音樂、視頻、代碼、3D資產、網站或商業秘密,使得任何數據所有者可以安全共享和出售其作品和敏感信息,通過構建允許用戶存儲和交易數據的區塊鏈,知識產權所有者和最終消費者都將從中受益,知識產權所有者可以通過防御性出版來保護發明和科學發現,并確保其他使用和消費者在研究過程中能夠快速訪問此信息。在所有權發生爭議時,交易的時間戳可以作為證據在法庭上使用。圖書館完全可以通過區塊鏈拓展資源渠道,建設用戶生成知識資源的區塊鏈,從而徹底解決版權問題。

3.2.5 區塊鏈對圖書館數據利用的改善

區塊鏈對圖書館數據利用上也能提供一定的改善,首先是數據的透明和共享使得利用更加方便。以往的數據是封閉的,區塊鏈智能合約的使用允許不同的組織通過由智能合約編寫的一組已批準和共享的業務規則來共享數據的控制。允許其控制誰可以通過區塊鏈訪問其數據。使得圖書館之間所收集的數據以一種安全可行的方式共享,需要使用數據的一方可以發起數據事務請求,請求數據生成器提供數據使用權,從區塊鏈獲得授權的數據集,這就打破了以往的“數據孤島”的壁壘。其次,區塊鏈有助于創建一個系統來管理被稱為分類賬的內容塊,信息分析是安全且自動化的,通過將數據分析的算法集成到區塊鏈中,使得數據的分析和利用自動執行,Omnilytics就是將區塊鏈與大數據分析相結合的平臺,使用人工智能和機器學習來大大提高數據處理速度和質量。最后,區塊鏈還可以用于徽章來促進館員所需的證書或培訓,以大大地增強館員的素質,從而提高數據的利用。

猜你喜歡
數據庫圖書館
圖書館
文苑(2019年20期)2019-11-16 08:52:12
時間重疊的圖書館
文苑(2018年17期)2018-11-09 01:29:40
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
數據庫
財經(2017年15期)2017-07-03 22:40:49
數據庫
財經(2017年2期)2017-03-10 14:35:35
飛躍圖書館
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
去圖書館
主站蜘蛛池模板: 在线免费观看AV| 国产精品自在自线免费观看| 国产精品9| 国产性生交xxxxx免费| 精品国产成人a在线观看| 在线免费亚洲无码视频| 女同国产精品一区二区| 国产精品成人啪精品视频| 国产va在线观看| AV无码无在线观看免费| 国产女人在线观看| 亚洲中文字幕无码mv| 激情综合五月网| 成人小视频在线观看免费| 动漫精品中文字幕无码| 国产精品成| 青青青国产视频| 久久国产热| 日韩成人高清无码| 欧美第一页在线| 色噜噜狠狠色综合网图区| 亚洲综合专区| 亚洲免费黄色网| 91人人妻人人做人人爽男同| 国产精品伦视频观看免费| 2020极品精品国产 | 国产成人h在线观看网站站| 人妻无码中文字幕一区二区三区| 91福利国产成人精品导航| 久操线在视频在线观看| 亚洲人成在线免费观看| 2021国产在线视频| 国产在线观看一区精品| 丁香婷婷在线视频| 亚洲视频免| a欧美在线| 丰满的熟女一区二区三区l| 国产伦精品一区二区三区视频优播| 美女亚洲一区| 日本日韩欧美| 国产国语一级毛片| 丁香婷婷综合激情| 五月婷婷导航| 欧美国产中文| 26uuu国产精品视频| 欧美成人午夜视频免看| 国产成人三级在线观看视频| 青青久久91| 日韩精品无码免费一区二区三区 | 欧美精品1区| 欧美一级高清免费a| 曰AV在线无码| 亚洲成人动漫在线观看| 久久永久免费人妻精品| 国产成人欧美| 欧美午夜视频| 日韩成人在线视频| 日韩成人午夜| 日韩大乳视频中文字幕| 很黄的网站在线观看| 污视频日本| 精品欧美一区二区三区久久久| 国产成人精品优优av| 亚洲精品色AV无码看| 亚洲三级视频在线观看| 无码又爽又刺激的高潮视频| 久久性视频| 亚洲美女久久| 亚洲精品无码专区在线观看| 亚洲无限乱码| 久久久久88色偷偷| 亚洲国产欧美目韩成人综合| 97亚洲色综久久精品| 中文字幕永久视频| av一区二区三区高清久久| 欧美亚洲一二三区| 91丨九色丨首页在线播放| 麻豆国产精品视频| 波多野结衣视频网站| 国产喷水视频| 六月婷婷激情综合| 亚洲综合天堂网|