趙丹僖 雷鳳雪

摘? 要:以廣西生態工程職業技術學院圖書館為例介紹口述歷史數據庫的收藏范圍和途徑,分析了建設過程中面臨的資源存儲擴容不易、資源可信度不高和知識產權明晰困難等問題,利用區塊鏈技術的去中心化、不可篡改、安全可信等特性,提出融入區塊鏈技術的口述歷史資源庫模型,由數據采集分析、數據組織整理、數據儲存發布、數據共享使用四個功能模塊組成,實現了保障數據安全、提高資源存儲的功能。
關鍵詞:區塊鏈;口述歷史;資源建設;數據庫模式
中圖分類號:TP391;G250? ? ? 文獻標識碼:A 文章編號:2096-4706(2020)09-0169-03
Research on the Construction of Oral History Resource Base Based on Blockchain
ZHAO Danxi,LEI Fengxue
(Guangxi Eco-engineering Vocational and Technical College,Liuzhou? 545004,China)
Abstract:Taking the library of Guangxi Eco-engineering Vocational and Technical College as an example,this paper introduces the collection scope and ways of oral history database,analyzes the problems faced in the process of construction,such as the difficulty in expanding the storage capacity of resources,the low credibility of resources and the difficulty in clarifying intellectual property rights,etc.,and puts forward the oral history integrated into the blockchain technology by using the characteristics of decentralization,non-tamperability,security and credibility of blockchain technology. An oral history resource base model integrated with blockchain technology is proposed,the resource base model is composed of four functional modules:data collection and analysis,data organization and arrangement,data storage and release,data sharing and use,which realizes the functions of ensuring data security and improving resource storage.
Keywords:block chain;oral history;resources construction;database schema
0? 引? 言
口述歷史研究主要是對無文字社會研究的敘述以及對老一代歷史親歷者的史料采集,因為沒有這些史料的收集將無法構建社會的原貌,乃至無法傾聽底層社會的聲音,無法記錄見證者獨有的情感體驗和生命感悟[1]。在我國悠久的歷史長河中,口述資源十分豐富,但研究和利用卻不多。目前,許多公共圖書館越來越重視口述歷史的價值,投入大量人力和財力對口述資料進行保存,這對保存人類歷史記憶起到重要作用。然而目前我國口述歷史資源庫建設中面臨制度不合理、技術力量不夠等諸多問題。本文以廣西生態工程職業技術學院圖書館在建設口述歷史數據庫的過程中面臨諸多問題進行分析,探索區塊鏈技術下口述歷史資源庫的建設模型,為圖書館資源建設提供新的思路。
1? 建設口述歷史資源庫的范圍和途徑
廣西生態工程職業技術學院將口述歷史資源作為圖書館資源建設的重要組成部分,近些年投入大量的人力財力對口述歷史數據庫進行建設,目前將口述歷史資源收藏范圍定位為反映抗戰時期沙塘鎮農林業發展的各類型資料。
1.1? 明確收集資源的范圍
由于廣西生態工程職業技術學院所處的廣西柳州市沙塘鎮,在抗戰時期是大后方,當時的沙塘鎮匯集了各地的農業專家學者、名人教授,如馬保之、馮堂、孫仲逸、汪振儒等,他們對中國農林業發展、對抗戰后方的生產建設具有重要意義。目前圖書館主要收集以下三種類型資源:一是抗戰時期沙塘鎮生產生活情況,二是著名農業學家在沙塘鎮進行的教學生產情況,三是抗戰時期當地口述文學作品。
1.2? 多方協作收集資源
為了廣泛收集、深入挖掘口述歷史資源,圖書館吸收借鑒了其他圖書館的成功經驗,形成以廣西生態工程職業技術學院圖書館為主、學校其他部分為輔、聯合廣西農科院桂中分院等相關單位通力合作的收集模式。首先,以歷史學、圖書館學、農林業等相關專家的建議為基礎,明確口述歷史資源的收集類目。其次,從各單位抽調人員,以收集內容為導向確定訪談人員和訪談提綱,接著利用錄音錄像等設備記錄對相關人員的訪談,然后按照文獻編目規則與機讀目錄格式對采訪內容進行組織、揭示,并存入口述歷史數據庫。
2? 圖書館建設口述歷史資源庫存在的困境
2.1? 資源存儲的問題
口述資源采集中,首先被采訪者要先填寫自身信息,再對自身經歷進行敘述。采訪者一般采用錄音或者視頻等方式進行采集,采集后的資料就是原始素材,作為還原歷史的元數據進行保存存檔。然后加工人員對素材進行粗整理,刪除掉不含有效信息的視頻片段,根據主題進行分段剪輯,之后才是將口述資料整理成文字稿,然后再整理成元數據保存存檔。整理工作結束后,視頻資料以高清格式、圖片資料以高像素形式上傳,電子文檔和紙質文檔進行掃描分類上傳服務器進行備份[2]。隨著各學科領域對口述歷史的青睞,口述資源數量得以成倍數增長,如何對大量口述資源的原始資料和加工整理后的資料進行保管成為采集者要面對的問題。
2.2? 資源共享問題
口述歷史資源庫建設作為口述資源開發與利用的基礎,目前已得到社會各界的重視。清華大學圖書館對周本初等知名學者進行訪談,以視頻的方式構建了名人口述歷史資源庫;汕頭大學圖書館構建了潮汕口述文獻數據庫;湖南圖書館構建了紅色記錄口述資源庫;國家圖書館啟動的“中國記憶”就是依托口述文獻和影像文獻的數據庫。但調查顯示,很多圖書館口述文獻資源庫僅提供瀏覽訪問服務,并不能下載使用資源。在信息時代,廣大用戶對口述資源需求增強,實現資源共享可以提高圖書館影響力和群眾的滿意度。
2.3? 版權保護問題
口述歷史資料是圖書館特色館藏建設的重要組成部分,可以以各種方式來進行復制,屬于版權保護的作品。2010年修訂的《中華人民共和國著作權法》第3條明確將口述作品列入著作權法保護范疇[3]。口述歷史一般由口述者敘述,采訪者進行記錄,采訪者為了保證敘述活動的順利進行,需要設計采訪問題、設定采訪框架、運用采訪技巧,巧妙地對口述者進行干預。一般來說,采訪者在口述資料生成的過程中也起到創造性作用,同樣具備知識產權。而區塊鏈數據結構是一種以區塊為單位的鏈式結構,每一個區塊頭都包含上一個區塊信息的哈希值和時間戳,任何個人和節點都不能隨意更改信息,任何節點都可追蹤到有變動的節點。區塊鏈技術特有的去中心化、不可篡改、可追溯的特點可用于知識產權保護,可以提高知識產權的可靠性和安全性,降低版權認證費用,因為區塊中每一個參與者也是認證者,不需要專門認證機構和認證費用。
3? 基于區塊鏈的口述歷史資源庫建設
3.1? 區塊鏈相關概念
區塊鏈技術是比特幣的底層技術,2008年首次由日本學者中本聰(Satoshi Nakamoto)提出。區塊鏈技術是利用塊鏈式數據結構驗證與存儲數據、利用分布式節點共識算法生成和更新數據,利用密碼學的方式保證數據傳輸和訪問安全、利用自動化腳本代碼組成的智能合約編程和操作數據的一種全新分布式基礎架構與計算范式[4]。從應用角度來看,區塊鏈是一種分布式共享賬本數據庫,具有去中心化、不可篡改、公開透明、安全可信、可以追溯等特點。區塊鏈采用點對點傳輸模式,具有去中心化的特點,各節點之間直接進行信息處理,任何一個節點出現故障不會影響整個系統的運作。不可篡改意味著區塊鏈中每一個節點發出的信息都能被其他區塊收到,各區塊共同認證新發出的信息,除非能控制一半以上的節點,否則對區塊的修改都是無效的,這種點對點的傳輸方式決定了傳遞、驗證和共享的信息都是公開透明的,也決定了區塊鏈是安全可信的。區塊鏈使用了密碼學中的非對稱加密,使通信雙方無需事前傳遞密匙或進行約定就能完成保密通信,讓參與者更容易達成共識,既方便溯源,又能實現透明數據后的匿名性,保護個人隱私[5]。這些特點為區塊鏈奠定了信任基礎。
3.2? 區塊鏈在口述歷史中的優勢
3.2.1? 擴充資源存儲容量
區塊鏈技術具有去中心化的特點,利用區塊鏈技術實現資源分布存儲,點對點傳輸成為可能,可以利用網絡中每一個節點的存儲空間來存儲其他節點的數字信息。每一個節點既可以作為存儲空間的提供者,也可以作為數據的需求者,這種云存儲真正實現了資源分布儲存,點對點傳輸,改變了圖書館資源存儲中心化的問題。在區塊鏈技術下,云儲存形態充分應用了網絡閑散節點資源,整體運營成本大大降低。因此,圖書館可以擴充信息資源,在節約成本的條件下增加信息容量,可以讓更多的參與者加入資源建設行列,實現資源數量成倍增長。
3.2.2? 可靠的安全共享
區塊鏈技術能夠在大規模網絡環境中建立安全可信的數據存儲系統、通過智能合約機制,實現可信任狀態的分布式共識,實現了更加安全有效的數據共享平臺,保護數據共享。在現有的區塊鏈存儲系統中,文件元數據以單獨用于數據存儲的公鑰加密后存儲在鏈上,文件密文保存在鏈下各個節點中,用于解密所有數據的對應私鑰掌握在用戶手中。區塊鏈上的元數據密文與鏈下節點持有的文件密文都被加密算法保護,只有私鑰持有者可以閱讀其中的內容。區塊鏈云存儲工作在所有節點不受信任的環境下,其中數據分享的安全性完全由具體的算法保證,具有可證明的安全性。另一方面,在數據分享的服務中,不僅需要其過程具有安全性,還需要考慮該服務的可靠性。區塊鏈通過訪問控制、身份認證和隱蔽通信來實現數據交換過程安全可靠。在傳輸過程中先對數據進行封裝和簽名,在使用時采用可驗證計算,保證云計算結果的可信度。
3.2.3? 可追溯成果,強化版權保護
口述歷史從講述到傳播都經過諸多處理,用戶難以判斷其可靠性和有效性。數據溯源可以解決這個問題。區塊鏈利用哈希算法和數字簽名在存儲數據或保存之前計算數據的哈希值,之后可以反復此過程,將驗證結果與之前存儲的數據進行比較來證明數據的完整性。如果兩個哈希值相同,數據真實有效。數字簽名是用非對稱加密算法對哈希值進行加密,簽名使得發送方能夠證明數據是自己發出,接收方也可以驗證簽名。區塊鏈的哈希算法和數字簽名出讓成果追溯成為可能,降低版權保護成本,實現版權保護。
3.3? 基于區塊鏈的口述歷史資源庫模型
基于區塊鏈的口述歷史資源庫是依托區塊鏈技術實現口述歷史收集整理發布的平臺,主要由數據采集分析、數據組織整理、數據存儲發布和數據共享使用四個功能模塊組成,如圖1所示。
3.3.1? 數據采集分析
數據采集模塊的主要任務是采集者身份認證,判斷采集格式的正確性,協助單位對采集資料的合規性、完備性、成熟性和價值型進行判斷,將符合要求的資料創建索引、歸檔和備份。整個系統擁有友好的用戶界面,支持所有經認證的用戶登錄系統,指引用戶按照要求收集信息,并規范提交、處理數據。
3.3.2? 數據組織整理
系統會根據數據的不同類型、作用以及完備程度對數據進行劃分,并匹配相應的數據組織策略。對于不符合規范格式的數據格式,系統提供格式轉換處理,便于保存為規范的格式類型。對于上傳的數據進行標引和分類,根據不同的元數據規范生成元數據類型,最后根據數據內容的主題領域對數據進行分類存儲,一般分為文字資源、圖片資源、視頻資源和虛擬現實資源四個部分,為了后續工作提供基礎。
3.3.3? 數據存儲發布
根據已經組織好的資源數據類別設置不同的存儲方案,設定數據的保存期限和備份計劃。根據注冊用戶傳遞的數據進行分布式存儲,防止數據地址篡改和丟失。在這個模塊中,項目組各用戶可以根據權限新增、修改和存儲數據,原始資源數據經過非對稱加密后存儲在底層數據庫中。用戶在修改完成后,在區塊內記錄新的地址,將數據的輸入時間戳、區塊長度和前一個區塊哈希值組成區塊頭,根據訪問控制樹將數據位置索引、明文形式的訪問控制策略和數據Merkle根加密后打包成塊,存儲至區塊體中,再上傳至區塊鏈。[6]。
3.3.4? 數據共享使用
數據共享使用模塊主要包含數據檢索、訪問和下載、數據共享三個模塊。網絡平臺可以提供多種檢索條件供用戶瀏覽和查詢信息,提供多途徑的數據訪問接口和訪問方式,對于在使用權限中的用戶提供共享和下載服務。系統依據訪問者的權限對應訪問者的請求并查詢該數據的地址與對稱加密密鑰。若訪問者具有權限即可得到地址與密鑰,用戶可到底層數據庫中訪問數據,完成訪問過程。區塊鏈技術在其中充當中樞作用,數據的訪問、下載和權限認證等環節都在區塊鏈中完成。
4? 結? 論
利用區塊鏈技術構建口述歷史資源庫,構建了數據采集分析、數據組織整理、數據存儲發布、數據共享使用四大功能模塊,解決了資源存儲擴容不便、安全共享程度不高、版權保護不利等問題,實現了口述資源管理的整個流程。但本研究只從區塊鏈技術特征入手設計了口述歷史資源庫理論模型,并未對模型的應用和開發展開系統研究,在以后的研究中可以進一步開發模型進行驗證和評價。
參考文獻:
[1] 劉洋,張一帆,韓超.體育非物質文化遺產口述歷史問題探析 [C]//中國體育科學學會.第十一屆全國體育科學大會論文摘要匯編.中國體育科學學會:中國體育科學學會,2019:1521-1522.
[2] 宋蓉.人微言不輕——安徽省圖書館《抗戰老兵口述歷史》項目案例分析 [J].山東圖書館學刊,2019(3):71-74.
[3] 王小平.圖書館口述歷史數據庫建設中的版權問題研究 [J].湖北理工學院學報(人文社會科學版),2014,31(3):44-46.
[4] 中國區塊鏈技術和產業發展論壇.中國區塊鏈技術和應用發展白皮書(2016) [R/OL].(2016-10-18).http://www.cbdforum.cn/bcweb/index/article/rsr-6.html.
[5] 孔繁超.基于區塊鏈的開放獲取資源建設與管理 [J].情報理論與實踐,2019,42(5):153-158.
[6] 王秀利,江曉舟,李洋.應用區塊鏈的數據訪問控制與共享模型 [J].軟件學報,2019,30(6):1661-1669.
作者簡介:趙丹僖(1984—),女,漢族,廣西柳州人,就職于圖書館,采編部主任,館員,研究生,碩士,研究方向:圖書館資源建設與服務。