周 琴,孫小江
(1.海南醫學院;2.海南職業技術學院,海南 ???570000)
近年來,越來越多的高校紛紛加入構建本單位的機構知識庫建設行列中,機構知識庫已經作為當下高校圖書館開展特色資源建設服務、提高圖書館和高校社會影響力的重要手段。機構知識庫打破了傳統的傳播壁壘,利用信息技術將本機構的學術成果展現給大眾,不僅促進了學術交流,也實現了數據的整合和資源的共建共享。但在眾多的機構知識庫能夠引起關注的,影響力廣泛的卻寥寥無幾。大多數的機構知識庫淪為“雞肋”,越來越多的機構知識庫只是“空中”樓閣并沒有產生實際的學術推廣價值。而現在大部分的科研人員可能更希望是從更廣泛的數據庫中進行資料的查詢而不僅僅只是從機構知識庫中進行資源的查找。圖書館館員最關心的問題是如何讓機構知識庫發展具有持久性,并成為機構有效管理其知識資產的工具。隨著信息技術的發展,區塊鏈技術不斷成熟和完善,在金融、醫療等多個領域已有應用。區塊鏈技術(去中心化、分布式存儲、記賬、共識機制)等特點為機構知識庫的知識產權保護、數據開放與個人隱私保護及數據長期安全保存等方面提供了強有力的技術支撐,為機構知識庫的可持續發展提供了更多的可能性。
機構知識庫(Institutional Repository,IR)對本單位或本機構內的知識資源進行組織、存儲、管理并供其機構內的成員免費共享使用的資源庫,是機構管理科研成果、傳播學術知識、展現機構智力成果的重要工具。在數字對象管理和研究結果長期保存、提高機構知名度方面發揮著重要的作用,是促進學術交流的重要工具[1]。然而隨著學術數據資源的采集、開放、共享與應用,各科研機構在建設機構知識庫的過程中普遍存在著資源收集難、開放獲取難、產權保護難等一系列問題。如何保證數據的共享性、可追蹤性、安全性以及用戶提交數據的積極性是機構知識庫目前亟須解決的問題。機構知識庫在建設過程中主要存在以下幾個難題。
機構知識庫的文獻類型不僅僅是已發表的期刊、會議論文、學位論文等,還應該包括很多非公開發表的灰色文獻,比如:實驗數據、教學視頻、實驗報告、工作報告、科研項目申報書、科技報告等。這些數據的收集對擴充機構知識庫的內容和提升機構知識庫的質量提供了堅實的基礎,這些一手資料的公開對后續學者的學術科研具有非常重要的參考價值。但這部分資料的收集難度大,導致機構知識庫收集的數據類型不全面,使機構知識庫的數據開放、共享程度較低、數據分析結果不太完整等。
機構知識庫由于其開放性,用戶可以任意上傳或下載,導致資源的質量無法得到有效的控制,也會出現收錄的文獻存在大量的重復。同時提交的元數據也沒有相應的統一、規范的格式,不同類型的數據在字段采集上的顆粒度大小存在較大差異,使得數據清洗難度大,導致資源整合難度大,以及后續數據也難以實現快速檢索,資源的質量無法得到保障。
因為科研數據或學術成果沒有得到最合理、最有效的保護,成果經常會被不正當使用、剽竊,令知識產權受到侵害,所以很多科研人員、學者心存芥蒂不愿分享和上傳自己實驗數據、科研成果到機構知識庫。而現有的解決措施通過對外宣傳提高用戶的自主存檔意識,和通過制定知識共享許可協議去規范用戶繳存和使用,而不是真正意義上的形成從學者提交到用戶使用的全過程有效的監管機制,也沒有對文獻從上傳或下載到使用進行全程的追蹤。所以沒有從根本上提高學者提交學術成果的積極性,也沒有從根本上保障學者的研究成果。
區塊鏈作為數字貨幣的底層技術,原本是比特幣等加密貨幣存儲數據的一種獨特方式。從本質上講區塊鏈是一個分布式數據庫系統。具有“不可偽造”“全程留痕”“可追溯”“公開透明”等特征,而機構知識庫是各高校、管理機構創建的保存各類知識資源、學術成果的數據中心。由此可見兩者在存儲、管理的對象上是契合的。區塊鏈技術為機構知識庫中的資源、數據的共享、長期保存創造了可靠的機制。機構知識庫中學術資源的確權、征信、追溯等信息,都可以借助區塊鏈來實現。所以區塊鏈技術在為機構知識庫建設上有很大程度的契合性。
為了提高機構知識庫的影響力,加強各學者之間的學術交流和成果轉換,知識的共享、傳播對機構知識庫來說就顯得尤為重要。但共享、快速傳播可能會導致產權的歸屬不清晰、知識被篡改、剽竊等現象,所以越來越多的學者也不愿意將自己的科研成果、實驗數據等上傳到機構知識庫與大家分享、交流。而區塊鏈技術是分布式存儲、具有防篡改、可追溯等特性。能夠對機構知識庫中數據的版權進行保護,實時追溯資源的上傳到利用的整個完整過程,即使數據被多次下載、復制也可進行根源追溯,找到數據的版權歸屬者,保持版權的公開透明,解決版權糾紛、惡意剽竊等問題。所以將區塊鏈技術應用到機構知識庫建設中將解決建設過程中存在的各種知識版權難題,區塊鏈技術為機構知識庫的建設提供了新的思路和方向。
在CNKI中國知網數據庫、維普和萬方數據知識服務平臺中進行檢索,分別以“機構知識庫”“區塊鏈”為主題檢索,同時增加用“區塊鏈”并含“機構知識庫”為主題檢索條件,對兩個檢索條件采取精確匹配進行高級檢索,截至2020年12月10日檢索結果,見表1。

表1 檢索結果
通過表1檢索可以發現,隨著科學技術的發展以及比特幣的火熱,大家對區塊鏈研究的熱情還是高漲的,對機構知識庫的研究也不在少數。但結合機構知識庫和區塊鏈技術的應用研究卻十分匱乏。通過下載進行全文閱讀相關的9篇文獻發現區塊鏈技術應用于機構知識庫尚在起步摸索階段。內容上主要從區塊鏈技術的特點,以及機構知識庫建設過程中面臨的版權保護等難題進行綜合分析,發現區塊鏈技術在機構知識庫建設中有很好的適用性和獨特的優勢。區塊鏈技術具有開放、去中心化、分布式、智能合約等特性為機構知識庫產權的保護、實現各節點的相互監督、不可篡改提供了技術支持。呂方婷[2]主要從機構知識庫的七要素(基于網絡的數據庫、存放學術資源、基于一個大學或機構等[3])出發找出區塊鏈技術對于其的適用性,通過對比分析發現機構知識庫與區塊鏈技術在管理對象是契合的。但是通過文獻查閱中發現目前的研究還主要集中在基礎理論的研究,利用區塊鏈建設機構知識庫還處在探索階段,真正應用的實踐案例還相對稀少,將區塊鏈技術實際應用到機構知識庫建設中還有待繼續挖掘。
目前,國內已有多家企業投入到“區塊鏈技術”版權保護的研發中,例如億書和紙貴兩家科技公司主要是以數據治理、區塊鏈技術為特色幫助企業和個人保護和解決版權、數據安全隱私等問題,為用戶提供寫作、出版版權認證與保護全過程的解決方案。但不可否認的是,這項技術目前還處在發展初期,還尚未形成統一的技術標準。區塊鏈技術在圖書館等方面的應用還只是流于層面,技術標準不規范、制度不健全,而沒有真正切實地運用到實踐中。對于圖書館而言,我們需要牢牢抓住科技革命的機遇,利用信息手段迎難而上,積極參與區塊鏈技術的學習和應用研究,爭取早日實現區塊鏈在學術上實質性的開發與應用。同時構建高校圖書館區塊鏈版權體系,建立相關的版權應用標準,推動區塊鏈的規范和實踐工作。僅僅依靠技術手段來保護知識產權還是不夠的,技術方法不能解決所有的問題。還需要增強圖書館館員的版權保護意識,加強館員們日常工作中的版權保護意識,合理合法保護科研人員的版權利益,讓他們一直保有創作的熱情和積極性。同時國家層面上也需要相應的監管,出臺相關的政策給予和有效的法律條例,確保基于區塊鏈技術的圖書館數字資源、機構知識庫的學術資源每個作品的版權都能得到法律效力的保護。從多個層面、多種方法、多途徑出發努力,為學術科研誠信、知識產權保護提供更完備的保障,推動學術的優質資源實現開放、共享、共建。