李京


關鍵詞:區塊鏈;學籍檔案管理;數據庫;安全可信;高校學籍檔案管理系統
0 引言
高校學籍檔案是高校檔案的重要組成部分,是檔案管理工作中的一項基礎性工作。學籍檔案是學生在校期間形成的具有保存價值的文字材料,真實記錄了學生在校期間的學習過程及綜合表現,是個人學習成績和學歷的見證材料,對學生、學校、社會都具有參考和憑證作用。隨著高校招生規模的擴大、多種形式辦學、考研和出國人數增加、就業壓力和就業渠道的多樣化,學生對學籍檔案的利用需求與日俱增,學籍檔案的查詢利用工作量也隨之加大,給檔案管理部門帶來了前所未有的壓力和挑戰,加強高校學生的學籍檔案的信息化管理,充分發揮學籍檔案的作用,是高校學籍檔案工作面臨的重要研究課題。
起初,我國的學籍檔案大多為紙質檔案,不易保管,易丟失、損毀、造假、管理流程復雜、檢索緩慢等問題十分普遍,一旦學籍檔案遺失或破壞將給當事人的前途命運造成不良影響。目前,大部分高校已建成學籍檔案管理系統,其保存管理的高效性、查詢利用的便捷性大幅提升,但網絡環境下的學籍檔案管理系統面臨的安全問題也日益凸顯,網絡攻擊導致學籍檔案系統崩潰,學籍檔案信息泄露、偽造或篡改等信息安全事件頻發。學籍檔案管理系統的安全問題已引起高校檔案機構的高度重視,保護電子學籍檔案不被竊取、篡改和破壞,保障電子學籍檔案信息的真實性和安全性,成為高校檔案館研究的熱點問題。因此,構建一個具有安全保護機制的電子學籍檔案管理系統已經成為高校面臨的迫切問題,具有重要的研究價值和現實意義。
區塊鏈作為比特幣底層技術,結合哈希運算、數字簽名、P2P網絡、共識算法以及智能合約等基礎技術,成為一種全新的分布式基礎架構和計算范式[1]。近年來,將區塊鏈技術引入到檔案管理工作已成為檔案界研究的熱點。運用區塊鏈技術開發一個安全、高效、可靠的高校學籍檔案管理系統是本文研究的內容。
1 區塊鏈技術為電子學籍檔案管理提供技術保障
1.1 電子學籍檔案的真實性、完整性和永久保存保障
電子文件的易修改性和信息與載體的可分離性,使電子文件在存儲的過程中存在著被改動的可能,而且這種改動在物理形態上是可以做到“不留痕跡”的。作為一項新興的信息技術,區塊鏈使用時間戳和數字密碼技術,把數據信息記載在按時間序列組成的區塊中,并使用共識機制把數據存儲到分布式節點數據庫內,從而生成了永久保存、不可逆向篡改的數據記錄。容易驗證的鏈式數據結構、去中心化冗余保存、多方共同鑒證三者相結合,給區塊鏈上存儲的數據帶來“不可篡改”的特性,從而保證了學籍檔案數據的真實性。區塊鏈的不可篡改、永久不變的特性用于學籍檔案管理中,解決了學籍檔案的真實性、完整性和長久保管問題。
1.2 分布式數據存儲容災備份保障
當前高校檔案信息化建設中,學籍檔案的保存通常采用集中存儲模式,高校檔案館由于種種限制沒有能力對存儲的電子學籍檔案進行全方位備份存儲,一旦遇到自然災害、重大事故等突發事件,電子學籍檔案數據很容易丟失,學籍檔案的安全性很難得到保障。而區塊鏈的分布式存儲是把全部數據分布式保存在整個網絡的多個節點上,單個節點的損壞或滅失并不會對其他節點造成影響,單個節點的數據錯誤或篡改更不可能對整體數據產生什么破壞性的影響[2]。學籍檔案的區塊鏈分布式存儲可自動完成全網多節點備份,實現有效的容災與安全保障。
1.3 電子學籍檔案的安全保障
電子學籍檔案管理的核心目標就是保障其安全。傳統的檔案管理系統,學籍檔案存儲在中心化的數據庫中,面臨著更多的網絡攻擊的風險,尤其可能被內部管理人員和外部攻擊者偽造和篡改[3]。區塊鏈系統中,存儲在不同節點的數據信息都受到密碼學技術的嚴格保護,即使獲得了相關信息,沒有合法授權也無法偷窺到數據信息的真實內容。區塊鏈系統通過設置認證規則、訪問控制和審計機制,并利用密碼學技術實現學籍檔案信息存儲和訪問的安全性。
1.4 便于監管的公共信任體系保障
當前檔案部門之間協調成本過高,利益保護現象嚴重,中心化的存儲技術和管理模式,使得學籍檔案的原始性、真實性和安全性問題尚未得到妥善解決,導致檔案數據可信度降低。區塊鏈技術的安全性、不可逆、不可篡改性都已經得到了證明,如果把學籍檔案業務建立在已被證明其可靠性的區塊鏈上,將極大降低安全和信用成本。從技術上應用區塊鏈,就可以用較低的成本打破這些阻礙,建立一個公開的社會公共信用系統,成本將大幅降低,效率也將大幅提升,還便于監管。
區塊鏈技術利用其所具備的分布式、透明性、可追溯、防篡改等特征,可提高學籍檔案數據的真實性和安全性,這些特征與學籍檔案管理要求十分契合,因此,區塊鏈技術可以為學籍檔案管理提供有力技術保障。
2 區塊鏈技術在學籍檔案管理的適用性分析
區塊鏈是一系列計算機技術的新型應用模式,其本質上是一個通過加密算法保障的不可篡改和不可偽造的分布式數據庫。與其他數據信息相比,學籍檔案數據具有以下明顯特征:學籍檔案數據量巨大、來源渠道廣泛、數據類型多樣、查詢利用率高,不能隨意篡改,數據保密性要求高。下面根據學籍檔案管理的需求,將常規學籍檔案管理系統數據庫和區塊鏈做一個對比,具體分析如表1。
傳統的檔案管理系統主要側重檔案信息的收、管、用業務功能的實現,對檔案數據的真實性、完整性、防篡改和保密性等檔案信息的安全防護顯得無能為力[4]。從上表看出,區塊鏈技術具有分布式存儲、可信任、防篡改、多節點冗余備份、檔案協同管理和查詢利用的便捷性以及數據真實性、完整性、可追溯、保密性等特有的安全特性,能夠滿足電子學籍檔案管理的多方面需求,是一種匹配度極高的技術解決方案。
3 構建基于區塊鏈的學籍檔案管理系統
基于區塊鏈的學籍檔案管理系統及功能。為解決傳統學籍檔案管理系統的安全性差、易篡改、不易追溯的問題,通過分析區塊鏈技術在學籍檔案管理的適用性,本文提出將區塊鏈技術應用到現有的學籍檔案管理系統,研究并設計了基于區塊鏈的學籍檔案管理系統,實現學籍檔案數據完整性、安全性保護以及學籍檔案的安全有效管理。
基于區塊鏈的學籍檔案管理系統由學籍檔案管理子系統和區塊鏈數據保護子系統協同構成,如圖1所示,各模塊分工明確,子系統間通過網絡調用進行數據交互,在保障學籍檔案數據安全性的前提下,實現學籍檔案管理功能。
檔案管理子系統是整個區塊鏈學籍檔案管理系統的基礎與核心,包括學籍檔案的接收采集、存儲保護、查詢利用、驗證恢復、用戶權限管理、操作日志管理等模塊。學籍檔案的接收采集以及查詢利用等操作信息不僅會存儲到本地數據庫,還會通過RESTful接口同步到區塊鏈數據保護子系統。檔案的查詢操作不僅可以查詢本地數據庫,也可以查詢區塊鏈保護子系統。
區塊鏈保護子系統由聯盟區塊鏈、公有區塊鏈、RESTful接口、私有IPFS集群共同構成。檔案管理子系統的請求通過RESTful接口傳送到區塊鏈保護子系統進行處理。IPFS是一個分布式文件存儲系統,具有去中心化、內容可尋址、不可篡改等特點[5],通過與區塊鏈協同配合,能夠有效保障學籍檔案的真實性和完整性。
1) 學籍檔案接收采集模塊:接收學籍檔案相關部門產生的電子學籍文件及其元數據、對紙質學籍檔案文件進行數字化和采集重要數字學籍信息資源。例如從招生辦獲取新生入學登記信息;從教務處、研究生院等教務部門獲取學生學籍異動信息,以及培養計劃、課程成績單、獎懲記錄、學位論文、畢業證書、學位證書等信息;從就業辦獲取學生畢業信息。可以選擇在線或離線接收方式。該模塊具備目錄數據和全文數據等多種信息資源的采集功能。
2) 學籍檔案存儲保護模塊:用于存儲采集的學籍檔案數據和元數據,以及用戶操作的日志信息不僅存儲到本地數據庫,還會同步到區塊鏈數據保護子系統。區塊鏈不適合作為大數據存儲的基礎設施,所以區塊鏈一般不會用來存儲檔案原始數據[6],完整的學籍檔案數據加密存儲在私有IPFS集群,學籍檔案的IPFS地址和哈希值存儲在聯盟鏈上。為了充分保護聯盟鏈的檔案數據,通過定期將聯盟鏈快照錨定到公有鏈的方式增強數據的原始性和真實性保護,實現從公有鏈到聯盟鏈的雙重數據保護。
3) 學籍檔案查詢利用模塊:提供日常的學籍檔案查詢、利用、打印輸出功能。查詢操作在查詢本地數據庫的同時,還會查詢區塊鏈保護子系統。即使本地數據庫中的學籍檔案數據被惡意篡改,仍能通過區塊鏈數據保護子系統找回被篡改的檔案數據。每次查詢、利用操作都會產生操作日志,記錄操作用戶、操作時間以及具體的操作信息。
4) 學籍檔案驗證恢復模塊:由于學籍檔案的存儲方式采用中心化的數據庫存儲,容易遭受黑客攻擊,學籍檔案數據被篡改往往不易察覺,需使用區塊鏈中的數據進行校對發現安全風險。檔案的驗證操作是將本地數據庫的學籍檔案數據通過RESTful接口發送到區塊鏈數據保護子系統進行數據比對的過程。具體來講,就是將本地數據庫的學籍檔案哈希值與區塊鏈子系統中區塊鏈的哈希值進行比較,由于區塊鏈的不可篡改特性,可以確定存儲在數據庫中的學籍檔案是否被篡改,并且在檢查到數據異常后,可以使用區塊鏈保護子系統IPFS集群中的學籍檔案數據重置本地數據庫。
5) 用戶權限管理模塊:檔案管理子系統采用基于角色的訪問控制方案,對用戶權限進行控制。用戶角色分為系統管理員、檔案管理員和普通用戶。系統管理員是系統最高權限的擁有者,具備系統所有操作功能,能夠創建、修改和刪除用戶角色和角色權限。檔案管理員擁有學籍檔案的增加、修改、查詢和驗證權限,以及學籍檔案的查詢利用申請和用戶注冊申請的審核批準權限。普通用戶可以對學籍檔案進行查詢和利用,檔案管理員可以對用戶權限和學籍檔案進行管理操作。
6) 操作日志模塊:系統使用者進行學籍檔案的新增、修改、查詢和利用等操作均會產生操作日志,對學籍檔案的操作行為進行審計和追蹤。操作日志不僅存儲到本地數據庫,還會記錄到區塊鏈中。一旦上鏈則無法更改,所有的操作都形成日志記錄在鏈上,因此可以進行溯源。如發生學籍檔案的篡改和信息泄露,可以通過日志信息追蹤到惡意用戶。操作日志文件只能讀取,不可修改。只有管理員具有查閱權限。
4 結論
區塊鏈技術所具有的特點與電子檔案的四性要求相吻合,其“去中心化、不可篡改、可追溯”等技術特性可以構建一種全新的信任機制和應用模式,確保了電子學籍檔案的來源可靠,內容可信,過程可溯。
本文提出的方案是在高校現有學籍檔案管理系統基礎上進行擴展,以較低的經濟成本和較少的系統修改,為學籍檔案管理系統中的檔案數據提供了更高的安全保障,防止不法分子對學籍檔案數據的惡意篡改和破壞,并提供學籍檔案數據的隱私保護、歷史追溯和驗證恢復等多種功能。通過應用區塊鏈技術,提供一個高校學籍檔案信息系統運行實踐的新思路新方法,擴大高校學籍檔案管理的范圍,提供更加高效便捷的學籍檔案管理和利用方式,化解了高校與企業、院校與院校之間的信任危機。為學校和社會提供更加安全、高效的檔案信息資源服務,具有很高的實用價值和推廣前景。