
摘 要:針對電子學籍檔案管理存在的問題,提出了一個雙區塊鏈結構的學籍檔案安全存儲與共享模型,使用兩條聯盟鏈分別用于學籍檔案的存儲與共享。該方案能夠有效解決學籍檔案管理中的電子化歸檔、共享利用、數據安全、可信認證問題,進一步提升學籍檔案管理效率和管理水平,更好地推動高校學籍檔案數據治理能力的提升。
關鍵詞:學籍檔案;區塊鏈;存儲和共享;電子化歸檔
學籍檔案是學生個人接受教育取得相應學歷的原始證明,記錄了學生從小學、中學、大學本科至研究生階段不同學習時期在校就讀的信息。學籍檔案因其檔案的原始記錄性、憑證性,是學歷學位認證、單位招聘、干部政審的重要依據。據教育部官網2020年全國教育事業發展統計公報顯示,全國共有各級各類學校53.71萬所,各級各類學歷教育在校生2.89億人。其中普通高校2738所,各類高等教育在學總規模4183萬人。學生一人一檔,檔案數量眾多,學籍檔案共享需求巨大。
一、學籍檔案管理的新趨勢和新需求
隨著大數據、云計算、區塊鏈等信息技術的快速普及,數字化校園、智慧校園建設及應用深入開展,為學籍檔案的創新管理提供了技術支持。目前,越來越多的高校檔案館通過建設學籍檔案管理系統、加快學籍檔案數字化進程和推進學籍檔案電子化歸檔等工作來全面提升學籍檔案管理工作的效率和質量。學籍檔案管理的新趨勢和新需求給教育機構的檔案管理部門帶來了挑戰。國家檔案局從2017年至今,均將區塊鏈技術在電子檔案管理中的應用研究作為科技項目研究的重要內容,2022年將“區塊鏈技術在電子文件歸檔和電子檔案管理中的應用研究”列為選題,國家大力扶持推動區塊鏈技術在電子檔案管理的創新應用,以期解決檔案業務實踐中的痛點與難點問題。
二、電子學籍檔案管理現狀及存在的問題
1.學籍檔案的電子化歸檔問題
學籍檔案材料種類繁多,涉及部門較多,部門之間溝通協調不暢,造成檔案分散管理現象,影響學籍檔案的電子化歸檔工作。例如,學生基本信息、學籍異動變更、成績單、學歷學位證明由教務處負責;研究生基本信息、成績單由研究生院負責;新生錄取花名冊由招生辦提供;學生獎懲記錄、就業情況由學生處提供。這就造成了學籍檔案的分散管理,導致檔案館收集學籍檔案材料不及時、不完整。各個部門雖然有各自的信息系統,但相對獨立,形成一個個信息孤島,嚴重制約學籍檔案的電子化歸檔工作。
2.電子學籍檔案共享困難
不同教育階段的學籍檔案存儲在不同教育機構的存儲服務器中,為了保障學籍檔案的保密性和隱私性,教育機構通常采用各種安全策略來限制對檔案數據的訪問和共享,并且,由于機構之間缺乏有效的合作機制,給學籍檔案共享造成一定的阻礙。隨著學生學習過程的進階,學籍檔案具有在不同教育機構間流轉的需求。
3.電子學籍檔案的安全性與隱私保護問題
學籍檔案包含了學生的基本個人信息、學籍學歷等高度敏感信息,由各教育機構負責管理,學生的學籍信息面臨著被竊取、泄漏甚至惡意篡改等風險。現有的學籍檔案大多存儲在中心化的數據庫服務器中,傳統的中心化系統面臨著被非法攻擊、數據丟失、惡意篡改、信息泄露等風險。以互聯網為依托的學籍檔案數據在共享傳輸的過程中也會出現信息泄漏等問題,無法建立信任和有效的共享機制。
4.電子學籍檔案的可信認證問題
由于電子學籍檔案具有易篡改、易破壞、依賴環境等特點,導致其在法律憑證功能上存在先天不足,跨機構共享難被信任。因此,解決學籍檔案的可信認證問題是跨機構共享學籍檔案的關鍵。不同的教育機構之間如果沒有建立起一個安全可信的環境,電子學籍檔案如果跨機構共享,則需進行真實性驗證。
分析電子學籍檔案的管理現狀和存在的問題,實質上有兩個核心問題需要解決:一是學籍檔案的安全存儲,二是學籍檔案的安全共享。因此,在保障個人隱私和數據安全的情況下,解決不同教育機構之間的互信問題,進而實現學籍檔案的安全存儲、高效共享是一個極具挑戰的問題。區塊鏈可以看作是去中心化的分布式數據庫,數據區塊通過共識機制按照時間順序進行連接,區塊鏈中的數據不可篡改且可追溯。區塊鏈技術為解決上述問題提供了一個全新思路,其去中心化、不可篡改、透明可追溯、高安全性等技術優勢使得無須在一個可信的環境中實現學籍檔案數據的安全存儲和共享。
三、學籍檔案存儲與共享方案
1.方案模型
本文提出基于雙區塊鏈的學籍檔案數據存儲和共享方案,各教育機構之間組成學生學籍檔案共享鏈,存儲學生學籍檔案哈希值及元數據,而在教育機構內部使用學籍檔案數據存儲鏈,存儲學籍檔案數據,便于實現學籍檔案的電子化歸檔。學生學籍檔案全文加密后存放在教育機構的存儲服務器中。該方案適用于教育機構內部各業務系統與檔案管理系統集成,同時具有拓展性,支持跨機構或跨組織的學籍檔案共享平臺融合。考慮到學籍信息的隱私性,學籍檔案不可能做到完全公開,因此,選擇讀寫權限受一定限制的非公有鏈——聯盟鏈作為區塊鏈的基本結構。基于雙區塊鏈的電子學籍檔案存儲與共享模型主要由教育機構、業務部門、檔案管理員、學籍檔案數據存儲鏈、學籍檔案共享鏈、存儲服務器等要素協同構成,模型框架如圖1所示。為了實現相應的監管和認證功能,可以適時加入教育主管部門和認證機構,分別實施常規監管和核實加入共享鏈機構身份職能。
2.學籍檔案數據存儲鏈
本方案包含兩條聯盟區塊鏈,分別用于存儲校內學籍檔案數據和學生個人學籍檔案摘要。學籍檔案作為教育機構和師生共同保護的隱私數據,應當在機構內部生成并存儲。校內各業務部門構成學籍檔案數據存儲鏈,共同維護該鏈的分布式賬本數據庫。高校中的教務處、招生辦、學生處、就業辦、研究生院等部門可以作為存儲鏈中的節點,負責學籍檔案數據的上傳,并根據共識協議共同維護學籍檔案數據。例如,招生辦節點負責錄入新生入學登記表、新生錄取名冊;教務處、研究生院等教務部門錄入學生學籍表、學籍異動情況、課程成績單、畢業證書編號、學位證書編號等信息;就業辦錄入學生畢業信息。這些學籍檔案材料根據學生錄取年份、畢業年度按班級排序,由記賬節點將學籍數據填充到新生成的區塊中,并對該區塊簽名將其在存儲鏈網絡中廣播,其他節點收到該區塊后,將其中的數據添加到已擁有的最新區塊鏈賬本中,即添加一個區塊。當業務部門產生電子學籍檔案時,可以由智能合約明確歸檔標準、檔案格式、歸檔時間等規則,節點上傳學籍檔案并將檔案數據存儲在區塊鏈上,由智能合約自動執行,實現學籍檔案由業務部門向檔案管理部門的電子化歸檔。
學籍檔案數據存儲在多方共同維護的多個節點中,節點之間按照共識機制記錄和維護數據,實現了多個業務主體對學籍檔案信息的共享和監督,這種方式很好地解決了學籍檔案管理分散問題,縮短了傳統學籍檔案冗長煩瑣的收集過程,簡化了學籍檔案歸檔審核、信息核對流程,提高了業務處理效率。區塊鏈的分布式存儲實現了全網備份,單一節點的失效不會影響整個區塊鏈系統的運行,實現有效的容災與安全保障,有效避免了中心數據庫被攻擊或篡改導致檔案信息不可信問題。
3.學籍檔案的數據庫存儲
存儲鏈中的學籍檔案數據通過系統接口導入檔案管理系統,經過簡單整理歸檔后,采用非對稱加密算法加密存儲到存儲服務器,通常是數據庫服務器中。將區塊鏈技術應用到學籍檔案管理中,通過與檔案管理系統集成,實現了學籍檔案從前端業務部門收集整理到后端檔案館歸檔利用的全過程動態管理。
在檔案管理系統中,可以將學籍信息按照學生學號或身份證號集成到每一個學生的個人學籍檔案中,并將學生學籍檔案加密保存在存儲服務器,并生成學籍檔案數字摘要(哈希值)和元數據,由檔案管理員上傳到學籍檔案共享鏈。
4.學籍檔案共享鏈
通常,學生的學籍檔案數據存儲在初中、高中、大學等不同教育機構的存儲服務器中,出于安全或隱私原因,學生的學籍檔案很難與其他機構共享。學籍檔案共享鏈中的節點主要由通過認證的教育機構組成,該鏈只保存用于數據共享所需的學生學籍檔案的哈希值及元數據。通過共享鏈平臺可以構建學籍檔案共享WEB平臺,教育機構和企事業單位可查詢相關學生的學籍檔案,在獲得檔案管理員授權后可以獲得其檔案詳細信息。
通過聯盟鏈上部署的智能合約,實現跨機構訪問請求響應規則和學籍檔案訪問規則,從而形成學籍檔案跨機構共享服務網絡。共享鏈中的機構節點通過智能合約發出數據訪問請求,在獲取訪問許可授權后,通過智能合約從目的機構檔案館存儲服務器中獲取該生的學籍檔案。在學籍檔案共享鏈中,所有的共享請求與授權操作都以交易的形式被記錄在共享鏈中,形成一個可溯源的日志賬本,使其有據可循。一旦出現數據泄漏,可以通過共享鏈上的日志信息追蹤到惡意用戶。為了保護學籍檔案信息的隱私性,并減少共享鏈的存儲空間,提高訪問效率,共享鏈只保存學籍檔案的數字摘要、操作用戶、時間戳以及具體的操作信息。共享鏈中學籍檔案的數字摘要被看作是學籍檔案的數字指紋,可以用來檢測學籍檔案是否被修改,保證學籍檔案的真實性和完整性。
四、模型優勢
1.系統適應性
將學籍檔案的存儲與共享設計成雙鏈結構主要原因在于容易整合,可以將不同檔案工作業務流程分別進行管理,更適用于學籍檔案存儲和共享的實際工作。模型使用雙區塊鏈與檔案管理系統進行交互,這一結構避免了對學校原有系統的改造,保證了學校檔案管理模式的穩定性。本模型具有較好的拓展性,存儲鏈可以作為教育機構內部業務系統及檔案管理系統的接入點,實現各種應用,共享鏈支持跨機構或跨組織的學籍檔案共享平臺融合。區塊鏈在維護學籍檔案的真實性、完整性、不可篡改的同時不破壞現有的學籍檔案的管理和保護措施。
2.管理高效性
如果將教育機構的全部學籍檔案資源都存儲在區塊鏈上,將耗費巨大的區塊鏈存儲空間和巨量的計算能力。將學籍檔案的數字摘要代替檔案本身寫入區塊鏈,可以大大降低區塊鏈負載及網絡流量。智能合約的強大功能可以提高管理效率,實現電子學籍檔案的自動化、精細化管理。使用智能合約可以實現多部門學籍檔案的電子化歸檔,為區塊鏈中的數據加密并簽名,進行有效的訪問控制,自動審核用戶訪問請求及共享權限,檢索查詢學籍檔案。這些操作大大縮短了學籍檔案整理歸檔、共享服務的申請審批、檢索利用時間,降低了人工成本和學籍檔案服務過程中的主觀性,提高了檔案服務的質量和效率。
3.模型安全性
在結構層面,本文提出雙區塊鏈結構,將學籍檔案的存儲與共享分開管理,既減輕了區塊鏈各節點的負載,又提高了數據的隱私性,少量節點的故障不影響整個區塊鏈的安全;在內容層面,區塊鏈上存儲的數據無法被篡改,對學籍檔案的所有操作都可以被追溯并適當恢復,同時使用密碼學技術保證數據存儲和傳輸的安全性;在訪問共享層面,利用區塊鏈的去中心化特性和智能合約,實現在不可信環境中的訪問控制,對共享利用主體及其操作進行權威記錄和數據有效管理,實現共享過程中有效的數據管控與權限管理。
4.可信性保障
區塊鏈與檔案界在信任構建方面具有天然的契合性,在技術層面確保了數據可信(密碼學算法、哈希算法)、結果可信(智能合約、共識機制)和歷史可信(鏈式結構、時間戳)。通過多個業務主體對分布式賬本的共同維護和保存,實現了多個業務相關方對學籍檔案的真實性和憑證價值的共同背書,確保了彼此對學籍檔案的互信互認。
五、結語
區塊鏈等新興技術為檔案信息化發展提供了新的機遇,國家信息化戰略為檔案工作的理念變革、模式創新和方法改進提供了新的思路。新時代的發展為檔案管理手段創新提出了新的要求和挑戰。為了促進學籍檔案管理手段的創新,除了要加強創新理念在學籍檔案管理中的推廣,還要推動新技術在學籍檔案管理中的應用。例如,本文中將存儲鏈應用于學籍檔案數據的存儲,提高學籍檔案存儲的安全性、可靠性和可信性,并提高學籍檔案的電子化歸檔效率。將共享鏈應用于學籍檔案共享服務方面,深化學籍檔案信息交流和利用服務的質量,提升學籍檔案信息服務的內涵。只有將新理念和新技術應用于學籍檔案管理之中,在提升學籍檔案管理效率和效能的同時,為學籍檔案業務能力的增加和學籍檔案公共服務能力的提升奠定堅實的管理基礎,從而更好地推動檔案治理能力建設的發展。
參考文獻:
[1]方麗真.區塊鏈技術在學籍檔案管理中的應用研究[J].中國檔案,2021(10):72-73.
[2]教育部.2020年全國教育事業發展統計公報[EB/OL].[2021-08-27] http://www.moe.gov.cn/jyb_sjzl/sjzl_fztjgb/202108/t20210827_555004.html.
[3]李春艷,喬 超.區塊鏈技術在大型企業集團電子文件管理中的應用——以中國石化為例[J].檔案學通訊,2020(1):13-20.
[4]楊 明,丁 龍,許 艷.基于區塊鏈的醫療數據云存儲共享方案[J].南京信息工程大學學報(自然科學版),2019,11(5):590-595.
[5]張利華,藍 凡,姜攀攀,蔣騰飛.基于雙區塊鏈的醫療記錄安全存儲與共享方案[J].計算機工程與科學,2019,41(9):1581-1587.
[6]劉慶悅.基于區塊鏈技術的電子檔案管理模型探析[J].浙江檔案,2018(10):22-24.
[7]錢秀芳.區塊鏈技術在高校檔案管理中的應用探討[J].檔案與建設,2020(5):56-58+66.
(作者單位:青島大學計算機科學技術學院)
作者簡介:李京(1971—),女,漢族,北京人,講師,碩士,研究方向:檔案管理、檔案信息化。