摘要:教育大數(shù)據(jù)正在成為驅(qū)動國家教育數(shù)字化轉(zhuǎn)型戰(zhàn)略行動的核心資源,帶來了巨大的教育價值,但教育大數(shù)據(jù)的采集和分析產(chǎn)生了隱私侵害風(fēng)險、信任危機(jī)等嚴(yán)峻問題,阻礙了數(shù)據(jù)的共享、開發(fā)和利用。如何增強(qiáng)教育大數(shù)據(jù)在開放共享、共建共用中的隱私保護(hù)和信任關(guān)系,成為制約數(shù)據(jù)驅(qū)動教育數(shù)字化轉(zhuǎn)型的關(guān)鍵難題。對此,文章首先采用文獻(xiàn)分析法,剖析了教育大數(shù)據(jù)隱私保護(hù)的研究現(xiàn)狀與關(guān)鍵問題。隨后,文章從應(yīng)用場景角度設(shè)計(jì)了教育大數(shù)據(jù)全生命周期隱私增強(qiáng)框架,并基于此框架從技術(shù)實(shí)現(xiàn)角度構(gòu)建了滿足不同實(shí)體、不同階段隱私需求的教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型及其應(yīng)用流程。最后,文章介紹了該模型的典型應(yīng)用場景,涉及學(xué)分與資質(zhì)認(rèn)證、教育協(xié)同與治理、可信評教、個性化學(xué)習(xí)服務(wù)等多個方面。文章的研究能夠厘清教育大數(shù)據(jù)開放共享時的隱私保護(hù)關(guān)鍵問題和技術(shù)思路,可為實(shí)現(xiàn)教育數(shù)據(jù)要素化全生命周期的隱私保護(hù)、建立健全數(shù)據(jù)驅(qū)動教育數(shù)字化轉(zhuǎn)型的信任機(jī)制提供參考。
關(guān)鍵詞:教育大數(shù)據(jù);隱私增強(qiáng);全生命周期;開放共享
【中圖分類號】G40-057 【文獻(xiàn)標(biāo)識碼】A 【論文編號】1009—8097(2024)03—0028—11 【DOI】10.3969/j.issn.1009-8097.2024.03.003
教育數(shù)字化轉(zhuǎn)型的逐步深化,對教育大數(shù)據(jù)開放共享和開發(fā)應(yīng)用的要求越來越高,但教育大數(shù)據(jù)中蘊(yùn)藏著大量敏感的個人隱私數(shù)據(jù),故不當(dāng)采集和過度挖掘易導(dǎo)致隱私泄露、侵犯等問題。構(gòu)建可信任的教育大數(shù)據(jù)應(yīng)用環(huán)境,是大數(shù)據(jù)賦能教育變革的基礎(chǔ)和前提。可信任的教育體系具有完備的信任機(jī)制,能尊重和保障參與主體的各項(xiàng)權(quán)益,其中比較重要的是對隱私信息的知情權(quán)、保護(hù)權(quán)和遺忘權(quán)[1]。隱私增強(qiáng)作為一種面向隱私信息全生命周期保護(hù)的計(jì)算理論和方法[2],已成為信息安全與隱私保護(hù)的重要技術(shù)路徑。但是,當(dāng)前計(jì)算機(jī)領(lǐng)域有關(guān)隱私保護(hù)的“單一場景-單模數(shù)據(jù)-單例算法”的技術(shù)范式,已無法直接為復(fù)雜且獨(dú)特的教育領(lǐng)域提供應(yīng)用參考,需要構(gòu)建一體化、流程化、協(xié)同化的隱私增強(qiáng)技術(shù)框架或模型,并覆蓋教育數(shù)據(jù)要素化的采集、存儲、分析、應(yīng)用全生命周期,才能真正為教育大數(shù)據(jù)的安全共享與開發(fā)應(yīng)用保駕護(hù)航。為此,本研究采用文獻(xiàn)研究法,嘗試揭示教育大數(shù)據(jù)隱私保護(hù)的關(guān)鍵問題,構(gòu)建促進(jìn)開發(fā)應(yīng)用的教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型,并闡釋模型的典型應(yīng)用場景,以期為建立健全數(shù)據(jù)驅(qū)動教育數(shù)字化轉(zhuǎn)型的信任機(jī)制提供理論參考和實(shí)踐指導(dǎo)。
一 教育大數(shù)據(jù)隱私保護(hù)的研究現(xiàn)狀與關(guān)鍵問題
1 研究現(xiàn)狀
本研究采用文獻(xiàn)分析法,以“中國知網(wǎng)”收錄的北大核心期刊或CSSCI期刊為文獻(xiàn)來源,以“教育大數(shù)據(jù)應(yīng)用”“教育數(shù)據(jù)隱私”“學(xué)生隱私”“教育人工智能倫理”“教育數(shù)據(jù)倫理”“教育數(shù)據(jù)治理”為關(guān)鍵詞,檢索時間設(shè)為2010年1月~2023年12月,得到155篇相關(guān)文獻(xiàn),具體的發(fā)文量如圖1所示。圖1顯示,我國教育大數(shù)據(jù)隱私保護(hù)相關(guān)研究的發(fā)文量從2017年開始逐年上升,尤其在2022年,發(fā)文量躍升至35篇,可能的主要原因是《個人信息保護(hù)法》《數(shù)據(jù)安全法》等法律法規(guī)的施行進(jìn)一步推動教育大數(shù)據(jù)隱私保護(hù)的研究。可以預(yù)計(jì),近年內(nèi)教育大數(shù)據(jù)隱私保護(hù)將成為研究者持續(xù)關(guān)注的重點(diǎn)。
本研究運(yùn)用CiteSpace 6.2軟件,對155篇文獻(xiàn)進(jìn)行分析,將網(wǎng)絡(luò)節(jié)點(diǎn)類型設(shè)為“關(guān)鍵詞”,年度區(qū)間設(shè)為2010~2023年,時間切片設(shè)為1,引用頻次最高值設(shè)為TopN=50,通過關(guān)鍵詞共現(xiàn)聚類分析,得到我國教育大數(shù)據(jù)隱私研究關(guān)鍵詞共現(xiàn)聚類知識圖譜,如圖2所示。圖2顯示,根據(jù)文獻(xiàn)關(guān)鍵詞劃分的10個聚類內(nèi)容分別是:#0人工智能、#1大數(shù)據(jù)、#2教育技術(shù)、#3數(shù)據(jù)安全、#4倫理風(fēng)險、#5智能教育、#6數(shù)據(jù)隱私、#7信息技術(shù)、#8倫理路徑、#9數(shù)據(jù)治理,代表了我國教育領(lǐng)域研究者對于教育大數(shù)據(jù)隱私的研究重點(diǎn)和熱點(diǎn)。然而,這些研究大多從教育治理的層面探討教育大數(shù)據(jù)在開發(fā)與應(yīng)用過程中的隱私風(fēng)險、倫理問題、治理機(jī)制及政策建議,而缺乏從技術(shù)層面探討隱私問題的解決方案和實(shí)施路徑。
當(dāng)前,教育大數(shù)據(jù)的生產(chǎn)和應(yīng)用范圍十分廣泛,涉及學(xué)生、教師、學(xué)校、教育企業(yè)、第三方機(jī)構(gòu)等多個主體,涵蓋教學(xué)、科研、日常活動等相關(guān)數(shù)據(jù)的采集、聚合、處理、訓(xùn)練、共享、流通等若干環(huán)節(jié)。通過對教育中多場景、多模態(tài)、多維度、全過程數(shù)據(jù)的采集、建模、計(jì)算和分析,能夠識別教育教學(xué)問題、發(fā)現(xiàn)教育客觀規(guī)律、預(yù)測教育發(fā)展趨勢,并有效提升教育數(shù)據(jù)的診斷力、解釋力、決策力與預(yù)測力[3][4][5][6]。教育大數(shù)據(jù)除了具有一般大數(shù)據(jù)的“4V”特征(即規(guī)模大、速度快、種類多、價值密度低),還具有敏感度高的特點(diǎn)。教育大數(shù)據(jù)記錄了學(xué)生的敏感信息(如身份信息、學(xué)業(yè)成績、健康情況等),這些敏感信息一旦遭到肆意傳播、售賣或不當(dāng)加工,就會對學(xué)生的個人名譽(yù)、財(cái)產(chǎn)安全、人身安全等造成巨大危害,也會帶來較大的學(xué)校管理和社會治理隱患。因此,如何在充分利用教育大數(shù)據(jù)的同時保證隱私不泄露,成為當(dāng)下教育大數(shù)據(jù)開發(fā)與應(yīng)用面臨的主要問題[7]。
2 教育大數(shù)據(jù)開放共享時的隱私保護(hù)關(guān)鍵問題分析
本研究結(jié)合教育大數(shù)據(jù)應(yīng)用與教育數(shù)字化的實(shí)際場景,認(rèn)為教育數(shù)據(jù)隱私不僅涉及學(xué)生的敏感信息,也包括教師、各級教育機(jī)構(gòu)和教育監(jiān)管部門等利益相關(guān)者產(chǎn)生的被傳感設(shè)備、信息系統(tǒng)和服務(wù)軟件記錄的具有敏感屬性的數(shù)據(jù)集。這些數(shù)據(jù)集需要經(jīng)數(shù)據(jù)提供者知曉或應(yīng)允,才能被其他實(shí)體獲取、存儲、使用和銷毀[8]。另外,教育數(shù)據(jù)隱私還涉及教育參與主體產(chǎn)生的原始數(shù)據(jù),以及被各種計(jì)算引擎和算法處理后產(chǎn)生的能夠推演教育參與主體敏感信息的中間數(shù)據(jù)、過程數(shù)據(jù)和結(jié)果數(shù)據(jù)。這些高敏感、高價值的教育大數(shù)據(jù)的開放共享和有效利用通常經(jīng)歷采集、存儲、分析和應(yīng)用四個階段[9],且每個階段都存在獨(dú)特的隱私泄露和侵犯風(fēng)險。
①無序、過度的數(shù)據(jù)采集導(dǎo)致隱私侵害風(fēng)險。在數(shù)據(jù)采集階段,非法、靜默、過度的數(shù)據(jù)采集容易造成潛在的恐慌和信任危機(jī)。這是因?yàn)椋瑥V泛嵌入學(xué)生日常生活的智能物聯(lián)設(shè)備(如智能手機(jī)、運(yùn)動手環(huán)、校園監(jiān)控、門禁系統(tǒng)、校園一卡通等)無時無刻不在采集和傳送數(shù)據(jù),而學(xué)生缺乏對自身數(shù)據(jù)的知情權(quán)和處理權(quán)。另外,教育機(jī)構(gòu)或教育平臺因監(jiān)管力度不強(qiáng),常常在未通知用戶的情況下非法采集用戶數(shù)據(jù),或超過必要限度地采集用戶的隱私數(shù)據(jù),而被采集者未被告知數(shù)據(jù)用途和隱私保護(hù)方案。例如,inBloom公司、Piazza互聯(lián)網(wǎng)教育軟件公司、Edmodo學(xué)習(xí)網(wǎng)站就曾因過度或非法采集學(xué)生的隱私數(shù)據(jù)而帶來諸多不良后果[10]。
②多級多源數(shù)據(jù)分割存儲導(dǎo)致責(zé)任失守風(fēng)險。在數(shù)據(jù)存儲階段,多級多源教育機(jī)構(gòu)中的數(shù)據(jù)被分割靜態(tài)存儲,由于存儲服務(wù)器的安全性不足,數(shù)據(jù)極易受到攻擊導(dǎo)致隱私泄露。2020年,美國加州舊金山大學(xué)遭遇NetWalker勒索攻擊,大量重要的學(xué)術(shù)數(shù)據(jù)被加密后無法使用,最終被迫支付高昂贖金。目前雖然可以通過教育云服務(wù)實(shí)現(xiàn)數(shù)據(jù)的云存儲,在一定程度上緩解分割存儲帶來的數(shù)據(jù)保護(hù)強(qiáng)度不一、部分?jǐn)?shù)據(jù)安全性脆弱的問題,但教育大數(shù)據(jù)外包商業(yè)云后,也面臨數(shù)據(jù)竊取、篡改和越權(quán)使用等問題,導(dǎo)致隱私泄露事件頻發(fā)。2021年,珠海10萬余條中小學(xué)生個人信息被“校訊通”公司的員工非法出售給教育培訓(xùn)中心用于商業(yè)課程銷售,引發(fā)了學(xué)生和家長的強(qiáng)烈不滿。
③無制約的關(guān)聯(lián)分析與推理導(dǎo)致利益失衡和服務(wù)偏見風(fēng)險。在數(shù)據(jù)分析、應(yīng)用階段,隨著機(jī)器學(xué)習(xí)技術(shù)和設(shè)備不斷升級,被廣泛采集的多模態(tài)數(shù)據(jù)將被多方處理分析和動態(tài)使用,導(dǎo)致出現(xiàn)了惡意攻擊、隱私泄露和過度挖掘等問題。如果存儲在云端的數(shù)據(jù)直接以明文形式參與計(jì)算,那么不可信的云服務(wù)提供商或計(jì)算參與方可能會偽裝成半誠實(shí)敵手窺探到部分甚至全部數(shù)據(jù),進(jìn)而推測出個體隱私信息,造成計(jì)算過程中的隱私泄露。攻擊者可以利用學(xué)生不相關(guān)的零散數(shù)據(jù)或簡單匿名后的數(shù)據(jù)進(jìn)行關(guān)聯(lián)、重建和挖掘,從而推斷出隱私信息;還可以通過應(yīng)用程序編程接口非法竊取訓(xùn)練模型的相關(guān)信息,構(gòu)建替代模型對原始數(shù)據(jù)進(jìn)行逆推或惡意挖掘。
二 面向教育大數(shù)據(jù)的全生命周期隱私增強(qiáng)
隱私增強(qiáng)是一種更主動的隱私保護(hù)策略,旨在支撐數(shù)據(jù)開放共享時確保數(shù)據(jù)在處理或分析的過程中不泄露敏感信息,同時保證計(jì)算結(jié)果的正確性和可用性。隱私增強(qiáng)是應(yīng)對數(shù)據(jù)共享、協(xié)作需求與隱私保護(hù)法規(guī)之間沖突的一種解決方案,有助于讓數(shù)據(jù)擁有者、使用者與服務(wù)提供者之間建立信任關(guān)系,實(shí)現(xiàn)數(shù)據(jù)價值的最大化。總的來說,隱私增強(qiáng)更注重在數(shù)據(jù)使用、共享時保護(hù)隱私,而不僅僅只是防止數(shù)據(jù)被非法獲取和濫用。
1 教育大數(shù)據(jù)全生命周期隱私增強(qiáng)框架的設(shè)計(jì)
想要解決教育大數(shù)據(jù)全生命周期的隱私泄露問題,就需要在系統(tǒng)層面實(shí)現(xiàn)“數(shù)據(jù)可用不可見,隱私可算不可識,交互可信不必現(xiàn),數(shù)據(jù)不動模型動”,構(gòu)建頂層互融、底層互通、軟硬一體的隱私增強(qiáng)系統(tǒng)級解決方案。本研究針對教育大數(shù)據(jù)全生命周期隱私風(fēng)險,基于李鳳華等[11]提出的隱私計(jì)算框架,借鑒“螞蟻”開發(fā)的可信隱私計(jì)算平臺框架——“隱語”[12],結(jié)合教育大數(shù)據(jù)的應(yīng)用場景,設(shè)計(jì)了教育大數(shù)據(jù)全生命周期隱私增強(qiáng)框架,如圖3所示。
教育大數(shù)據(jù)隱私增強(qiáng)的基礎(chǔ)是安全基礎(chǔ)設(shè)施,包括身份認(rèn)證、數(shù)據(jù)授權(quán)、訪問控制、密鑰管理等。應(yīng)用安全基礎(chǔ)設(shè)施,各類結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的教育數(shù)據(jù)得以進(jìn)入基于隱私計(jì)算的全生命周期保護(hù)流程。根據(jù)教育數(shù)據(jù)的隱私需求和隱私計(jì)算時間連續(xù)、場景普適、模態(tài)通用的全生命周期隱私保護(hù)內(nèi)涵,本研究提出了教育大數(shù)據(jù)隱私增強(qiáng)的四個目標(biāo):①隱私度而可匿,是指基于數(shù)據(jù)格式和語義抽取隱私信息,并將這些隱私信息轉(zhuǎn)變成含有信息量、不可分割、互不相交、具備原子性的隱私向量。隱私向量符合第1范式和第2范式,可以對其進(jìn)行脫敏處理,常見的脫敏處理技術(shù)包括隱私感知、隱私分級、數(shù)據(jù)匿名和本地差分隱私[13]。②數(shù)據(jù)密而可控,是指數(shù)據(jù)在被加密為密文后,無須解密,即可在密文域?qū)?shù)據(jù)進(jìn)行安全檢索和處理[14],且能同時保證數(shù)據(jù)不可修改或刪除,從而實(shí)現(xiàn)去中心化的數(shù)據(jù)私密管控[15]。③結(jié)果隱而可用,是指在數(shù)據(jù)處理階段,保證隱私增強(qiáng)處理后的數(shù)據(jù)經(jīng)訓(xùn)練得到的計(jì)算模型依然是準(zhǔn)確的,保證將隱私增強(qiáng)處理后的數(shù)據(jù)作為模型計(jì)算接口的輸入得到的計(jì)算結(jié)果是準(zhǔn)確的,且保證教育活動的各參與者僅在本地將自己的隱私信息作為模型輸入[16]、在無法獲知其他參與者輸入信息的情況下得到的全局計(jì)算結(jié)果是準(zhǔn)確的。④應(yīng)用可信可溯,是指教育活動參與者對隱私信息的來源和真實(shí)性進(jìn)行確認(rèn),從技術(shù)角度實(shí)現(xiàn)參與者操作記錄的不可否認(rèn)、操作行為的追蹤溯源和不依賴第三方的操作互信[17]。為實(shí)現(xiàn)這四個目標(biāo),需要構(gòu)建可信任的教育大數(shù)據(jù)“采-存-算-用”體系,實(shí)現(xiàn)安全可信的數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)處理與數(shù)據(jù)應(yīng)用,解決教育參與者因隱私擔(dān)憂而不愿共享數(shù)據(jù)的問題,改變教育機(jī)構(gòu)因隱私和倫理限制而無法實(shí)現(xiàn)精準(zhǔn)學(xué)習(xí)分析、資源全面共享的現(xiàn)狀,從技術(shù)層面實(shí)現(xiàn)教育信任機(jī)制,促進(jìn)精準(zhǔn)教學(xué)、資源共享,進(jìn)而推動教育變革。
2 教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型的構(gòu)建
教育大數(shù)據(jù)全生命周期隱私增強(qiáng)框架從應(yīng)用場景角度,明確了當(dāng)前教育大數(shù)據(jù)隱私增強(qiáng)的核心目標(biāo)和關(guān)鍵要素。依托此框架,本研究從技術(shù)實(shí)現(xiàn)角度提出教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型(下文簡稱“隱私增強(qiáng)模型”),以支撐數(shù)據(jù)驅(qū)動教育數(shù)字化轉(zhuǎn)型的信任機(jī)制實(shí)施,如圖4所示。教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型的提出,旨在以不接觸各教育參與方的源數(shù)據(jù)為前提,對不同隸屬方的數(shù)據(jù)進(jìn)行聯(lián)合建模、計(jì)算、分析,實(shí)現(xiàn)計(jì)算結(jié)果的可信交互和安全查詢,為從技術(shù)角度解決教育大數(shù)據(jù)全生命周期的隱私保護(hù)問題提供一體化、集成化的示范。
在核心的實(shí)現(xiàn)機(jī)制上,隱私增強(qiáng)模型在小粒度層面對學(xué)生、教師、科研人員等個體參與者的隱私數(shù)據(jù)實(shí)施不同程度的脫敏處理,在大粒度層面為學(xué)校、教培機(jī)構(gòu)、數(shù)據(jù)分析方等實(shí)體參與方提供多樣化的隱私增強(qiáng)計(jì)算方式。具體而言,學(xué)生、教師、科研人員等個體參與者基于隱私增強(qiáng)模型在設(shè)備端對個人數(shù)據(jù)進(jìn)行本地脫敏處理,學(xué)校、教培機(jī)構(gòu)、數(shù)據(jù)分析方等實(shí)體參與方則在數(shù)據(jù)共享時對大數(shù)據(jù)集進(jìn)行聚集脫敏處理。教育大數(shù)據(jù)經(jīng)脫敏處理后,利用密碼學(xué)手段進(jìn)行數(shù)字簽名,安全存儲于自有服務(wù)器或第三方服務(wù)器;之后,隱私增強(qiáng)模型利用同態(tài)加密進(jìn)行訪問控制,保證數(shù)據(jù)輸入輸出的機(jī)密性和查詢檢索的正確性。隱私增強(qiáng)模型通過安全多方計(jì)算等關(guān)鍵技術(shù)為多個參與方進(jìn)行安全多方計(jì)算提供可信執(zhí)行環(huán)境,保障任意教育參與者可以通過云計(jì)算或本地計(jì)算加入?yún)^(qū)塊鏈,以區(qū)塊交易的形式實(shí)現(xiàn)安全的數(shù)據(jù)流通和模型共享,并實(shí)現(xiàn)各方在不泄露源數(shù)據(jù)的前提下完成計(jì)算模型訓(xùn)練和知識挖掘分析任務(wù)。隱私增強(qiáng)模型將多種隱私增強(qiáng)計(jì)算操作服務(wù)化,形成PEaaS(Privacy-Enhancing as a Service),為不同教育參與者提供服務(wù)接口,以便捷地實(shí)現(xiàn)模型服務(wù)、分析服務(wù)、隱私求交服務(wù)、規(guī)則服務(wù)、隱私定制服務(wù)等。總的來說,隱私增強(qiáng)模型綜合考慮隱私計(jì)算不同技術(shù)的優(yōu)勢和特點(diǎn),深入剖析不同實(shí)體、不同階段對隱私保護(hù)的特定需求,實(shí)現(xiàn)一體化、全流程的隱私增強(qiáng),為實(shí)現(xiàn)安全的教育大數(shù)據(jù)應(yīng)用提供支撐。
3 教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型的應(yīng)用流程
教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型采用公有鏈和私有鏈相結(jié)合的聯(lián)盟鏈,來實(shí)現(xiàn)數(shù)據(jù)存儲和共享。相關(guān)教育主體各自獨(dú)立,故每個主體可以自行構(gòu)建單獨(dú)的私有鏈,以確保每個教育主體內(nèi)部實(shí)現(xiàn)數(shù)據(jù)隱私增強(qiáng)、安全計(jì)算建模與數(shù)據(jù)共享流通。隱私增強(qiáng)模型的應(yīng)用主要涉及5個角色,即任務(wù)發(fā)起方、任務(wù)參與方、可信實(shí)體、聚合計(jì)算中心和監(jiān)管方。其中,任務(wù)發(fā)起方和任務(wù)參與方之間沒有明確的劃分界限,兩者均可為學(xué)校、教育企業(yè)、研究機(jī)構(gòu)等教育主體;可信實(shí)體負(fù)責(zé)學(xué)校或其他教育機(jī)構(gòu)的密鑰管理和偽身份(即注冊產(chǎn)生的地址)注冊服務(wù);聚合計(jì)算中心負(fù)責(zé)教育數(shù)據(jù)加密計(jì)算和存儲;監(jiān)管方(如各級教育監(jiān)管部門)在聯(lián)盟鏈上部署監(jiān)管節(jié)點(diǎn),負(fù)責(zé)實(shí)時監(jiān)管和審計(jì)每一次數(shù)據(jù)交互。隱私增強(qiáng)模型的應(yīng)用一般包含四個環(huán)節(jié),分別是模型初始化生成、任務(wù)分布式參與、模型機(jī)密化計(jì)算、模型安全化共享。本研究以學(xué)校間的教育數(shù)據(jù)共享建模為例,展示教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型的應(yīng)用流程,具體如圖5所示。
(1)模型初始化生成
如圖5的步驟①~③,可信實(shí)體利用安全基礎(chǔ)設(shè)施初始化安全參數(shù)、數(shù)字簽名(如RSA、ElGamal)、訪問控制策略(如基于屬性加密的訪問控制),生成系統(tǒng)公共參數(shù)和主密鑰;采用不經(jīng)意傳輸和混淆電路的安全多方計(jì)算,對學(xué)校A、學(xué)校B完成密鑰分配,防止出現(xiàn)參數(shù)泄露的情況;登記和驗(yàn)證學(xué)校A、學(xué)校B的身份信息并發(fā)放唯一的身份標(biāo)識,通過密碼原語生成公私鑰對和相應(yīng)地址。隱私增強(qiáng)模型對學(xué)校A、學(xué)校B的所有個體用戶進(jìn)行匿名化處理,確保隱私數(shù)據(jù)不關(guān)聯(lián)個體身份信息;通過調(diào)用智能合約,將身份信息向聯(lián)盟鏈發(fā)起驗(yàn)證請求,新用戶驗(yàn)證通過后加入?yún)^(qū)塊鏈。倘若有惡意或不誠實(shí)參與方進(jìn)行投毒攻擊或其他非法行為,可信實(shí)體也能識別、恢復(fù)惡意參與方的真實(shí)身份,將其錄入黑名單,并反饋給區(qū)塊鏈中的其他成員,避免惡意參與方的訓(xùn)練模型對全局模型造成負(fù)面影響。同時,為了降低區(qū)塊鏈對海量數(shù)據(jù)的存儲成本和大規(guī)模數(shù)據(jù)交互的通信成本,隱私增強(qiáng)模型采用星際文件系統(tǒng)(Inter Planetary File System,IPFS)與區(qū)塊鏈結(jié)合的方式來存儲各類脫敏后的教育數(shù)據(jù)和每次迭代后產(chǎn)生的本地訓(xùn)練模型。
(2)任務(wù)分布式參與
如圖5的步驟④~⑨,隱私增強(qiáng)模型完成初始化后,個體用戶可以基于本地差分隱私對個人隱私信息進(jìn)行處理后上傳至學(xué)校A或?qū)W校B。當(dāng)基于特定需求生成應(yīng)用計(jì)算模型時,本隱私增強(qiáng)模型可以利用聯(lián)邦學(xué)習(xí)對數(shù)據(jù)進(jìn)行訓(xùn)練。任務(wù)發(fā)起方學(xué)校A通過共識機(jī)制向區(qū)塊鏈發(fā)布一個聯(lián)邦學(xué)習(xí)請求,請求記錄包含數(shù)據(jù)類型、數(shù)據(jù)大小、迭代輪數(shù)、模型結(jié)構(gòu)、聯(lián)邦學(xué)習(xí)算法、每輪迭代中的參與方數(shù)量等,再將本次聯(lián)邦學(xué)習(xí)需要訓(xùn)練的模型上傳至IPFS。任務(wù)參與方學(xué)校B對隱私處理后的聚合數(shù)據(jù)進(jìn)行訓(xùn)練,并將訓(xùn)練好的本地應(yīng)用模型存入IPFS,返回一個唯一的Hash(哈希函數(shù))值。其他任意任務(wù)參與方或?qū)嶓w想要使用學(xué)校B的應(yīng)用計(jì)算模型,只能通過該Hash值訪問IPFS得到。隱私增強(qiáng)模型基于多方數(shù)據(jù)檢索定位與本次聯(lián)邦學(xué)習(xí)請求相關(guān)的參與方集合(如學(xué)校B),并通過任務(wù)分配將聯(lián)邦學(xué)習(xí)請求轉(zhuǎn)發(fā)給學(xué)校B,學(xué)校B在任務(wù)開始前調(diào)用智能合約加入。學(xué)校A也可調(diào)用智能合約判斷請求者的真實(shí)身份,決定學(xué)校B能否成為此次聯(lián)邦學(xué)習(xí)的參與方——若是,就將模型Hash值、密鑰、聯(lián)邦學(xué)習(xí)算法等寫入智能合約,學(xué)校B通過調(diào)用智能合約獲取密鑰和模型Hash值。
(3)模型機(jī)密化計(jì)算
如圖5的步驟⑩~?,參與聯(lián)邦訓(xùn)練的學(xué)校A和學(xué)校B根據(jù)模型Hash值從IPFS下載初始全局模型,并在本地?cái)?shù)據(jù)集上訓(xùn)練應(yīng)用計(jì)算模型。每次模型更新時,學(xué)校A和學(xué)校B可以利用多密鑰全同態(tài)加密對應(yīng)用計(jì)算模型的參數(shù)進(jìn)行安全計(jì)算,返回一個模型Hash值,之后用自身公鑰對模型Hash值進(jìn)行加密并附上簽名打包,經(jīng)過智能合約檢驗(yàn)后上傳到聯(lián)盟鏈的IPFS,區(qū)塊鏈中各個參與方節(jié)點(diǎn)(即學(xué)校A和學(xué)校B)交換、驗(yàn)證所有的模型Hash值。聚合計(jì)算中心在每次迭代過程中需要驗(yàn)證任務(wù)參與方的簽名信息,利用私鑰解密加密模型的Hash值,并在IPFS中定位,下載所有上傳的應(yīng)用計(jì)算模型,通過安全多方計(jì)算協(xié)議接收參與方的加密本地模型參數(shù)并進(jìn)行密態(tài)計(jì)算,生成全新的、加密的全局應(yīng)用計(jì)算模型。在聯(lián)邦學(xué)習(xí)的每次迭代過程中,學(xué)校A和學(xué)校B之間通過執(zhí)行共識算法,將本次模型更新記錄生成區(qū)塊,并在聯(lián)盟鏈網(wǎng)絡(luò)廣播進(jìn)行驗(yàn)證,達(dá)成共識后上傳至區(qū)塊鏈,從而保證每代模型的訓(xùn)練過程可溯源[18]。學(xué)校A和學(xué)校B從聯(lián)盟鏈的IPFS下載最新的全局應(yīng)用計(jì)算模型,按照安全多方計(jì)算協(xié)議進(jìn)行解密,重新在本地訓(xùn)練自己的應(yīng)用計(jì)算模型,直至全局模型擬合或達(dá)到迭代次數(shù)。迭代結(jié)束后,聚合計(jì)算中心將訓(xùn)練好的全局應(yīng)用計(jì)算模型上傳到區(qū)塊鏈。
(4)模型安全化共享
如圖5的步驟?,學(xué)校A和學(xué)校B從聯(lián)盟鏈下載訓(xùn)練好的全局應(yīng)用計(jì)算模型的參數(shù),并在不獲取各參與方教育源數(shù)據(jù)的情況下利用訓(xùn)練好的模型進(jìn)行數(shù)據(jù)挖掘和分析。各種已訓(xùn)練好的的應(yīng)用計(jì)算模型(如學(xué)習(xí)資源滿意度預(yù)測模型、學(xué)生群體畫像、學(xué)習(xí)習(xí)慣預(yù)測模型等)可以被安全地訪問和應(yīng)用[19],且區(qū)塊鏈上的模型使用者(如科研人員、醫(yī)療機(jī)構(gòu)或其他注冊第三方)都可以申請用智能合約訪問鏈上各種已訓(xùn)練好的應(yīng)用計(jì)算模型。
三 教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型的典型應(yīng)用場景
教育大數(shù)據(jù)的融合共享,是構(gòu)建智慧型學(xué)習(xí)社會的關(guān)鍵要素之一。為更安全地融合、共享教育大數(shù)據(jù),并應(yīng)用教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型來助力教育數(shù)字化轉(zhuǎn)型信任機(jī)制的落地實(shí)施,本研究介紹了教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型的典型應(yīng)用場景,內(nèi)容涉及學(xué)分與資質(zhì)認(rèn)證、教育協(xié)同與治理、可信評教、個性化學(xué)習(xí)服務(wù)等多個方面。
1 隱私增強(qiáng)的學(xué)分與資質(zhì)認(rèn)證系統(tǒng)
當(dāng)支持“人人可學(xué),時時可學(xué),處處可學(xué)”的學(xué)習(xí)型數(shù)字社會初具雛形后,面臨的首要問題就是如何實(shí)現(xiàn)各機(jī)構(gòu)對學(xué)習(xí)者各階段學(xué)習(xí)經(jīng)歷和資質(zhì)的認(rèn)證,在保護(hù)學(xué)習(xí)者隱私的前提下實(shí)現(xiàn)終身學(xué)習(xí)管理和有效人才評價。教育區(qū)塊鏈?zhǔn)堑湫偷慕鉀Q方案,其核心是“去中心化”和“防篡改”的網(wǎng)絡(luò)內(nèi)容生產(chǎn)與存儲機(jī)制,對此全球各大研究機(jī)構(gòu)紛紛開始了積極的探索。以世界上第一個區(qū)塊鏈大學(xué)——Wolf大學(xué)為例,任何學(xué)者都可以在Wolf大學(xué)開設(shè)課程、上傳資源并發(fā)布證書,任何注冊學(xué)習(xí)者都可以學(xué)習(xí)這些課程并獲得學(xué)分和證書,而區(qū)塊鏈的共識機(jī)制、加密、哈希算法等核心技術(shù)能夠保證學(xué)分和證書的安全可信、不可篡改、可追溯。索尼與IBM合作開發(fā)了一套基于區(qū)塊鏈的教育服務(wù)系統(tǒng),邀請中小學(xué)、大學(xué)和企業(yè)使用這個系統(tǒng),其中數(shù)字學(xué)分、學(xué)歷證書面向第三方公開和共享,如雇主和Linkedln職業(yè)SNS服務(wù)機(jī)構(gòu)可以利用區(qū)塊鏈的不可篡改特性直接對學(xué)分和證書進(jìn)行審計(jì),并在共享過程中引入多方安全計(jì)算,其技術(shù)路徑與本研究提出的全生命周期隱私增強(qiáng)模型的技術(shù)思路相似,可以確保學(xué)習(xí)者檔案記錄的真實(shí)性和安全性。清華大學(xué)成立的青藤鏈盟是我國首個高校區(qū)塊鏈教育科研聯(lián)盟,旨在構(gòu)建一個支持人才培養(yǎng)的協(xié)同創(chuàng)新平臺,解決當(dāng)前優(yōu)質(zhì)人才培養(yǎng)過程中存在的資源共享不暢、學(xué)分互認(rèn)困難、評價方式單一等問題。上述案例都在技術(shù)上實(shí)現(xiàn)了安全的學(xué)分與資質(zhì)認(rèn)證,但當(dāng)前大部分教育區(qū)塊鏈尚未考慮全生命周期的隱私增強(qiáng),不同機(jī)構(gòu)在數(shù)據(jù)共享共用過程中仍然存在隱私泄露的風(fēng)險,導(dǎo)致機(jī)構(gòu)主體對于是否完全開放學(xué)習(xí)者數(shù)據(jù)仍然存在疑慮。本研究提出的全生命周期隱私增強(qiáng)模型能促進(jìn)教育區(qū)塊鏈上各主體之間的相互信任,使教育數(shù)據(jù)更加開放,并產(chǎn)生更大的價值。
2 隱私增強(qiáng)的教育協(xié)同與治理系統(tǒng)
隱私增強(qiáng)的教育大數(shù)據(jù)共享能破除數(shù)據(jù)孤島現(xiàn)象,有效促進(jìn)協(xié)同的教育合作與治理。借鑒健康醫(yī)療的數(shù)據(jù)共享案例,國內(nèi)外不少互聯(lián)網(wǎng)公司對獲得授權(quán)的大規(guī)模多源異構(gòu)醫(yī)療數(shù)據(jù)進(jìn)行了深度處理和分析,以打破信息孤島、實(shí)現(xiàn)醫(yī)療數(shù)據(jù)共享共通[20]。國內(nèi)“醫(yī)渡云”就是一個基于聯(lián)邦學(xué)習(xí)、安全多方計(jì)算等隱私計(jì)算方法的多方安全計(jì)算解決方案,旨在推進(jìn)醫(yī)療科研機(jī)構(gòu)(包括社區(qū)醫(yī)療、家庭醫(yī)生、體檢機(jī)構(gòu)等)之間多方、多樣化的數(shù)據(jù)協(xié)作與融合,同時保護(hù)原始數(shù)據(jù)信息安全。按照上述思路,基于教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型的教育數(shù)據(jù)共享系統(tǒng)采用分布式設(shè)計(jì),設(shè)置了平臺端(調(diào)度節(jié)點(diǎn))和教育組織端(計(jì)算節(jié)點(diǎn))。其中,平臺端負(fù)責(zé)各教育組織隱私計(jì)算節(jié)點(diǎn)和多方安全計(jì)算任務(wù)的統(tǒng)一管理與協(xié)調(diào);教育組織端處于私有云環(huán)境中,通過隱私增強(qiáng)計(jì)算協(xié)議完成聯(lián)邦學(xué)習(xí)與多方安全計(jì)算過程,各隱私計(jì)算節(jié)點(diǎn)對其所屬的數(shù)據(jù)有絕對的控制權(quán)[21]。教育數(shù)據(jù)共享系統(tǒng)的出現(xiàn),可為終身學(xué)習(xí)型社會下多元數(shù)據(jù)驅(qū)動的教育協(xié)同與治理提供支持;決策方從學(xué)校、機(jī)構(gòu)、企業(yè)、社區(qū)等獲得學(xué)習(xí)數(shù)據(jù)并進(jìn)行安全計(jì)算、聯(lián)合挖掘、聯(lián)合建模,可實(shí)現(xiàn)計(jì)算可信、可鏈接,拓寬了教育數(shù)據(jù)的利用維度;同時,在數(shù)據(jù)交換、共享的過程中,參與方之間沒有交換各自的原始數(shù)據(jù),可有效防范原始數(shù)據(jù)的泄露,降低了因數(shù)據(jù)流通可能引發(fā)的數(shù)據(jù)泄漏風(fēng)險。
3 隱私增強(qiáng)的可信評教系統(tǒng)
在學(xué)校評教活動中,學(xué)生往往會因擔(dān)心自己真實(shí)填寫的評教信息泄露引起教師和學(xué)校的反感,而對評教活動敷衍了事,導(dǎo)致評教系統(tǒng)形同虛設(shè)。對此,學(xué)校教務(wù)部門可引入教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型,通過隱私計(jì)算來保障評教信息不泄露,提升評教活動的真實(shí)性和有效性。可信評教系統(tǒng)利用門限ELGamal加密算法向?qū)W生端發(fā)放一對公鑰和私鑰,且每個學(xué)生端都能收到其他參與方公布的公鑰。學(xué)生在客戶端進(jìn)行評教,系統(tǒng)對真實(shí)的評教信息進(jìn)行同態(tài)加密,之后利用秘密共享方案將加密結(jié)果拆分成若干份,由統(tǒng)計(jì)方發(fā)送至其他客戶端進(jìn)行評分計(jì)算。每個客戶端都收到由其他客戶端發(fā)送的評分?jǐn)?shù)據(jù)后,在不需要解密的情況以分布式形式計(jì)算某個約定函數(shù)再輸出計(jì)算結(jié)果[22],重新整合成一個新的評分?jǐn)?shù)據(jù)集發(fā)送給教務(wù)部門。教務(wù)部門收到各客戶端發(fā)送的評分?jǐn)?shù)據(jù)集后,對匯集的數(shù)據(jù)集自動執(zhí)行一個安全多方計(jì)算協(xié)議,然后顯示計(jì)算結(jié)果。因此,教務(wù)部門對計(jì)算結(jié)果的分析和發(fā)布,是在不知道每個學(xué)生評教信息的前提下進(jìn)行的。基于隱私增強(qiáng)的教育評價既能有效保護(hù)被評價者的主體地位和隱私權(quán),又能保證評教結(jié)果的真實(shí)性,可實(shí)現(xiàn)評教的完整性、評教內(nèi)容的保密性、評教過程的真實(shí)性和準(zhǔn)確性。
4 隱私增強(qiáng)的個性化學(xué)習(xí)服務(wù)系統(tǒng)
個性化學(xué)習(xí)服務(wù)既是實(shí)現(xiàn)自適應(yīng)學(xué)習(xí)的核心,也是“人工智能+教育”的主要方向之一。當(dāng)前市場上涌現(xiàn)出了許多冠以個性化學(xué)習(xí)服務(wù)和指導(dǎo)的產(chǎn)品,致使學(xué)習(xí)者的學(xué)習(xí)行為、記錄、偏好等敏感數(shù)據(jù)面臨嚴(yán)重威脅。例如,美國非營利性教育科技公司inBloom的核心功能是提供個性化學(xué)習(xí)服務(wù),但由于缺乏教育數(shù)據(jù)隱私保護(hù)意識,導(dǎo)致學(xué)生的敏感數(shù)據(jù)在學(xué)校、學(xué)區(qū)和在線教育平臺中隨意傳播,遭到了學(xué)生家長和相關(guān)隱私維權(quán)組織的強(qiáng)烈抗議與抵制,最終破產(chǎn)。類似的案例還有很多,如Piazza濫用學(xué)生數(shù)據(jù)風(fēng)波、Edmodo因廣告漏洞造成學(xué)生信息泄露等[23]。面對此類問題,李康康等[24]提出基于聯(lián)邦學(xué)習(xí)的個性化學(xué)習(xí)推薦系統(tǒng),可以實(shí)現(xiàn)在海量智能終端之間聯(lián)合訓(xùn)練個性化學(xué)習(xí)推薦模型,模型參數(shù)在平臺服務(wù)器和智能終端之間加密傳輸,為各終端智能推薦模型進(jìn)行安全、及時的更新提供了保障;劉夢君等[25]提出基于差分隱私保護(hù)的學(xué)習(xí)資源學(xué)習(xí)熱度推薦,對學(xué)習(xí)資源推薦值進(jìn)行噪聲擾動之后再予以發(fā)布,在保證學(xué)習(xí)資源正確推薦的同時也保護(hù)了學(xué)生的學(xué)習(xí)隱私。但是,此類研究僅適用于單一環(huán)境的隱私風(fēng)險處理,其針對某個隱私漏洞提出單一的技術(shù)解決方案,缺乏面對數(shù)據(jù)共享的全生命周期隱私增強(qiáng)一體化解決方案。本研究提出的全生命周期隱私增強(qiáng)模型能夠與個性化學(xué)習(xí)服務(wù)系統(tǒng)進(jìn)行有效整合,讓學(xué)習(xí)者放心提供并共享學(xué)習(xí)數(shù)據(jù),可為在線學(xué)習(xí)的安全、健康、可持續(xù)發(fā)展保駕護(hù)航。
四 結(jié)語
本研究通過解析教育數(shù)字化轉(zhuǎn)型中的教育大數(shù)據(jù)隱私保護(hù)這一關(guān)鍵問題,從應(yīng)用場景角度設(shè)計(jì)了教育大數(shù)據(jù)全生命周期隱私增強(qiáng)框架,之后從技術(shù)實(shí)現(xiàn)角度構(gòu)建了相應(yīng)的隱私增強(qiáng)模型及應(yīng)用流程,旨在實(shí)現(xiàn)教育大數(shù)據(jù)隱私度而可匿、數(shù)據(jù)密而可控、結(jié)果隱而可用、應(yīng)用可信可溯,為教育數(shù)字化轉(zhuǎn)型戰(zhàn)略行動和教育數(shù)據(jù)要素化提供安全技術(shù)支持。
本研究主要從理論層面進(jìn)行了模型構(gòu)建和應(yīng)用場景分析,后續(xù)將重點(diǎn)開展教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型的實(shí)踐應(yīng)用,以實(shí)現(xiàn)頂層互融、底層互通、軟硬一體的隱私增強(qiáng)系統(tǒng)級解決方案。期待教育大數(shù)據(jù)全生命周期隱私增強(qiáng)模型從技術(shù)層面緩解甚至突破阻礙精準(zhǔn)學(xué)習(xí)分析、資源全面共享的隱私擔(dān)憂和倫理限制,促進(jìn)教育工作者建立健全教育數(shù)字化轉(zhuǎn)型的信任機(jī)制,促使人工智能在教育數(shù)字化轉(zhuǎn)型過程中承擔(dān)更多的功能和角色,助力教育大數(shù)據(jù)最大程度地發(fā)揮其價值,從而促進(jìn)教育高質(zhì)量發(fā)展,推動教育數(shù)字化轉(zhuǎn)型的變革實(shí)踐,真正構(gòu)筑安全可信的未來教育生態(tài)。
————————
參考文獻(xiàn)
[1]裴瑩,付世秋,吳鋒.我國教育大數(shù)據(jù)研究熱點(diǎn)及存在問題的可視化分析[J].中國遠(yuǎn)程教育,2017,(12):46-53、80.
[2][11]李鳳華,李暉,賈焰,等.隱私計(jì)算研究范疇及發(fā)展趨勢[J].通信學(xué)報,2016,(4):1-11.
[3]劉三女牙,郝曉晗,李卿.論教育的可計(jì)算性[J].電化教育研究,2023,(3):5-12.
[4]劉邦奇,喻彥琨,袁婷婷.智能技術(shù)賦能過程評價:目標(biāo)、路徑與典型場景[J].現(xiàn)代教育技術(shù),2022,(5):14-23.
[5]趙春,舒杭,顧小清.基于計(jì)算機(jī)視覺技術(shù)的學(xué)生課堂學(xué)習(xí)行為投入度測量與分析[J].現(xiàn)代教育技術(shù),2021,(6):96-103.
[6]祝智庭,彭紅超.信息技術(shù)支持的高效知識教學(xué):激發(fā)精準(zhǔn)教學(xué)的活力[J].中國電化教育,2016,(1):18-25.
[7]Daniel B K. Big data and data science: A critical review of issues for educational research[J]. British Journal of Educational Technology, 2019,(1):101-113.
[8]樂潔玉,羅超洋,丁靜姝,等.教育大數(shù)據(jù)隱私保護(hù)機(jī)制與技術(shù)研究[J].大數(shù)據(jù),2020,(6):52-63.
[9]劉夢君,姜雨薇,曹樹真,等.信息安全技術(shù)在教育數(shù)據(jù)安全與隱私中的應(yīng)用分析[J].中國電化教育,2019,(6):123-130.
[10]李青,李瑩瑩.大數(shù)據(jù)時代學(xué)習(xí)者隱私保護(hù)問題及策略[J].中國遠(yuǎn)程教育,2018,(1):29-36.
[12]螞蟻.隱語secretflow[OL]. lt;https://www.secretflow.org.cn/docs/secretflow/latest/zh-Hans/developer/design/architecturegt;
[13]Wei J, Li J, Lin Y, et al. LDP-based social content protection for trending topic recommendation[J]. IEEE Internet of Things Journal, 2021,(6):4353-4372.
[14]Sendhil R, Amuthan A. A descriptive study on homomorphic encryption schemes for enhancing security in fog computing[A]. 2020 International Conference on Smart Electronics and Communication (ICOSEC)[C]. Trichy, India: IEEE, 2020:738-743.
[15]Zhu Y, Dang J, Wang Y, et al. Research on blockchain in digital education resource sharing in colleges and universities[A]. 2021 IEEE International Conference on Computer Science, Electronic Information Engineering and Intelligent Control Technology (CEI)[C]. Fuzhou, China: IEEE, 2021:570-577.
[16]Huang X, Ding Y, Jiang Z L, et al. DP-FL: A novel differentially private federated learning framework for the unbalanced data[J]. World Wide Web, 2020,(4):2529-2545.
[17]Arachchige P C M, Bertok P, Khalil I, et al. A trustworthy privacy preserving framework for machine learning in industrial IOT systems [J]. IEEE Transactions on lndustrial Informatics, 2020,(9):6092-6102.
[18]Nupur J. Secured cloud computing for data management using big data for small and medium educational institutions[J]. International Journal of Computer Engineering and Technology, 2020,(2):21-30.
[19]Kulkarni V, Kulkarni M, Pant A. Survey of personalization techniques for federated learning[A]. 2020 Fourth World Conference on Smart Trends in Systems, Security and Sustainability (WorldS4)[C]. London, UK: IEEE, 2020:794-797.
[20]Alnemari A, Raj R K, Romanowski C J, et al. Interactive range queries for healthcare data under differential privacy[A]. 2021 IEEE 9th International Conference on Healthcare Informatics (ICHI)[C]. Victoria, BC, Canada: IEEE, 2021:228-237.
[21]Wang T, Mei Y, Jia W, et al. Edge-based differential privacy computing for sensor-cloud systems[J]. Journal of Parallel and Distributed Computing, 2020, 136:75-85.
[22]Breuer M, Meyer U, Wetzel S. Introducing a framework to enable anonymous secure multi-party computation in practice[A]. 2021 18th International Conference on Privacy, Security and Trust (PST)[C]. Auckland, New Zealand: IEEE, 2021:1-7.
[23]Jones K M L. Learning analytics and higher education: A proposed model for establishing informed consent mechanisms to promote student privacy and autonomy[J]. International Journal of Educational Technology in Higher Education, 2019,(1):1-22.
[24]李康康,袁萌,林凡.聯(lián)邦個性化學(xué)習(xí)推薦系統(tǒng)研究[J].現(xiàn)代教育技術(shù),2022,(2):118-126.
[25]劉夢君,賈玉娟,姜慶.差分隱私保護(hù)的學(xué)習(xí)資源學(xué)習(xí)熱度推薦[J].現(xiàn)代教育技術(shù),2019,(5):99-105.
Trust Mechanism for the Data-driven Education Digital Transformation
——Construction and Typical Application Scenario Analysis of Privacy
Enhancement Model for the Full Life Cycle of Educational Big Data
WANG Tao""" ZHANG Yu-Ping""" LI Xiu-Han[Corresponding Author]""" LIU Qing-Tang""" ZHANG Si
(Faculty of Artificial Intelligence in Education, Central China Normal University, Wuhan, Hubei, China 430079)
Abstract: Educational big data is becoming the core resource to drive the strategic action of digital transformation of national education, which brings great educational value. However, the collection and analysis of educational big data has generated privacy invasion risks and trust crisis and other serious problems, hindering the sharing, development and utilization of data. How to enhance the privacy protection and trust relationship of educational big data in open sharing, co-construction and co-employment has become a key problem restricting the data-driven education digital transformation. In regard to this, the paper firstly adopted the literature analysis method to analyze the research status and key issues of privacy protection of educational big data. Then, from the perspective of application scenarios, this paper designed a privacy enhancement framework for the full life cycle of educational big data, and constructed a privacy enhancement model for the full life cycle of educational big data and its application flow from the perspective of technology implementation to meet the privacy requirements of different entities and different stages. Finally, the typical application scenarios of this model were introduced, whose content involved credit and quality certification, education coordination and governance, trust evaluation of teaching, and personalized learning services. This research of the paper can clarify the key issues and technological solutions of privacy protection in open sharing of educational big data, and provide reference for realizing the privacy protection for full life cycle of educational data factionalization and establishing and improving trust mechanism of data-driven education digital transformation.
Keywords: educational big data; privacy enhancement; full life cycle; open sharing
————————
*基金項(xiàng)目:本文為國家自然科學(xué)基金青年項(xiàng)目“顧及誤差的位置服務(wù)個性化差分隱私保護(hù)機(jī)制研究”(項(xiàng)目編號:42001392)、教育部人文社會科學(xué)青年項(xiàng)目“CoP視域下中小學(xué)教師網(wǎng)絡(luò)學(xué)習(xí)社群的群體動力特征研究”(項(xiàng)目編號:21YJC880041)、華中師范大學(xué)中央高校基本科研業(yè)務(wù)費(fèi)資助項(xiàng)目“融合多模態(tài)數(shù)據(jù)的教師教學(xué)能力智能評價技術(shù)及應(yīng)用研究”(項(xiàng)目編號:CCNU22JC011)的階段性研究成果。
作者簡介:王濤,副教授,博士,研究方向?yàn)殡[私增強(qiáng)的教育數(shù)據(jù)應(yīng)用,郵箱為tmac@ccnu.edu.cn。
收稿日期:2023年8月13日
編輯:小米