張文青,穆曉靜,傅鋼善
(陜西師范大學教育學院,陜西西安710062)
倫理視域下的學習分析研究*
張文青,穆曉靜,傅鋼善
(陜西師范大學教育學院,陜西西安710062)
學習過程中涌現的大量技術使我們對學生學習過程的追蹤、復雜學習行為的分析成為可能,學習分析也通過對學生數據的測量、收集、分析,為教師的干預提供依據,為學生的個性化學習提供技術支持。然而,在學習分析的開展過程中,數據的收集和使用面臨大量的倫理挑戰,其中包括隱私、所屬權、人文關懷等問題。本文的目的在于梳理當前學習分析在開展過程中存在倫理問題,分析其研究現狀,分享從中得到的啟示,以期對后續研究有借鑒意義。
學習分析;倫理;數據挖掘
編者按:隨著教育信息化的不斷發展,各種教育教學信息系統中存儲的大量學生數據、學習軌跡、學習行為等信息急劇增長,這些數據集過大,難以被典型數據庫軟件共聚捕捉、存儲、管理和分析的教育類“大數據”,目前已成為教育機構關注的熱點,研究者們已經開始研究這些數據潛在的利用價值。學習分析作為分析技術的一種,也逐漸受到教育領域研究者的關注與重視。本專題研究立足于幫助教育工作者更好地了解學習分析技術,通過對倫理視域、Moodle平臺下學習分析的研究,以及典型案例分析、平臺建設經驗分享,力求使大家能夠認識學習分析的意義、掌握學習分析的方法,邁好大數據時代的數據“掘金”之旅。
隨著教育環境中新技術的不斷涌入,新數字設備的頻繁運用,學習中的交互性與日俱增,碎片化信息的分享也無處不在,在線學習管理系統也收集了學生大量的個人信息和行為數據。若使這些信息和數據能更有效地服務于教育,學習分析的作用則舉足輕重,它的應用也正在創造著教育領域的新景觀。例如,可汗學院的ALAS-KA[1]學習分析服務可以提供課程層面和學生個體層面的可視化信息,幫助師生在學習過程中做出決策,在有效的指導下檢測學生的學習風格。然而,在學習分析的進一步研究中,仍然存在很多問題,尤其是在倫理和實踐方面。例如,Moocs的研究者一直在關注著論壇中學生觀念的變化和知識的增長。指導公開發布交互數據的原則是什么?一個課程中的學習者應該同意數據的搜集和分析嗎?種種質疑不絕于耳。
學習分析從社會網絡分析、潛在語義分析、心理分析等領域中發展而來,(Ferguson,2012年)這些領域都有自己的倫理指南和行為規范,用以強調數據的所屬權、隱私、用戶是否同意等相關內容,但其并沒有完整、明晰地勾勒出學習分析在開展過程中的倫理關懷和道德挑戰。[2]所以,對學習分析中倫理問題的研究就顯得頗為重要。
Siemens將學習分析定義為 “為了理解和優化學習和學習發生的環境,對學習者的數據及其所處的情境進行測量、收集、分析以形成報告”。[3]新媒體聯盟(NMC,2012)認為:“學習分析是以評估學生學業進展、預測未來表現、發現潛在問題為目的,對學生的大量數據進行解釋的過程?!盵4]Oblinger(2012年)將學習分析與商業智能、學術分析進行了區分,認為學習分析關注“學生和學生的學習行為,從課程管理和學生信息系統中收集信息是為了更好地促進學生學習”。[5]
在教育領域中,由于在傳統環境中對數據的分析和反饋的處理方面經常有大量的操作延遲,所以以往對數據的使用往往是無效的。[3]而學習分析通過對學生數據的實時監測,可以有效縮短數據分析周期,為教師提供決策依據,優化教學,為個性化學習的推進提供支持。但是學習分析的意義絕不在于建立一所數據驅動的大學,教育的意義也絕不僅僅是研究教學方法與教學技術所帶來的教學效果。真正的學習分析應該在關注學習效率的同時遵守數字時代的倫理要求,學習分析的意義不單單在于測量,而在于其本質上的一種道德實踐。

一方面,數字技術的進步使互聯網給予了我們前所未有的自由,任何人都能暢所欲言;與此同時,萬事萬物都能被追蹤,經過追蹤,個人信息和行為顯露無疑。英國倫敦政治經濟學院教授理查德·桑內特說,例如Google 和Facebook,他們唯一能夠賺錢的方式就是披露人們的個性,更多挖掘人們的個人信息,及時找到與他們個人信息相關的郵件或者短信息。在英國,上千萬認為Google跟蹤了自己在線行為的受害者將形成人類史上最大的集體訴訟。在歐洲六個國家的數據保護機構將對Google展開聯合法律調查。這一現象表明,個人隱私泄露造成的負面影響已不容小覷。
另一方面,大數據時代數據的真正價值恰恰體現在數字的“二次用途”中。學習分析通過對數據的進一步挖掘與加工,使優化學習者的學習及其學習環境成為可能,使教育中所倡導的個性化學習成為可能。個性化學習即根據長期網絡應用軌跡,對所得數據進行挖掘、研究,從而為每個學生提供最合適學習的內容。Kobsa(2007年)認為學習分析和個性化學習的共同點是它們都需要收集用戶的私人信息,并運用這些數據去提升個人的學習經驗。[6]

盡管線下的研究中數據的所有權是相當明確的,但是在互聯網中數據的所有權卻經常混淆,例如數據庫、數據集、服務等很難找到其相應的國界或者所屬機構。而且在課程中,學生經常會用到系統外的社交網絡,由于這些網絡不屬于研究機構管轄的范圍,其數據跟蹤也有一定的困難。同時研究機構如何讓學生了解這些數據的范圍和屬性,如何讓學生知道發布在這些社交網絡上的信息有被公開和被濫用的可能,這些問題困擾著我們。在實踐中,由于管理、資金各種因素,很多有關部門都需要訪問學生數據,這對數據的安全造成了很大的困擾,這些安全隱患能否通過清晰的訪問權限來規避也需要進一步研究。

學習分析是學習者在一個特定時間和特定情境中的快照式的反應。若想更好地發揮學習分析的作用,學習者縱向時間上的數據和更為詳盡的記錄就顯得頗為珍貴,這些數據若盡可能長久地儲存則會使效果更加明顯。但是如果學生的不良信息被永久性地記錄,那么這些數據的存在則會對學生今后的生活構成潛在的威脅,使其陷入“一失足成千古恨”的窘境。忘記是人類基本的能力,人類歷史上的一切事物都因寬容與遺忘變得更美好。正是由于這些數據的數字屬性,所以應該允許學生申請刪除不良數據,從過去的經驗中反省和調整,而不是讓那些過去的經驗成為成長歷程中永久的污點,讓學生的個人檔案變得“像數字皮膚中的紋身”[7](Mayer-Sch?nberger,2009年)那樣揮之不去。因此用于學習分析的數據是否應該有一個雙方一致贊成的研究期限,屆時可以允許學生請求數據的刪除,這是一個值得深究的問題。
學習分析在教育中存在的種種問題向我們提出挑戰:我們既想發揮學習分析在分析學生時的潛能,又想正確應對倫理上的挑戰,途徑之一則是形成機構間的行為規范。例如Bienkowski(2012年)等人引用了在“美國家庭教育權利隱私法”(the U.S.Family Educational Rights and Privacy Act)的準備中所做的工作,澄清了數據集的訪問與學生隱私需求之間的對立關系。[8]Petersen(2012年)提出要遵守美國聯邦貿易委員會的公平信息實踐原則,該原則包含知情同意,數據使用選擇,在檢測數據的精確性和完整性時個人的權利,預防越權的存取、使用,泄露數據,執行和賠償的條款等等。[9]Slade和Prinsloo (2013年)提出一系列原則去指導院校在學習分析中處理倫理的相關問題。在立法機構與研究人員共同努力的同時,出現的非盈利組織也在保衛用戶的數字權利。
在此筆者試圖從數據的收集、測量、分析等方面考慮學習分析開展過程中的隱私與倫理因素,以期對學習分析能夠得到更好更規范的運用起到借鑒作用。

學習分析在教育領域的應用首先應該遵循透明原則。在研究過程中,學生的哪些數據要被使用、使用目的、使用條件、訪問權利、個人身份保護措施等都要詳細說明。教育機構有責任保護學習者在系統中的數據,有義務及時提示學習者系統之外存在的風險。
其次,在學習分析過程中我們應該考慮學習者的知情同意。Toch、Wang和Cranor(2012年)做了一份有關社交網絡中因個性化而產生隱私風險的調查,結果表明,由于這些網站上發布內容會被呈現在朋友或同學面前,所以用戶會感到潛在的不安。[10]也有研究表明,學生處于監視之下時,出于一種自我保護的意識,往往不會表現出其真實想法。因此,只有研究者和學習者雙方一致認識到誠實和詳盡的數據的重要性,才能實現最優的個性化,接受到合適的學習支持,獲得最高的學習效益。我們建議,要在保證研究質量和保護用戶免受危害之間取得一個合理的平衡。在學習分析情境中,如果沒有特殊的原因,應向學習者取得知情同意,學生也應在制度的保障下、雙方相互信任的前提下,表現出真實的自己。

在從分散的資源中收集數據時,所記錄的學習者活動往往是分布式的,也由于系統中的數據量不足以準確勾畫出學習者的學習行為,所以研究者傾向從學習管理系統之外的網站獲得更多的學習者軌跡。但是系統之外的數據不易被跟蹤,加之網絡的分布式屬性,我們不僅不能獲得全部數據,而且所獲得的數據還需要進行大規模的過濾,將看似無用的信息轉化成與教育相關的信息。所以在數據的收集傳輸過程中不僅應該保證在不同的網站、不同的標準、不同的所有者、不同的訪問水平下,不能放大錯誤,而且要嚴格控制傳輸、過濾過程,有效控制外部網絡。
同時,數據的收集應在一個清晰規定的訪問權限下進行。當訪問權限不明晰,就會存在安全性威脅或者用戶高度敏感的數據被泄露的問題,用戶便不會信任該研究。研究機構必須對訪問權限給予足夠的重視。在最初的研究設計過程中,要對訪問權限進行明確規定,清楚地描述出哪些用戶允許訪問、操縱哪一部分信息,用戶也應相應地了解他們所能操縱的信息類型。相關學者針對學習分析的實踐方法提出了“以學生為中心”的觀點,[11]堅持“學生為中心”的學習分析,就應取得學生的知情同意,保證學生的相關數據不被越權存?。痪蛻ㄟ^一定的措施保護學生數據的訪問,避免未授權的人訪問他們的個人數據。

在數據分析階段,構建系統化的行為模型就需要做出一些假設,比如假設學習環境是一成不變的,不同變量之間的聯系也可能是假設的,當學習管理系統中處理一些錯誤和不完整的數據時,在模型的分析上就可能受潛在的偏見和固有陳規的影響;另外,學習分析的算法也不可避免地保留著文化上、地理上、經濟上和社會上的偏見和成見。考慮到學習情境的不可復制和學生群體的差異性,研究機構應對數據分析的情境仔細斟酌,盡量杜絕偏見的存在,承認所收集的學生經驗動態的數據并不完整,所分析出的預測模型和算法應避免直接的遷移。
學生應自覺地參與合作,與研究機構一起收集數據、做出決策,構建自己的身份,使學習分析更好地為個體的學習和發展服務。“以學生為中心”的學習分析建議學生作為他自己數據的聯合解讀者,可能的話甚至是收集和鑒定數據的參與者。唯有這樣,學生才能知道他自己在系統中的行為,才能利用這些數據來反應或者改變行為。
[1]Ruipérez-Valiente,J.A.,et al.ALAS-KA:A learning analytics extension for better understanding the learningprocessintheKhanAcademyplatform[J].Computers in Human Behavior(2014),http://dx.doi.org/10.1016/j.chb. 2014.07.002.
[2]Ferguson,R.(2012,March).The state of learning analytics in 2012:A review and future challenges(Tech. Rep.No.KMI-12-01)[EB/OL].Milton Keynes,UK: The Open University,Knowledge Media Institute.http:// kmi.open.ac.uk/publications/techreport/kmi-12-01.
[3]Long,P.,&Siemens,G.(2011,September/October). Penetrating the fog:Analytics in learning and education[J]. EDUCAUSE Review,46(5):31-40.
[4]NMC(New Media Consortium)(2012).Horizon Report>2012 Higher Education Edition[R].[2014-06-18].http://www.nmc.org/publications/horizon-report-2012-higher-ed-edition.
[5]Oblinger,D.G.(2012,July/August).Let's talk analytics[J].EDUCAUSE Review,47(4):10-13.
[6]Kobsa,A.(2007).Privacy-enhanced web personalization[A].In P.Brusilovsky,A.Kobsa&W.Nejdl(Eds). The adaptive web(pp.628-670)[C].Berlin:Springer.
[7]Mayer-Sch?nberger,V.(2009).Delete:The virtue of forgetting in the digital age[M].Princeton,NJ:Princeton University Press.
[8]Bienkowski,M.,Feng,M.,&Means,B.(2012). Enhancing teaching and learning through educational data mining and learning analytics:An issue brief[EB/OL]. Draft paper submitted to the Office of Educational Technology,U.S.Department of Education.http://evidenceframework.org/wp-content/uploads/2012/04/EDM-LABrief-Draft_4_10_12c.
[9]Petersen,R.J.(2012,July/August).Policy dimensions of analytics in higher education[J].EDUCAUSE Review, 47(4):44-49.
[10]Toch,E.,Wang,Y.&Cranor,L.F.Personalization and privacy:a survey of privacy risks and remedies in personalization-based systems[J].User Modeling and Useradapted Interaction,2012(12):1-2,203–220.
[11]Prinsloo,P.(2012,May).ODL research at Unisa[A]. Presentation at the School of Management Sciences[C]. University of South Africa,Pretoria.
(編輯:王天鵬)
G40-05
:A
:1673-8454(2015)09-0003-03
2013年“現代教育技術”陜西師范大學首批信息化示范課程建設項目前期研究成果。