
摘要:如今,教育大數據的應用進入了瓶頸期,機械、單一、截斷式的數據已無法滿足當下教育發展的需要。而與一般性的教育大數據相比,教育領域中學生隊列資源具有連續、豐富、可解釋等優勢,有望成為破解發展瓶頸的重要舉措。基于此,文章首先梳理了學生隊列資源的概念與價值潛能,然后基于醫療領域隊列建設思路,總結包含教育目標選取、暴露因素定義、研究對象設置、隨訪計劃制定和數據分析存儲的隊列資源建設整體框架,最后指出隊列資源建設存在的隱私保護、追蹤成本和樣本覆蓋面等諸多挑戰,并提出提高安全意識、發揮技術優勢和開展更大規模隊列建設等策略。文章通過研究,旨在為推動教育領域學生隊列資源建設與發展提供參考,彌補現有教育數據缺陷,發揮數據在教育領域中的作用。
關鍵詞:學生隊列資源;價值潛能;教育領域;個性化培養
【中圖分類號】G40-057 【文獻標識碼】A 【論文編號】1009—8097(2023)06—0054—10"【DOI】10.3969/j.issn.1009-8097.2023.06.006
引言
大數據進入教育領域后,為教育教學帶來了空前的發展機遇,并有望成為破解教育領域公平、優質、個性化等時代難題的利器[1]。但同時,伴隨教育大數據在教育實踐中的應用開展,純粹的數據分析帶來的數據浮夸,促使我們不得不正視大數據的局限,警惕對數據的盲目依賴[2][3]。這種盲目除了受限于研究方法的使用以及研究者的解讀,還受限于數據的質量。教育大數據不僅要獲得更大體量、更多樣的數據,還要獲得對教育領域更具價值、更有意義的數據。這類數據不是機械、單一、截斷式的,而是復雜、連續、細節豐富、面向學生成長發展的有意義的數據。因此,如何在現有教育大數據的基礎上增加教育屬性、補充教育意義、豐富細節信息,成為突破現有教育大數據使用局限、發揮教育數據價值的關鍵。針對其涌現了大量的研究成果,如孫眾等[4]提出教育領域需要價值更大的、有意義的數據,這些數據凸顯在學生認知、行為、情感等多維度學生綜合發展上,且能夠為教與學的科學決策提供支撐。孫智中等[5]提出厚數據的概念,希望在已有事實基礎上,融入特定細節、概念結構和豐富含義,加厚數據,為進一步科學決策提供更多的細節。這些研究的嘗試和突破,為進一步完善教育大數據提供了寶貴的經驗。然而,教育大數據還具有一個不容忽視的特點,那就是數據的連續性。教育數據是學生成長發展的一個側面,每一個成長細節都有可能成為學生發展的決定性因素,而這些細節往往存在于各種不間斷的成長歷程中。打破現有教育數據的截斷式不足,就不得不另辟蹊徑嘗試對數據進行連續跟蹤。醫療領域的隊列資源,因其具有長期隨訪、細節豐富、可解釋性等特征,在改善醫學模式、推進大數據醫療等方面具有變革性的作用[6]。為此,在教育領域中引入隊列資源建設思路,有望從源頭上提升數據質量,發揮數據作為教育領域戰略資產的重要價值。同時,隊列資源包含的大量細節數據,還將為挖掘學生成長規律、關鍵事件的追蹤與溯源、識別高輟學率學生群體等提供基礎性的支撐[7][8][9]。
基于此,本研究將首先闡釋教育領域學生隊列資源的概念與特征、資源建設基礎以及價值潛能,然后總結教育領域學生隊列資源建設的框架,最后探討當下教育領域隊列建設的挑戰與應對策略,以期通過引入隊列思想,為建設教育領域的學生隊列資源提供思路,進一步提升現有教育大數據的質量和可用性。同時,也期望在建設過程中,促使教育領域思考教育中的數據不只追求規模的“大”、體量的“大”,還要追求數據價值的“高”和質量的“好”,打破數據的截斷、孤立,回歸數據的連續。
一 教育領域學生隊列資源的概念、建設基礎與價值潛能
1"教育領域學生隊列的概念與特征
(1)教育領域學生隊列的概念
“隊列”(Cohort)本意是指具有共同特征的人群組,源于拉丁文Cohors,意為步兵大隊[10]。在流行病學研究中,隊列指具有共同經歷、暴露因素或特征的一群人或研究者,如一個特定時期出生的人群組即可稱為出生隊列[11]。在教育領域中,隊列是以具有共同因素特征為線索的一組學生群體,這些特征對學生成績表現、能力發展和情感轉變等最終教育表現具有一定的影響。
教育領域學生隊列資源是指通過隊列研究,針對某個特定維度形成一組具有共同特征、連續跟蹤、規整處理后的學生長期隨訪數據。學生隊列資源本質上是一組具有共同影響因素的學生發展數據,通常由研究者通過觀察特定因素下學生群體的最終教育表現,分析該因素與教育表現之間的關聯程度[12],形成具有相同高影響因素的學生發展數據資源。
(2)教育領域學生隊列的特征
與一般性的教育大數據相比,教育領域的學生隊列資源具有連續、豐富、可解釋等特征:
①連續性。學生發展是一種持續性的改進,傳統的教育大數據通常是階段性地采集和獲取數據,這導致教育大數據中的數據可能會以課程或以學期為單位被孤立地切割成一些片段,而無法反映連續的發展過程。學生隊列資源的建設過程是針對某一特征維度進行長周期的隨訪和追蹤,并以此積累數據,直至發生預期的結果,這就保證了數據的完整性和連貫性。
②外部真實性和細節豐富性。學生隊列資源建設需要在自然狀態下對研究對象的特征進行觀察、記錄,因此保證了外部的真實性。此外,隊列資源在數據模態上既包括量表、行為等結構化數據,也包括視頻、文本等非結構化數據,還包含數據的時間序列細節,這保證了數據內部的真實性,也為探究成長過程相關因素與最終發展表現之間的關系提供了豐富的細節。
③可解釋性。一方面,學生隊列資源數據通常以一個理論上的“暴露”因素為出發點,進一步分析特殊事件的成因、發展歷程以及未來走勢,因此更具有針對性;另一方面,學生隊列資源數據不僅包括對事件本身的記錄,還包括相關的社會文化背景、經濟情況、家庭因素等數據——這為全面、立體地闡釋最終教育結果發生的內外機理提供了現實的可能。
2"教育領域學生隊列資源的建設基礎
對教育領域來說,學生隊列資源是一個新的概念,但無論從建設理念、政策支持,還是從數據基礎上來說,學生隊列資源建設都并非從零起步。
①建設理念上,在發展心理學中有專門追蹤調查學生發展的相關研究,為教育領域學生隊列的建設提供了方向性支撐和操作指導,如哈佛大學從1938年開始設立的成人發展追蹤項目(Harvard Study of Adult Development,HSAD)、英國從1963年開始至今的《人生七年》(The Up Series)紀錄片以及中國人民大學中國調查與數據中心的中國教育追蹤調查(China Education Panel Survey,CEPS)。
②政策支持上,國家層面逐漸重視教育大數據的建設、標準的制定、數據的打通和相關安全倫理問題,并出臺相關政策予以支持。這些政策對于進一步建設和發展教育領域隊列資源同樣具有關鍵性的作用,如十年前教育部印發的《教育信息化十年發展規劃(2011-2020年)》就明確指出,要“建立以各級各類學校和師生為對象的國家教育管理基礎數據庫”;而在2018年教育部印發的《教育信息化2.0行動計劃》也進一步強調要建立“覆蓋全國、統一標準、上下聯動、資源共享”的教育政務信息資源大數據,打破數據壁壘。
③數據積累上,近年來在國家不斷倡導和推動教育大數據的發展背景下,已然積累了大量教育領域的大數據。這部分數據一方面來自前期教育信息化實踐中積累的海量數據,包括學生學習過程的行為表現數據的積累[13]、教師和學生的教學評價數據的記錄[14]等;另一方面來自國家專門組織建設的針對學生體質健康、心理發展、學業發展等的大規模教育領域數據庫(網址:https://cicabeq.bnu.edu.cn/index.htm)。這些學生個體層面的細粒度數據累積,將成為隊列資源建設中歷史對照隊列重要組成部分。
3"教育領域學生隊列資源的價值潛能
教育領域學生隊列資源作為教育大數據中特殊的一類,除了具有教育大數據本身的優勢,其在挖掘學生成長發展規律、探索學生發展要素、識別個性化特征指導教育教學等方面也蘊含著重要的價值潛能。
(1)學生隊列資源是教育規律挖掘的基礎支撐
基礎規律是教育研究問題域框架的根本,也是整個教育研究問題落地開展的前提,對于構建適合新時期的教育治理、教育評價以及教育供給模式均具有重要的指導意義[15]。然而,基礎規律本身會因時代的發展而發生改變,如果無法精準把握最新的基礎規律,尤其是新時期學生成長發展的基礎規律,也就無法精準、高效地給出適合這個時代學生發展特征的教育教學活動。
學生隊列資源所具有的豐富的數據細節、清晰的時間序列、連續跟蹤的數據基礎、全面的多維度特征,為從不同角度挖掘學生成長發展的基礎規律提供了與時俱進的數據支撐:一方面,學生隊列資源的不斷更新和連續跟蹤,能夠有效地保證數據的時效性,從而為挖掘與時俱進的規律提供抓手;另一方面,學生隊列資源的“維度”包含不同研究指向,通過不同維度的切片分析能夠實現對學生成長發展規律的全面呈現。例如,澳大利亞的學生表現分析器(Student"Performance"Analyser,SPA)平臺中的隊列跟蹤模塊SPATRACKER就提供了極為便捷的維度抽取功能,從而支持不同維度隊列數據的分析,以此全面呈現學生成長發展的規律。
(2)學生隊列資源是支撐追蹤溯源識別影響因素的重要基礎
教育評價作為教育改革和發展的指揮棒,其根本目的在于促進人全面而有個性的發展[16],而非證明某一個特定的結果。要想充分發揮教育評價結果的導向、診斷和改進的育人作用,就必須回答究竟哪些因素影響最終結果、這些因素如何產生影響,以及影響程度如何等問題。
學生隊列資源由于具有豐富的細節特征,因此對于從終點事件回溯影響因素及其關鍵的時間節點具有重要的意義,具體過程包括:設定典型事件,并運用最大信息系數法、Apriori算法等關聯分析方法,借助具有時序信息的學生隊列資源,計算特定時間窗口下關鍵要素的特征向量和典型事件特征向量的相關性,識別關鍵影響因素與時間節點。例如,李龍等[17]針對全國初中教育階段的10000余名初中生進行隊列研究,通過追蹤溯源發現,性別、認知水平、居住方式以及學校排名等因素對流動兒童的心理健康產生顯著的影響;Bohlin[18]通過追蹤研究96名兒童橫跨8~9年的隊列數據分析發現,早期兒童形成的安全或不安全依戀關系與學生在校的表現具有高度的關聯關系。
(3)學生隊列資源是實現規模化教育與個性化培養的重要抓手
《中國教育現代化2035》提出,要利用現代技術加快推動人才培養模式改革,實現規模化教育與個性化培養的有機結合。規模化教育強調規模的普及、突出共性,個性化培養強調因材施教、突出個性,這看似相互矛盾的導向,卻有望在大數據的加持下實現有機的結合[19]。學生隊列資源作為教育大數據中有著豐富細節特征的數據資源,其本質是由多個維度特征匯聚而成的數據立方體。不同維度特征滿足了靈活、多樣的個性化需要,而同一維度匯聚的海量群體則實現了標準、統一的規模化目標,這就在保證規模化教育的同時,做到了尊重不同學生的差異特征、滿足個性化需求。例如,在MOOC學習中,學生在線學習隊列能夠從規模化的角度識別不同群體的特征,并重點識別具有高輟學風險的學生,同時借助隊列資源的其他維度,展開有針對性的分析,實現為學生提供個性化的即時預警與規模化的教育支撐。
二 教育領域學生隊列資源建設框架
從教育領域學生隊列資源的概念和特征出發,要實現隊列資源的價值潛能,需要建立一套教育領域中隊列資源建設的標準化框架。為此,本研究以特定的教育結局為指向,通過選擇關鍵因素,設置研究對象和對照群體,采用長期隨訪方式,收集數據并進行分析,針對具有因果指向的因素形成特定維度的隊列資源,構建了教育領域學生隊列資源建設框架,如圖1所示。
1"選取教育結局目標
教育結局是指通過隊列研究期望達成的教育目標,決定了隊列的價值導向。教育領域中學生隊列資源建設的目標選擇需圍繞學生成長發展的關鍵教育問題,概括來說,包括微觀上的學生個體感受、中觀上的學生外在表現的終點事件和宏觀上的教育成本效益等。具體來說,微觀層面是對學生個體認知感受的評判,如學生的情緒結果、態度表現以及價值觀等;中觀層面主要是學生參與教育活動實施后表現出來的外在教育表現,如學生的成績、綜合素質、認知水平、能力表現等;宏觀層面則是從社會角度出發,探究某種教學策略或者學習方式實施后帶來的教育投入與產出的關系,如投入產出比、學習成本等。
以筆者所在團隊開展的教育領域學生隊列資源建設為例,在選取教育結局時,將以中觀層面學生綜合素養表現為核心指標,重點圍繞學生在受教育過程中形成的跨越學科的價值觀、必備品格和關鍵能力開展隊列建設。在實際操作過程中,由于要測量出學生最終綜合素養的結果,因此除了需給出明確的操作層面指標定義,還需給出指標的權重與從指標到素養的算法公式。
2"選擇“暴露”因素
“暴露”是流行病學概念,是指研究對象接觸過某種物質(如過敏原),或具備某種特征(如超重、遺傳等),或具有某種行為傾向(如吸煙),或接受了某種預防或者治療措施(如疫苗接種、激素使用等)[20]。在教育領域學生隊列建設中,暴露與影響因素相似,是指有可能影響學生成長發展的某些因素,這些因素既包括學生的內部特征,如學生的學習態度、家庭環境、行為表現等,也包括外部的影響因素,如學習方式、教學干預等。
在教育領域中任何可能與學生的最終發展存在關聯的因素,都有可能被概括到“暴露”因素。但考慮到人的發展具有極其復雜的特性,故除了單一因素,還有更多相互影響的交織因素也會成為影響因素。比如,由于父母教育方式的不同通常會影響子女的學業成就,因此“父母的教育方式”可以成為潛在的影響因素;“成就的目標定向”作為成就動機之一會影響學業表現,也是潛在的影響因素之一。但研究者發現,“父母的教育方式”會通過影響“成就的目標定向”來間接影響學業表現[21]。也就是說,“父母的教育方式”與“成就的目標定向”之間會相互影響,這兩個因素可以被進一步細化形成“權威方式—掌握目標”的影響因素。
在實際操作中,選擇教育領域“暴露”需考慮以下四個因素:①必須具有教育意義和實際的指導意義。比如,如果通過長期隨訪發現特定的學習方式能夠更好地促進學生發展,則該學習方式有可能在特定情境下被推廣和應用,以在更大的范圍內提升教育質量;反之,如果將單一的學生出生日期作為潛在因素,則無法為教育教學提供直接的指導,因此其不具有成為影響因素的條件。②需要給出“暴露”的操作層面定義,并具體到可計算的層面。比如,探究在線學習是否影響學生成績表現時,需要明確定義暴露是在線學習的次數,還是在線學習的時長?③需要關注影響因素的作用頻次,是一次性還是連續性的作用。比如,某種教學策略的變革影響學生學業表現,短時間內是一次性的作用,但如果以此養成學生的某種學習習慣,則有可能形成連續性的作用。④需要隨時判斷是否一直處于設計的影響因素作用下,如果發現存在影響因素狀態的變化,則需要進行教學干預以即時調整,進行隊列的遷移。例如,構建城鄉隊列時,如果在隨訪期內發現學生狀態存在城鄉之間的切換,則需要進行隊列的遷移或個體的去除。
3"設置研究對象
“結局指標”是學生隊列資源建設的目標指向,是否“暴露”是隊列分組的唯一根據。為此,需要在目標指向確定的基礎上,依據有無潛在影響或可能影響的層次選擇實驗群體和對照群體。
與隨機對照實驗不同,隊列研究通常不需要設定過于苛刻的準入機制來保證結果的真實性,但考慮到學生的成長發展受很多因素的影響,因此在研究對象設置上需滿足以下條件:①具有相同教育目標的價值取向,選擇共同的目標;②選擇相似的學生群體,保證結果的準確性;③依據有無潛在影響因素劃分不同的組別,將有潛在影響因素的組別作為實驗組,無潛在影響的組別作為對照組。
4"制定隨訪計劃與長期隨訪
隨訪的本意是通過通訊或其他方式,定期了解樣本對象在研究過程中的變化。正式隨訪之前,通常會制定明確的隨訪計劃,以完成相應數據收集。隨訪計劃包括隨訪方式、隨訪時間和失訪分析等[22]。
隨訪方式包括直接隨訪,如通過面對面的課堂觀察、課堂錄像、學生訪談的方式直接獲得學生表現的數據;也包括間接隨訪,如通過學生測評成績、作業表現、交互數據等其他學生留存的信息間接獲取數據。不同隨訪方式決定了采用不同的數據采集方法,間接隨訪可以從已有信息化平臺對接數據,包括對學生學習活動的日志信息對接和行為、心理、生理等伴隨式數據獲取等;而在直接隨訪中除了上述數據獲取方式,還可以通過現場測試、訪談等方式獲取一手的數據。
隨訪時間,包括隨訪的起始、間隔和終止時間。隨訪起始時間通常與正式開始隊列研究同步,頻次通常視研究目的而定,可以周或月為單位。終止時間包括觀察終點和觀察終止兩種類型,其中觀察終點即在研究中出現了明顯的預期結果后停止觀察;觀察終止則以研究的工作截止時間為界。比如,在隨訪期為5年的學生成長發展隊列研究中,盡管5年后學生的成長發展依然在持續,但作為研究需要終止。
失訪分析主要是指分析隊列研究中學生樣本數量丟失的情況。失訪率較大,容易帶來隊列的偏倚。為了控制失訪率,在學生隊列資源建設的隨訪計劃中建議首先簽署知情同意書,以此盡量降低隊列研究過程中對象的丟失;同時需加強隨訪人員的培訓,盡量減少漏訪。
5"分析暴露因素與結果判斷
隨訪期結束后,需要對采集到的過程數據與最終的表現進行統計分析,以判斷“暴露”因素與最終結果的關聯關系。通常來說,研究者大多采用卡方檢驗、單因素方差分析等統計分析方法,分析潛在影響因素是否具有影響作用,以此判斷“暴露”因素是否是影響教育結局目標的關鍵因素。對于在統計意義上存在顯著相關的“暴露”因素,需要對因素進行歸檔整理,形成教育領域學生隊列的維度特征,支持后續學生隊列資源的檢索和抽取。而對于不存在顯著相關的“暴露”因素,需要返回因素選擇階段,重新設計“暴露”因素,制定隨訪計劃,開展隊列研究。
6"抽取維度數據與存儲分析
在確定隊列維度之后,需要對隊列研究過程中采集的原始數據進行分門別類的抽取與存儲,以此形成隊列資源。學生隊列資源存儲本質上屬于分析型數據存儲形式,因此在設計上與數據倉庫高度相似——將隊列維度特征、時間等要素設計成維度表,學生成長過程中的教育目標、影響因素等成長發展數據設計成事實表,并通過抽取工具(ETL)將隨訪過程中的原始數據按照一定的匯聚標準和規則,定期抽取補充到隊列資源庫中。
借助隊列維度、粒度、層次等結構方面的設計形成學生隊列數據立方體模型,能夠對學生隊列數據進行鉆取、上卷、切片以及旋轉等多維分析操作,從而支持學生隊列進行發展常模測算、影響因素發現和成長軌跡溯源。
三 教育領域學生隊列資源建設的現實挑戰與應對策略
考慮到教育系統自身的復雜性,在建設學生隊列資源過程中會面臨包括數據隱私保護、倫理問題、追蹤成本、樣本覆蓋的多樣性等在內的諸多挑戰。而要應對這些挑戰,需要提高安全意識、發揮技術優勢、組織更大規模學生群體隊列資源的建設。只有突破教育領域學生隊列資源建設的困境,才能更好地發揮學生隊列資源在教育領域中的價值潛能。
1"教育領域學生隊列資源建設的現實挑戰
(1)隊列資源的隱私與倫理挑戰
我們既要看到教育領域學生隊列資源在挖掘學成長發展規律、探索學生發展要素等方面的價值潛能和教育意義,同時也必須能夠研判隊列資源“無約束的亂用”“無條件的傳播”所帶來的安全事故和倫理問題。尤其是教育領域學生隊列資源包含大量學生成長發展過程中的基礎數據(如學生姓名、家庭、生理、心理數據等),這些信息一旦泄露將會嚴重危及學生乃至整個社會[23]。為此,在教育領域學生隊列資源建設的過程中,如何保證學生個人隱私與數據的安全可靠,如何約束隊列資源使用的合理合規與規范,就成為學生隊列資源面臨的首要挑戰。
(2)隊列資源長周期追蹤成本挑戰
既往的隊列資源建設中難度最大的是隊列的長期隨訪[24]。隨訪周期愈長、隨訪頻率愈高、隊列規模愈大,其投入的成本也會成比例地升高。在教育領域中,伴隨著學生的成長發展,會出現較為頻繁的換班、轉校、升學等一系列脫離原有組織體系的情況,這無疑增加了長期跟蹤學生發展的難度,提高了追蹤的成本。大規模教育領域學生隊列資源建設是一個高投入成本的工程,如何在保證隊列質量的同時降低長周期跟蹤成本,成為學生隊列資源面臨的另一大挑戰。
(3)隊列資源的覆蓋樣本多樣性挑戰
“隊列需要反映人群的多樣性”[25],雖然以往體量較小的傳統隊列規模在特定領域做出了巨大貢獻,但因其樣本量不足導致的效應不穩定、代表性不夠以及信息孤島等問題嚴重制約了隊列建設結果的應用。在教育領域中,學生個體之間差異較大,其隊列資源建設中研究對象選擇的差異很有可能會影響隊列研究結果,如針對同質性較高的研究對象容易出現顯著的維度特征,異質性較高的研究對象則容易忽略關鍵維度特征,如此形成的隊列維度和隊列資源的真實性和準確性將引發質疑,并且有可能影響教育教學中調控和改進作用的發揮。
2"教育領域學生隊列資源建設的應對策略
(1)提高安全意識、強化技術保障
為有效提升隊列資源的隱私安全,需高度重視數據的隱私保護與安全管理,提升各方參與人員的安全意識,在相關數據安全法律法規下,不斷引入更先進、安全系數更高的措施來保障數據安全[26]。為此,首先政府層面需要做好宏觀把控,制訂完善的倫理規約及問責機制,約束隊列資源在分析、共享、管理和應用等過程涉及的倫理問題;其次,在教育領域學生隊列資源建設之初,需要征得知情同意,通過與學生或監護人簽訂知情同意書與用戶協議,在保障其知情權與決定權的同時也為長期隨訪和數據收集提供支撐;再次,在隊列資源建設過程中,需充分利用人工智能、大數據、區塊鏈技術,實現所采集海量數據的溯源、安全共享和隱私保護,比如可以通過將關鍵數據部署到區塊鏈上,并利用區塊鏈上數據不可篡改和不可刪除的特性,保證數據的完整性和可追蹤性;最后,在隊列資源應用過程中,需建立面向隱私和倫理規范的數據分級保障機制,定義隊列資源的敏感性等級,形成隊列的合規化使用方案。
(2)發揮技術優勢實現全方位數據匯聚
考慮到大規模、長周期學生隊列資源建設的成本挑戰,需充分發揮技術優勢,借助成熟的技術工具,以低成本采集、高效率聯通,匯總形成學生成長發展的相關數據。具體來說,一方面可以充分利用已有的信息化平臺數據,逐一打通、合并已存儲的學生活動數據,并將其依據隊列資源的特征維度和時間序列規整成合適的隊列資源,這也將成為未來教育領域隊列資源建設的一大重要舉措。另一方面,可以充分利用便捷的采集裝置,以低成本方式獲取數據,如通過智能手機、可穿戴設備以及專門化教育數據采集的智能裝備,能夠在更加自然和便捷的狀態下采集學生的行為、心理、生理等方面數據。
(3)開展更大規模的學生群體隊列建設
為有效應對隊列資源的覆蓋樣本多樣性挑戰,需要在教育領域開展更大規模的學生隊列資源建設。為此,需要在政府發起、研究機構牽頭、社會共同參與的多方協同下,開展更大規模學生群體隊列的建設。近年來,國家層面開始重視大規模教育領域學生隊列資源建設,并在國家重點研發計劃項目“大規模學生跨學段成長跟蹤研究”中明確要求構建100萬學生群體連續5年的隊列資源,并以此為抓手支撐后續科教融合相關項目,挖掘中國學生成長規律,深化教育改革發展。但考慮到大規模人群調查、隨訪需要耗費大量的人力、物力、財力以及時間成本,故研究團隊或研究者個人可以考慮通過開展截斷式研究,整合多個小樣本數據,形成大樣本隊列資源,即充分利用現有資源,采用小規模隊列研究的靈活優勢和隊列積累,通過規范統一的方式對多源異構數據進行整合處理,以此替代性地解決大規模隊列開展的局限性,從而獲得準確可靠的研究結果[27]。
四 結語
本研究在引入隊列的概念后,通過界定教育領域隊列的概念,挖掘教育領域學生隊列資源的價值潛能,梳理隊列資源的連續、豐富和可解釋特性,闡釋建設隊列資源對突破現有教育大數據發展局限并發揮教育大數據應用價值的重要意義,總結形成教育領域學生隊列資源的建設框架,分析學生隊列資源建設中存在的現實挑戰與應對策略,以期推動教育領域學生隊列資源的建設與發展。在這個數據成為重要資產的時代,大力建設教育領域學生隊列資源對于進一步探索和揭示中國學生成長發展規律、支撐教育教學改革、調和規模化教育和個性化培養的矛盾具有重要的現實意義。為此,本研究期望未來教育領域學生隊列資源建設能夠加大整合力度,打通現有各類平臺數據,依據學生隊列資源建設思想,將教育領域數據進行規整,以進一步發揮教育領域數據的價值潛能;同時也希望進一步加大現有學生隊列資源建設的強度,依托學生隊列資源建設框架,開展大規模學生隊列資源建設,不斷積累學生隊列資源。相信通過這些舉措,將進一步豐富我國教育領域學生隊列資源,從而為發揮數據驅動教育發展的價值潛能、提升教育高質量發展提供基礎性支撐。
參考文獻
[1]王懷波,李冀紅,孫洪濤,等.基于模型的教育大數據應用框架設計[J].現代教育技術,2020,(6):5-12.
[2]Lazer D, Kennedy R, King G, et al. The parable of Google flu: Traps in big data analysis[J]. Science, 2014,6176:1203-1205.
[3]Merceron A, Blikstein P, Siemens G. Learning analytics: From big data to meaningful data[J]. Journal of Learning Analytics, 2015,(3):4-8.
[4]孫眾,蘧征,楊現民,等.有意義的大數據與教學優化改革[J].電化教育研究,2018,(3):43-48、61.
[5]孫智中,張晨.基于厚數據的信息分析:內涵與模式[J].情報資料工作,2020,(3):69-75.
[6]祁子凡,張鳳旭,張玲.美國精準醫學計劃“All of Us”百萬自然人群隊列設計方案的經驗和啟示[J].中國循證醫學雜志,2021,(8):980-985.
[7]徐亞倩,陳麗,鄭勤華,等.互聯網推動教育理論與學術創新的主要方向——“互聯網+教育”創新發展的理論與政策研究(五)[J].電化教育研究,2022,(5):5-10、25.
[8]王懷波,柴喚友,郭利明,等.智能技術賦能學生綜合素養評價:框架設計與實施路徑[J].中國電化教育,2022,(8):16-23.
[9]劉倩,李穎.主動選擇:在線課程“高輟學率”的積極理解——基于學習者投資理論的視角[J].電化教育研究,2021,(4):45-52.
[10]王翔樸,王營通,李玨聲,主編.衛生學大辭典[M].青島:青島出版社.2000:148.
[11]劉建平.隊列研究的設計、實施及方法學問題[J].中西醫結合學報,2008,(4):331-336.
[12]張惠敏,陳薇,劉建平.隊列研究應用于評價中醫臨床療效中暴露的定義和測量方法[J].循證醫學,2011,(4):249-252.
[13]國家互聯網信息辦公室.國家互聯網信息辦公室發布《數字中國發展報告(2021年)》[OL].lt;http://www.cac.gov.cn/2022-08/02/c_1661066515613920.htmgt;
[14]教育部.教育部發布《全國普通高校本科教育教學質量報告(2020年度)》[OL].lt;https://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/s5987/202112/t20211217_588017.htmlgt;
[15]陳麗,郭玉娟,王懷波,等.新時代信息化進程中教育研究問題域框架[J].現代遠程教育研究,2018,(1):40-46、87.
[16]劉志軍,徐彬.綜合素質評價:破除“唯分數”評價的關鍵與路徑[J].教育研究,2020,(2):91-100.
[17]李龍,宋月萍,胡以松.初中教育階段流動兒童心理健康影響因素隊列研究[J].中華疾病控制雜志,2019,(9):1046-1050.
[18]Bohlin G, Hagekull B, Rydell A M. Attachment and social functioning: A longitudinal study from infancy to middle childhood[J]. Social Development, 2000,(1):24-39.
[19]李靜,劉蕾.技術賦能的高等教育規模化教育與個性化培養:邏輯必然與實踐機理[J].中國電化教育,2021,(8):55-62.
[20]韓梅,陳薇,曹卉娟,等.比較效果研究常用方法之二:隊列研究設計[J].現代中醫臨床,2015,(3):20-23.
[21]方平,熊端琴,郭春彥.父母教養方式對子女學業成就影響的研究[J].心理科學,2003,(1):73-76.
[22]張惠敏,劉建平.臨床試驗中隊列研究的隨訪問題[J].中醫雜志,2009,(10):884-887.
[23]趙慧瓊,姜強,趙蔚.大數據學習分析的安全與隱私保護研究[J].現代教育技術,2016,(3):5-11.
[24][25]王笑峰,金力.大型人群隊列研究[J].中國科學:生命科學,2016,(4):406-412.
[26]楊現民,唐斯斯,李冀紅.發展教育大數據:內涵、價值和挑戰[J].現代遠程教育研究,2016,(1):50-61.
[27]孫一鑫,裴正存,詹思延.呼吸系統疾病專病隊列研究的標準制定與數據共享[J].中華流行病學雜志,2018,(2):233-239.
The"Value,"Framework and Challenge of Student Cohort Resources in Educational Field
WANG"Huai-bo ZHENG Qin-hua SUN Hong-tao WU Yao
(1."School of Systems Science, Beijing Normal University, Beijing,"China"100875;
2. The Research Center of Distance Education, Beijing Normal University, Beijing,"China"100875;
"3. School Data Management Center, Beijing Normal University, Beijing,"China"100875)
Abstract: Nowadays, the application of educational big data has entered a bottleneck period, and mechanical, single and truncated data can no longer meet the needs of the current education development. Compared with general educational big data, student cohort resources in education have the advantages of being continuous, rich and interpretable, and are expected to be an important initiative to break the development bottleneck. Based on this, the article firstly compares the concept and value potential of student cohort resources, then summarizes the overall framework of cohort resource construction containing educational target selection, exposure factor definition, study subject setting, follow-up plan development and data analysis and storage based on the idea of cohort construction in medical field, and finally points out many challenges of cohort resource construction such as privacy protection, tracking cost and sample coverage, and expects that with the help of The article also aims to promote cohort building with the help of strategies such as raising security awareness, taking advantage of technology, and organizing larger cohorts. Through the study, the article expects to provide a reference for promoting the construction and development of student cohort resources in education, bridging the existing educational data deficiencies, and leveraging the role of data in education.
Keywords:"student cohort resources; potential value; education"field; cultivation of individuality