丁世強,趙可云
?
大數據支持下的農村留守兒童學業成績預警系統研究
丁世強,趙可云
新型城市化建設過程中,農村留守兒童由于缺乏父母的照顧,導致他們在學習發展中存在著不同程度的問題。近年來,針對這類問題,許多學者紛紛提出解決方法,這些措施和方法在一定程度上雖然可以改善留守兒童的學習現狀,但是還存著經驗性、宏觀性和滯后性的問題。隨著大數據時代的來臨,利用大數據技術提升留守兒童的學習成績,發揮其個性化、微型化和及時化的優勢,可以彌補傳統解決措施的不足。文章基于留守兒童的特殊性,提出了一種大數據支持下基于離群數據挖掘的學業成績預警系統,形成了一套類似氣象災害的紅、橙、黃、綠、藍五級預警表,并對這一系統在實際運用可能遇到的問題進行了剖析。
大數據;留守兒童;學業成績;預警系統
近年來,國家和社會越來越重視留守兒童問題。教育部在2005年提出的《關于進一步推進義務教育均衡發展的若干意見》中明確規定了關于農村留守兒童的教育問題,指出“地方各級教育行政部門和學校要有針對性地采取措施,及時解決進城務工農民托留在農村的留守兒童在思想、學習、生活等方面存在的問題和困難”[1]。2016年1月27日,國務院常務會議上提到“決不能讓留守兒童成為家庭之痛社會之殤”。毫無疑問,無論是從國家、社會、家庭還是留守兒童本身來看,解決農村留守兒童的學業問題都有重要意義。隨著大數據時代的到來,大數據與教育相結合已成為不可阻擋的趨勢,利用大數據分析技術,對留守兒童在學習過程中產生的學習數據進行分析,建立他們的學習行為模型,發現其存在的學習問題,并及時進行預警,可為問題的解決開拓新的理論與實踐研究視角。
研究表明,留守兒童的學習問題、心理健康教育問題、思想道德品質和社會化問題等是農村留守兒童的主要教育問題,[2]尤其是在學習方面面臨著更多的問題。據調查,有60%以上的留守兒童學習成績較差,還有不少已對學習失去了興趣。[3]留守兒童的父母平時不在身邊,他們的監護人也往往是臨時的或者隔代的,“重養不重教”現象非常普遍。有調查表明,74.96%和84.2%的留守兒童祖輩只有小學及以下文化程度。[4]另外,留守兒童在學習過程中自覺性往往比較差,甚至有許多留守兒童出現逃學和輟學的現象,學習成績大都處在中下等水平。[5]
由此可見,留守兒童的學業成績問題非常突出,他們的學業成績會受到社會、學校、家庭等許多方面的影響。在留守兒童所在地區,社會政治經濟條件較差,學校缺乏促進他們學習的學習資源,父母不能陪在身邊輔導其學習,在這樣的環境下,他們在學習方面所面臨的困難異常巨大。很多留守兒童對學習失去信心,最終出現厭學、逃課等現象,有些甚至參與了社會不法行為,走上了犯罪的道路。解決留守兒童學業成績的問題,引導其健康成長是促進他們實現個體人生良好發展的重要路徑。
1.已有留守兒童學習成績問題解決路徑的局限性
已有針對留守兒童學習問題的解決路徑,一般從家庭、學校和社會等3方面出發,從不同的角度解決他們的學習問題。例如史暉認為,留守兒童的教育是一項社會系統工程,需要政府、學校、家庭和社會合力構建支持體系,共同解決留守兒童的教育問題。[6]張俊良、馬曉磊認為,父母應加強親子教育以及營造良好的家庭教育環境,留守兒童所在學校應實施寄宿制度以及建立特別的檔案管理制度等措施,政府在政策方面也要進行政策創新和引導。[2]張文諾認為,要有效解決農村留守兒童的教育問題,就要大力發展農村寄宿制學校,重視對農村留守兒童的心理健康教育,加快農村基礎教育改革,樹立以學生為中心的建構主義學習觀。[7]
這類宏觀性的解決方法,對于解決農村留守兒童的學業成績問題雖具有一定的指導意義,但也存在著一系列問題,主要表現為:(1)解決措施具有經驗性。針對留守兒童的教育決策往往是經驗性的,缺乏真實可靠的數據,這也是教育決策一直存在的詬病。(2)解決措施具有宏觀性。已有解決措施針對的是所有的留守兒童學業成績問題,而事實情況是雖然他們的學習成績普遍較低,但是其面臨的問題卻各不相同,有的可能是缺乏學習興趣,有的可能是學習方法不適合,有的可能是學習態度問題等,所以,解決措施缺乏一定的針對性。(3)解決措施具有滯后性。已有策略,只有當留守兒童學習問題出現甚至非常嚴重的時候,才會被教師、家長等人員所察覺,時機略顯滯后,此時解決問題可能要付出更多的人力和物力。(4)解決措施忽視心理因素。留守兒童受社會環境、家庭環境等影響,他們的心理要比非留守兒童更加脆弱,而心理健康狀況直接影響其學習的積極性和學習效果,所以他們的心理因素對學業成績的提高有重要作用。
2.大數據預警留守兒童學業成績的可能性與特征
目前,國家和政府正在加強教育與大數據的融合。2015年8月,國務院發布了《促進大數據發展的行動綱要》,文件指出:“數據已成為國家基礎性戰略資源”,并在啟動的十大工程之一“公共服務大數據工程”中明確提出要建設教育文化大數據。[8]如果教師能夠在課堂中合理地運用數據,就可以有效了解學生的學習情況,發現其學習中的問題并制定改進計劃,這對于提升教學質量以及縮小學生間的差距有重要意義。[9]
大數據對于解決農村留守兒童的學業成績問題體現出了新的優勢及可能性,具體表現為:(1)大數據能夠實現留守兒童學習的個性化。利用大數據提升學習成績,其對象不再是宏觀上的社會、學校和家庭,而是具體到留守兒童個體的學習及心理數據,這些數據對于其他對象沒有意義,是高度個性化特征的體現。通過對個體學習行為及心理數據的收集,建立符合個體的行為模型,智能化地預警其當前存在的學習問題,并給出合適的干預性建議或措施[10],從而實現留守兒童的個性化學習。(2)大數據能夠實現學習的微型化。利用大數據技術能夠在不影響學習的情況下,隨時隨地地跟蹤、記錄、分析留守兒童的學習行為數據。教育大數據能夠關注每個留守兒童的微觀表現:在什么時候翻開書本,先做哪道題、后做哪道題、某道題思考時間、修改次數等等,收集微觀層面的學習行為數據。(3)大數據能夠實現留守兒童學習的及時化。利用大數據的分析和預警功能,能夠及時地了解該留守兒童當前的學習情況和心理問題,從而推送出符合其學習及心理方面的建議和方法,及時解決其面臨的學習和心理問題,避免了學習問題的進一步惡化。
有研究通過比較留守兒童與非留守兒童的學校適應情況發現,前者存在更嚴重的心理和性格方面的障礙,表現出更多的越軌行為,心理健康狀況直接影響其學習的積極性和學習效果,所以對于留守兒童心理數據的收集至關重要。另外,留守兒童的家庭往往處于親子分離的狀態,不同模式的監護管教對他們的影響也不相同。留守兒童監護人對他們的管理相比非留守兒童更趨寬松,許多更是放任其自我發展,明顯影響到留守兒童的生活學習質量。在這種環境下,學校應成為干預留守兒童學習行為的主陣地。
1.農村留守兒童學業成績預警系統結構
留守兒童學業成績預警系統結構主要包括:界面層、應用層、支撐層和基礎層等4部分,如圖1所示。界面層包含了學生登錄、教師登錄以及家長登錄等3種方式,以方便不同身份的人使用。系統使用學生學號+身份證號碼、家長姓名+身份證號碼、教師編號+身份證號碼登錄,主要確保采集到的留守兒童學習信息及個人信息的安全性。應用層是核心層,包括了數據的錄入存儲、數據分析以及預警系統。輸入和存儲系統將采集到的留守兒童學習數據輸入系統中,并保存數據;數據分析系統主要是對數據進行有效的挖掘,通過各種大數據分析技術分析留守兒童學習行為數據,建立學習對象的學習行為模型,發現其存在的學習問題和潛在的困難;預警系統主要負責預警分析、預警發布和干預措施的提出。支撐層包含了該系統提供的主要服務類型,如存儲服務、多媒體服務和通信服務等服務類型。基礎層是系統的基礎部分,包括基本的操作系統、所需的網絡設備和服務器等。
2.留守兒童學業成績預警的流程模型
基于之前對留守兒童學業成績預警系統結構的建立,同時結合大數據分析及農村留守兒童學業成績預警的邏輯,形成了留守兒童學業成績預警流程圖,如圖2所示。
(1)留守兒童學習數據的來源

圖1 農村留守兒童學業成績預警系統結構
隨著“三通兩平臺”的建設、精品開放課程建設以及全國數字校園、區域教育云的建設和完善,在大數據環境下,能夠對留守兒童的學習行為進行跟蹤、記錄、分析。本文所涉及的留守兒童學習數據來源主要包括4個方面:留守兒童、課程、課堂和心理狀況。從這些角度綜合地收集留守兒童的學習數據,使數據的采集更加完善[11],更加全面地了解他們的學習情況。第一,留守兒童數據是指其基本信息,包括姓名、性別、年齡、監護人等。收集基本信息主要是為了對其個人和家庭的了解。第二,課堂學習數據是指留守兒童在課堂學習過程中所記錄的學習行為數據。本文將課堂數據分為行為數據、認知數據、表情數據,這些數據主要通過監控設備來獲取,主要包括上課認真聽講的時間數據、玩手機的次數、與教師的互動次數、與其他學生討論的參與數據、微笑次數等,一切能夠反映學生學習情況的數據都可以通過監控設備記錄下來。第三,課程數據是指與所學課程相關的數據,具體指課程作業情況、知識點的掌握情況以及課程的平時成績和期末考試成績等。這些數據與傳統的數據相似,主要來源于留守兒童的數據庫。第四,心理數據主要是通過問卷調查和訪談建檔的形式獲取。采用周步成等修訂的《心理健康診斷測驗》來對留守兒童的心理健康狀況進行數據收集;訪談的對象包括留守兒童的監護人、學校老師、同學、村干部等人員,收集的內容包括他們對留守兒童的認識、看法和家庭成員外出務工給留守兒童帶來的影響等。

圖2 留守兒童學業成績預警流程圖
(2)留守兒童學習數據的采集
數據的采集是最基礎的一步,心理數據的采集可以通過調查和訪談的方式獲得,而針對留守兒童學習行為的數據采集,目前常用的數據采集技術有視頻監控技術、點陣數碼筆技術、智能錄播技術等,能夠在不同的時間、地點采集留守兒童的學習數據,保證數據的準確性,具體情況如表1所示。

表1 留守兒童學習數據采集技術及采集內容
(3)留守兒童學習數據的預處理
數據的預處理主要是對已經采集的留守兒童各種學習數據,進行分類、“去噪”以及進一步的存儲。通過數據預處理環節,能夠將收集到的各種學習數據轉換為合適的數據類型,而且對數據的“去噪”和清洗還能保證數據的質量和可靠性,這是在進行農村留守兒童學業成績預警中必不可少的一步。
(4)留守兒童學習數據的分析
學習數據分析是整個預警系統的核心部分,只有通過數據分析才能發現數據所具有的潛在價值。學習成績預警系統將留守兒童學習過程中的視頻數據、聲音數據、表情數據、行為數據等轉化為相對應的具體數值,例如,將視頻數據轉變為認真聽講的時長、回答問題的次數、交頭接耳的次數、玩手機的時長、撓后腦勺的次數等;將行為數據轉變為點擊鼠標次數、鼠標停留時長、完成某道題時長、修改次數等;將表情數據轉變為微笑的次數、皺眉的次數等。這樣就把復雜的數據簡單化,轉變為一個個的小數據,方便數據的存儲和處理。本預警系統主要是針對在學習過程中存在問題的學生,為此,學業成績系統采用的數據挖掘方法是離群數據挖掘法,離群數據是指偏離正常數據,而不是偏離大部分數據或一般數據。
本文離群數據挖掘的思路:在一個具有n個數據的集合中,首先給出一個正常標準,然后根據已有的離群數據挖掘算法,如基于統計的離群數據發現方法、基于距離的離群數據發現方法、基于偏離的離群數據的檢測方法等,挖掘出與正常數據存在顯著差異的數據d(d (5)留守兒童學業成績的預警判別 通過對學習數據的離群挖掘和分析,發現存在學習問題的留守兒童,然后進行相應的預警和反饋。針對農村留守兒童學業成績的預警判別表,筆者借鑒了金義富2類6級信號及判別表[11],采用了類似氣象災害的預警信號,建立了留守兒童學業預警信號判別表,用紅、橙、黃、綠、藍5類顏色進行可視化輸出,如表2所示。 表2 留守兒童學業預警信號判別表 (6)留守兒童學習及心理的干預方式 武法提將利用大數據技術進行的學習干預定義為:“為了幫助學習者克服學習困難,順利完成學習,以基于學習過程的教育大數據的分析為基礎,針對每位學習者的具體學習狀態而實施的各種支持性策略和指導性活動的綜合。”[12]筆者借鑒學習干預的定義,提出了幾種進行留守兒童學習干預的方式。留守兒童自己登錄系統,查看個人當前的學習情況以及是否存在學習問題,若存在問題可以根據系統給出的建議進行改正;家長也可以隨時隨地地登錄系統幫助留守兒童發現存在的學習問題,及時地督促其學習,妥善解決問題;同樣,教師也可以登錄系統查看每位學生的學習情況,對于存在問題的留守兒童,教師可以直接與其進行溝通交流,也可以通過電話短信的方式與他們的家長聯系,讓家長與留守兒童溝通及時解決問題;學校管理層人員也可登錄該系統隨時查看學習問題嚴重的留守兒童,并及時與其班主任和家長取得聯系,共同解決存在問題。 對于留守兒童心理干預的策略與方法,采取的策略可以有:(1)個體篩查,重點關注。教師及學校管理人員可以通過對留守兒童建立的檔案及相關訪談,進行全面的測評,對篩選出存在問題的留守兒童進行重點關注,然后通過心理教師提供相應的咨詢輔導,班主任也要做好后續的動態觀察。教師一定要做好相關的保密工作,以免個人信息傳播帶來更大的負面影響。(2)團體輔導,心理提升。通過對心理數據進行整體統計分析,找到留守兒童產生問題的行為與心理狀況之間的相關性,以行為為指標,以心理數據為預測,通過逐步回歸分析找到心理數據對各問題行為的預測性。通過以上策略能夠有針對性地提升留守兒童的心理資本短板,降低問題行為的發生率。 1.留守兒童數據采集缺乏資金和技術的有效支持 預警系統的第一步是對學習數據的采集,數據采集面臨的第一個挑戰是技術設備問題。因為數據的采集離不開數據采集技術設備的支持,首先這些設備都比較昂貴,其費用可能是留守兒童所在學校無法承擔的;其次是數據采集技術的限制,學習數據種類和結構非常復雜,要想真正地采集到需要的數據,需要更加先進的數據采集技術的支撐。另外,本文針對心理數據的采集方法為調查問卷及其相關人員訪談,目前還沒有完全利用大數據技術進行心理數據采集的技術支持。 2.留守兒童數據采集實施難度大 留守兒童所處地區往往文化觀念落后,他們的監護人、教師及其相關教育部門必然存在對大數據技術的質疑,所以在數據的采集與實施過程中需要對有關內容進行相應的普及。同時,由于數據采集涉及課外的學習數據,而留守兒童的家庭方面往往沒有計算機及網絡設施的提供,所以課外學習數據的采集困難重重。 3.留守兒童學習數據的處理和分析難度大 首先,在農村留守兒童學業成績預警系統中,數據的分析是最重要的一個模塊。數據具有一定的時效性,隨著時間的流逝,數據中所蘊含的知識價值也逐漸衰減,這給數據的分析帶來了極大的挑戰。若不能及時有效地進行數據處理分析,那么數據的價值將大打折扣。其次,大數據時代的學習數據結構復雜、類型多樣,往往是半結構化和非結構化的數據,目前針對教育大數據的分析技術并沒有普及,數據分析能不能真正實現對學習數據的分析功能,仍值得大家思考。 4.留守兒童的學習數據缺乏安全性 隨著大數據與生活的關系越來越密切,教育大數據幾乎記錄了農村留守兒童的所有學習信息,這些數據不可避免地涉及農村留守兒童的隱私,然而目前還沒有具體的關于大數據信息安全的管理細則。如果關于留守兒童的數據外泄,將會對他們今后的發展產生不利的影響,所以還需高度重視教育大數據的隱私安全性,要加強學習數據的安全建設,保證大數據環境下留守兒童學業成績預警系統地安全運行。 留守兒童學業成績預警系統,能夠收集到之前無法獲取的數據,并通過大數據分析技術進行學習過程的分析,及時發現他們當前存在的學習問題和潛在的心理問題,然后通過教師、家長和學校管理層等人員進行學習干預,以促進其學業成績的改善。隨著國家對于留守兒童地區的不斷建設、社會對留守兒童關注度的增加以及大數據技術的逐步成熟,利用大數據來預警留守兒童的學業成績,具有切實的實踐可行性。利用大數據對留守兒童學業預警,對于促進他們學習能力發展,實現他們的健康成長具有重要社會現實意義。 [1] 范先佐,郭清揚.農村留守兒童教育問題的回顧與反思[J].中國農業大學學報,2015(1):55-64. [2] 張俊良,馬曉磊.城市化背景下對農村留守兒童教育問題的探討[J].農村經濟,2010(3):102-105. [3] 譚深.中國留守兒童研究述評[J].中國社會科學,2011(1):138-150. [4] 全國婦聯課題組.全國農村留守兒童狀況研究報告[Z].農村留守兒童工作信息,2008(4):34-37. [5] 辜勝阻,易善策,李華.城鎮化進程中農村留守兒童問題及對策[J].教育研究,2011(9):29-33. [6] 史暉,王德勛.農村留守兒童的教育問題及對策研究[J].教育探索,2008(9):89-90. [7] 張文諾.農村留守兒童教育問題研究——以甘肅省農村留守兒童教育為例[J].教育理論與實踐,2013(14):21-23. [8] 楊現民,唐斯斯,李冀紅.發展教育大數據:內涵、價值和挑戰[J].現代遠程教育研究,2016(1):50-61. [9] 顧小清,薛耀鋒,孫妍妍.大數據時代的教育決策研究:數據的力量與模擬的優勢[J].中國電化教育,2016(1):56-62. [10] 楊現民,王榴卉,唐斯斯.教育大數據的應用模式與政策建議[J].電化教育研究,2015(9):54-69. [11] 金義富,吳濤,張子石,等.大數據環境下學業預警系統設計分析[J].中國電化教育,2016(2):69-73. [12] 李彤彤,黃洛穎,鄒蕊,等.基于教育大數據的學習干預模型構建[J].中國電化教育,2016(6):16-20. 責任編輯 張軍濤 Study of Children Left Behind the era of Big Data Academically Warning System DINGShi-qiang,ZHAOKe-yun/ QufuNormalUniversity In the process of new urbanization, the left-behind children in rural areas have different problems in learning and development due to lack of parental care. In recent years, many scholars have proposed solutions to these problems. Although these measures and methods can help improve the learning situation of left-behind children to a certain extent, there are still problems of being empirical, macroscopic and lagging. With the advent of the era of big data, it can fill the failings of the traditional measures to improve the academic achievements of the left behind children by utilizing the big data technology and making full use of its individualized, miniaturized and timely advantages. This paper presents an early-warning system of left-behind children academic achievements based on outlier data mining in big data environment, and forms a five-level warning table marked by red, orange, yellow, green and blue, which is similar to a meteorological disaster warning table. It analyzes the problems which may occur in the practical application of the system. Big Data; left-behind children; academic achievements; early warning system 2017-03-01 10.13425/j.cnki.jjou.2017.04.011 丁世強,曲阜師范大學傳媒學院教育技術學專業碩士研究生,主要從事兒童學習能力發展、教育信息化方面的研究(1476099149@qq.com);趙可云,中國教育大數據研究院,曲阜師范大學傳媒學院副教授,教育學博士,主要從事教育大數據、兒童學習能力發展等方面的研究 國家社會科學基金項目“農村留守兒童學習社會化的影響因素及新媒體干預機制研究”(15CSH054)
四、大數據預警留守兒童學業成績可能面臨的挑戰