大數據時代,大數據=or≠精準認定貧困生?
隨著大數據與教育的結合成為時代發展的必然要求,“大數據”幾乎成為人們都在談論的一個熱門詞匯,大數據的應用已廣泛深入我們生活的方方面面,探索如何讓大數據在教育領域的有效應用,也是革命技術創新所需要經歷的過程。比如,大數據在高校幫助貧困學生中的使用,可以視為一種新的探索,但是作為一種創新,爭議也是難免的。
大數據的問題,并不僅僅是技術問題,在數據的應用上牽涉到社會經濟問題,它的深度應用牽涉社會很多部分的彼此協調,以及對于改變的認同度,所以這個過程也許非常漫長。
通常,為了申請貧困補助,高校會要求申請貧困生的同學提供家庭貧困證明表,在這張表上,需要有貧困生的家庭情況陳述,還要有地方政府的蓋章。當學生備好了貧困資料后,學校就會將其納入困難學生檔案,通過深入了解,比較后對其中特別困難家庭的學生進行補助。以上的弊端是程序相對簡單,并且質疑聲頗多,比如關于貧困證明弄虛作假、“偽貧困生”偷食的新聞。為此,多所高校引入大數據對學生的補助申請進行評估,然而媒體砸出一個新的話題,利用大數據對于貧困學生補助的評估,公平嗎?
一起來看兩組近期很熱的新聞。
近期5 月的案例——用大數據篩選貧困生

“日前,江蘇大學學生工作處正式公布了對4463名貧困生話費調查的大數據處理結果,對月平均消費100-150元的同學,學校建議采取降級處理;對月平均消費超過150元的同學,則建議取消貧困生資格。此次行動共有21人被取消了貧困生資格,還有32人從家庭經濟特殊困難降級為一般困難。”
(5月8日《揚子晚報》)
【聲音】
綜合網上輿論的評價:一,周期短,數據采集的完整性略不夠,存在相對的偶然性,容易造成誤判。二,電話費高低只是體現消費水平的一個方面而已,不能代表經濟水平高低,大學不應該干涉貧困學生的消費支出。三,相對于傳統的資格認定方法是一種創新,江蘇大學采取話費調查的方式,本身是為了做到“精準扶貧”,這個出發點沒錯。
支持論:數據便于綜合評估
在大數據廣泛應用的今天,正有越來越多的高校采用大數據認定貧困生資格,確實是一種創新。它一方面使得學生信息更加客觀真實,另一方面,其操作的隱秘性維護了學生的尊嚴。江蘇大學選擇的電話費流水賬相對其他生活開支,能真實反映學生的生活狀態,其數據的易取得性也更便于實現監督。
在未來,將大數據引入高校貧困生鑒定工作,還需借鑒更多的指標進行綜合評估,則能更準確地反映學生的經濟狀況,獲得眾人信服。
(來源:關育兵)
質疑論:話費測評不能一刀切
目前正處于信息爆炸時代,對貧困生而言,不管是兼職找工作,還是網上開店賺外快補貼生活等,很多時候都離不開手機打電話等消費,而且很有可能因為這樣的原因,致使其花費確實將高于其他同學。此時,如果不綜合考慮其他因素,而簡單推理出部分學生是在裝貧困,直至取消其補助,則顯得過于武斷。僅靠話費“精準識貧”,很容易陷入“盲人摸象”的片面境地。而要避免這種尷尬,還需要擺脫純粹的技術依賴,多深入學生生活了解實際情況,利用信息聯網,從生源地獲得更多可靠數據,并配合其他信息綜合研判分析,才能真正做到精準扶貧。
(來源:余明輝)
為了“精準助貧”,各高校的方法很多。“近日,南京理工大學啟動‘暖心飯卡’項目,和其他捐助方式不同的是,該校教育基金會通過對全校在校本科生的飯卡刷卡記錄的數據分析,每個月在食堂吃飯超過60頓、一個月總消費不足420元的,被列為受資助對象。該校采取直接將補貼款打入學生飯卡的方式,學生無需填表申請,不用審核,甚至在收到補貼前,沒有任何學生知情。”
(3月25日《新華日報》)

【聲音】
綜合網上輿論的評價:一,大數據之下的“精準”,對貧困生的隱私進行了相對的保護。二,幫助貧困大學生,尊重隱私不能影響公平,僅憑食堂消費來判斷幫困對象,可能有不公平隱患。
點贊論:“偷偷”給貧困生充飯卡彰顯大數據思維
南京理工大學啟動的“暖心飯卡”項目,和其他捐助方式不同,既不傷害貧困生自尊心,又可以實現“精準扶貧”。在資助貧困生上,沒有一種方式是完美無缺的,但總有一種是相對最優的。在大數據的支撐下,“偷偷”給貧困生充飯卡即是最優選擇。
如何才能在公平和尊嚴之間找到一個平衡點?必須承認,大數據具有無可爭辯的說服力,通過分析就餐次數和消費金額,基本可以得出這個學生的消費水平。大數據也是“活”的,圈定初步名單后,學校再加以審核,最后評出資助名單,誤差進一步縮小。這樣,“偷偷”給飯卡充錢,既確保公平又兼顧尊嚴,還降低管理成本,一舉多得。
(來源:南方都市報)
質疑論:擔憂學生故意刷數據的狀況
網友認為會不會出現漏洞。比如前期調查工作泄密、后期監督缺位易滋生腐敗以及部分學生故意刷數據,擔憂“有的學生為了多拿補貼款可能會刷數據,甚至將一餐分兩餐買。”
(來源:網友們)
評估貧困學生補助,大數據真的公平嗎?
大數據只適用于調查學生在特定時間內的花銷,并不能辨別出學生家庭是富裕還是貧困。將評估體系轉變為使用大數據的高校也面臨著不少困難。小心損害了學生的合法權利,或者收集到的學生信息帶有偏向性。作為大數據系統的補充,有些學校利用自己的校友網絡和地方政府信息更準確地獲得學生的經濟背景。為了進一步杜絕虛假申請,我國還需要進一步完善國家信用調查體系。
(來源:21英語網)
貧困生再認定看話費,不必急著反對
在貧困生認定與再認定問題上,不妨借助大數據提高精準度,以發揮貧困生扶助機制的最大作用。比如通過對學生各類消費情況的綜合分析,或可更加充分地掌握貧困生的總體情況。真正的貧困生,其消費水平會在日常生活中體現出來,而濫竽充數者,也很難長期掩飾下去。學校既要給貧困生真正的人文關懷,也要避免扶助資金被浪費和濫用,這就不能采取偷懶的辦法,而應扎扎實實地做好動態管理。
(來源:京華時報)
高校使用大數據需注意的內容
大數據在高校幫助貧困學生中的使用,可以視為一種探索。以前,高校為甄別貧困學生,想了很多招數,包括競選貧困生,評議貧困生,這些做法無不遭遇不尊重學生隱私的質疑。大數據的使用,使識別貧困生的過程變得“溫和”一些,但很顯然,這種探索也有些無奈,是基于對學生消費行為的大數據搜集,而非對學生真實家庭經濟情況的掌握。如果我國有健全、暢通的渠道了解學生的真實家庭經濟情況,那并不需要所謂的大數據幫困。

高校在幫困時,可以使用大數據,但必須注意兩方面,一是使用大數據不能侵犯學生的合法權益,大學可通過大數據“悄然”幫助貧困的同學,這可體現幫困的人文化,而不宜去監控學生的日常消費行為,這會讓貧困學生感覺到自己不被尊重。二是在使用學生消費大數據時,還要構建學校調查學生家庭情況的體系,使用消費大數據終究不是長久之計,大學可以通過和校友、中學、地方政府的合作,來了解本校貧困學生的家庭情況,要建立另外的大數據平臺,即借用現在的學生學籍信息管理平臺,把學生的家庭經濟情況也進行如實記錄,包括今后針對貧困學生的招生計劃,都應該根據家庭經濟情況來實施,而不是只看學生的農村生身份,因為即便是農村生,也有學生家庭很富裕。當然,我國還要借鑒發達國家的經驗,建立完善每個居民的納稅證明體系,以及征信系統。
(來源:熊丙奇)
整理/陶春
追本溯源,美國的教育研究者們在1968年就在教育部成立了全美教育數據統計中心。通過34年的長期摸索,形成了一套完整的教育數據處理方法的方法論,并在2002年通過了《教育科學改革法》,明確了數據在教育決策中的決定性地位:所有教育政策的制定都必須由實證數據進行支持。
2012 年,美國聯邦政府教育部參與了一項耗資2 億美元的公共教育中的大數據計劃。這一計劃旨在通過運用大數據分析來改善教育。聯邦教育部從財政預算中支出2500 萬美元,用于理解學生在個性化層面是怎樣學習的。
美國的高校如何利用大數據呢?據報道,比如在印第安納的鮑爾州立大學(Ball State University),監測學生是否用他們的校園卡刷卡參加星期六晚上在學生中心舉辦的校園晚會/聚會。當一名學生的校園卡刷卡識別機制顯示他停止參加俱樂部或其他社交活動時,一名學生服務專家就會跟進,打電話或發電子郵件去了解這名學生在做什么。這所高校還用校園卡刷卡監測學生去就業中心和參加學生領導力項目的情況。
該校甚至為今年2015級有資格申請聯邦佩爾獎學金(Pell Grants)的1200名低收入大一新生設計了一款手機應用程序。這款程序將基于大學檢測器獲得的學生活動信息,給予學生積分點的獎勵。這些學生能用這些積分點在校園書店里買書和其他用品。美國11所大型公立大學組成的新聯盟“大學創新聯盟”(University Innovation Alliance)正在尋求幫助這些學生。這一聯盟將利用大數據分析技術改善經濟上最需要幫助的大學生的畢業率。
曾經,署名為胡樂樂的作者撰文寫過一篇文章提到國外大數據的使用,“美國堪薩斯州衛奇塔州立大學(Wichita State University)的招生人員都能判定,學校新一屆本科生有多少比例能獲得學業成功,有多少學生輟學或面臨學業掙扎。這個準確性令人驚奇——這個軟件確定學生會成功的準確率高達96%,遠遠高于顧問人工預測的82%。該軟件如何能做到這一點呢?答案很簡單——運用大數據——包括一名學生的論文成績、學習時間以及來自家庭的財務投入,等等。衛奇塔州立大學僅僅是越來越多地使用大數據預測學生學業成功與失敗的眾多美國高校之一。這些高校將大數據科學應用于包括招生錄取在內的各種各樣管理實踐之中。”
其他還能實現什么呢?胡樂樂介紹以下的幾類利用途徑。
“學生獲得。高校使用現有學生和已畢業學生的歷史學業成績和人口統計學數據,創建最有可能入學的申請者的個人檔案;然后與社交媒體的數據整合在一起,算出這些學生對本校的感情分數;最后,用統計分析現在的學生和可能入學的學生的社交網絡,確定出哪些可能是潛在新生的申請者。
學生課程專業選擇。基于學生的高中學業成績、來自調查和社交媒體的學生的興趣領域,以及學生的天資/傾向考試結果,高校創建學生的詳細檔案。然后把這些檔案與已經畢業的學生以及在校的高一屆或幾屆的在讀學生的檔案比較,依據他們選擇了的課程專業,得出這些學生應該選擇哪些課程專業的建議。另外,整合關于未來勞動力技能需要和工資的外部數據,幫助學生在主修和輔修專業選擇上有豐富的信息。
學生學業有效性。持續監控學生的考試成績,并與單個學生以及相似學生群體之前的考試成績進行比較,整合學生的社交媒體和教師的記錄,創建學生行為和傾向/偏好的更詳細檔案。得出學生和課程的具體建議,比如個別或小組輔導、追加問題課程領域的學習材料,或者甚至改變課程與專業。這有利于學生的發展。
學生保留率。在學生學業有效性、財務和社會等大數據的基礎上進行分析,得出學生消耗的可能性分數,并給高校提出是否允許保留這個學生的建議。對那些面臨輟學和退學危險的學生提出具體的幫助建議。與此同時,授權教師對這些學生做出他們自己的建議。
教學有效性。用大數據測量教師的表現。教師的教學表現數據可以通過學科、學生人數、學生人口統計學、學生行為分類、學生的愿望高低和其他變量來測量獲得,讓教師與適合他們的學生和班級相匹配,確保學生和教師都能互相喜歡。這有利于教師的表現。”