【摘 要】隨著中國教育體制改革的不斷深入,教育的工作重心已由規模發展逐步轉移到內涵發展上來?!秶抑虚L期教育改革和發展規劃綱要(2010~2020年)》中對評估與監測的重視提到了前所未有的高度。然而傳統的數據采集、數據清理和數據分析方式已不能滿足大數據背景下教育質量監測的需求,因此利用計算機信息技術來采集、清理、分析監測數據具有非常重要的意義。
【關鍵詞】信息技術 教育質量監測 數據采集 數據清理 數據分析
【中圖分類號】G434 【文獻標識碼】A 【文章編號】1674-4810(2014)28-0180-02
近年來,隨著中國教育體制改革的不斷深入,“兩基”攻堅任務和目標基本完成。教育進入內涵發展階段,工作重心也逐步由注重規模、數量的發展轉移到提高教育質量和結構上來。因此,建立和健全科學的教育質量評估與監測體系已成為中國教育發展亟待解決的問題。中國已在2007年成立了國家基礎教育質量監測中心,迄今為止在國家層面上開展了多項基礎教育質量監測工作,獲取了大量有意義的數據。隨著計算機的普及、計算機網絡的飛速發展,計算機應用已向數據處理領域滲透。然而,受制于傳統觀念的束縛、相關技術人員的缺乏,一些地方教育質量評價仍然采用傳統人工方式進行數據的處理,這不僅局限了教育質量監測的范圍,同時也大大影響了監測結論的準確性。受這一客觀因素的制約,教育質量監測的重要意義雖已得到社會的公認,卻一直得不到快速的發展。因此,如何將現代信息技術應用于教育質量監測中,建立起覆蓋全國的教育質量監測評估系統已成為各級教育行政部門及教育科研機構的重要研究課題。
一 教育質量監測的傳統數據處理方式
教育質量監測的本質是科學地用數據來說明教育的現狀。
監測數據的采集是教育質量監測的基礎和重點。傳統的數據采集方式是由學校通過電子表格將數據填好,再將數據進行層層上報,最后再由專人進行匯總。這種采集方式數據來源單一,且存儲、管理和分析數據量也相對較小,而監測所涉及的數據種類繁多、規模龐大,人工操作方式顯然難以完成監測數據的采集。
監測數據的清理是將采集來的監測數據進行清理。數據清理是發現并糾正數據中可識別錯誤的最后一道程序,包括檢查數據的重復性、一致性,處理無效值和缺失值等。傳統的數據清理方式是通過人工檢查,這種方式需要投入大量的人力、物力、財力,且效率極其低下,尤其在大數據量的情況下幾乎是不可能的,因此,監測數據清理一般是由計算機而不是人工完成。
監測數據的分析是將清理好的干凈數據加以集中、萃取、提煉,挖掘出隱沒在看似雜亂無章的數據背后更有價值、更有意義的東西。要真正了解教育的現狀、實現監測目標就必須要有大量完整的數據來進行統計分析,而非僅僅對數據做簡單的排名、統計。傳統的人工統計方法無法做一些深層的分析,顯然無法達到這樣的要求。
因此,傳統人工方式進行的數據處理僅能提供較為粗糙、表面的信息,根本無法達到教育質量監測的目的,這也反過來制約了教育質量監測的發展。
二 教育質量監測信息化的緊迫性
當前,各國政府也越來越深刻地認識到教育質量的重要意義。美國總統布什上任后的第一份立法動議是以提高中小學教育質量為主旨的教育改革計劃——《不讓一個孩子落后》。俄羅斯出臺了普通教育國家標準和教育督導標準體系。英國公布了《學校督導大綱》。墨西哥聯邦政府在沒有強勢公辦教育資源的情況下,于2002年8月8日和各州政府、高等教育機構、民間團體、企業界的代表共同簽署了《提高教育質量社會契約》,強調教育質量對國家未來的重大和決定性意義……
經過幾十年的發展,中國的教育已基本達到了青少年“有書讀”的目標。另一個更為艱巨的任務是讓青少年“讀好書”,也就是提高教育質量。而質量監測則是實現這個目標的重要組成部分。然而,傳統的人工數據處理方式大大阻礙了教育質量監測的發展,使其不能起到應有的作用。同時,新的社會形勢對數據也提出了更高的要求:數據廣泛性要求、數據公正性要求、數據準確性要求、統計高效性要求、數據的共享與運用要求。這些要求僅僅依靠人工方式根本無法實現,必須借助具有強大的數據處理和分析能力的計算機信息技術以及計算機網絡平臺才能完成,這就為教育監測的信息化提出了更為迫切的需求。
三 教育質量監測信息化的實現
隨著計算機信息技術的迅猛發展及其在社會各領域應用的不斷普及,教育信息化也得到了長足的進步。同時,近年來國家相繼出臺了一系列推進教育信息化的政策和措施,在相關的文件中對教育信息化也提出了明確的要求,這就為教育質量監測的信息化提供了可能。
教育質量監測的信息化按照監測基本原理、主要流程、實際需要來看,主要包括:數據采集信息化、數據清理信息化、統計分析信息化等環節。
1.數據采集信息化
數據采集信息化是指通過計算機系統將監測過程中所需的各種原始數據進行自動采集。教育質量監測所需要的數據量非常龐大,依靠人工操作的方式存在諸多弊端:數據不全面、數據丟失、數據異常、數據采集不及時等,針對這些弊端,根據監測的實際需要,我們通常采用以下幾種方式來實現數據采集的信息化。
第一,聯網直報構建教育數據庫。教育面向教育教學管理和教育教學應用服務的核心是教育數據庫建設。教育數據庫建設是利用信息科技手段對教育教學資源進行整合,最終建成互動化、多媒體化的共享式資源數據倉庫。
聯網直報形式是依靠計算機網絡技術進行數據采集的方式。通過聯網直報,學??梢灾苯訉祿鞯绞〖壔驀医逃块T的數據中心,這樣就避免了人為干擾,保證了數據的及時性、準確性、可靠性。同時,通過聯網直報形式可以提高數據的干凈度,減輕數據清理的工作,使數據分析人員有更多的精力放到對數據的審核和分析上。
因此,通過聯網直報方式來構建教育數據庫可以保證數據的多樣性和準確性,從而為教育質量監測提供必要的數據保證。同時,建成的教育數據庫也可以為教育行政部門提供教育政策信息、教育教學改革理論研究,為學校提供特色的教育成果展示平臺與信息交流平臺等。
第二,網上問卷調查系統。問卷調查是教育質量監測中必不可少的一種方式。傳統的問卷調查方式主要是以紙質的方式發放給被調查人員填答,待問卷回收后再進行問卷數據的錄入。通常完成一項紙質問卷調查需要幾周甚至幾個月的時間,同時紙質問卷也不可避免調查中訪員的造假現象。相對于傳統的紙質調查方式,網上問卷調查系統具有低成本、高可靠性、無時空限制、可控制性等優點。因此,在教育質量監測中除了某些特殊情況(如被調查者年齡較?。┍仨毷褂眉堎|問卷外,網上問卷調查系統是質量監測過程中一個很好的選擇。
網上問卷調查系統需要面向較為龐大的調查樣本,因此在實施網上問卷調查系統的同時要考慮以下幾個方面的問題:安全性、高并發性、易用性、功能的完善性。
第三,網上閱卷系統。紙筆作答是質量監測的重要形式。紙筆作答的結果必須要電子化后才能進行統計分析,然而,由于監測對象龐大,手工錄入監測結果的方式幾乎是不可能的。
隨著計算機掃描識別系統的成熟,網上閱卷系統的可靠性不斷提高,加之其簡單易用的特點,使得網上閱卷系統逐漸被大家接受。紙筆作答形式主要有兩類題,一類是客觀題,另一類為主觀題。對于客觀題,由于其選項形式、個數、答案都比較固定,因此網上閱卷系統可以實現對這類題型進行自動識別給分,這樣就實現了學生客觀題答案數據的自動采集。對于主觀題,由于這類題型的答案形式不唯一,因此需要閱卷教師參與審閱。對于這類題,網上閱卷系統將掃描后的試卷圖片進行切割,在閱卷過程中只顯示給閱卷教師主觀題部分的圖片,自動屏蔽了答題卡上的學生信息,這樣就保證了閱卷過程中公平、公正的原則。同時,閱卷系統主觀題閱卷部分采用B/S架構,閱卷教師可以在任何有網絡的地方都可以進行評卷,這樣教師的閱卷工作變得非常容易、閱卷效率也大為提高。
2.數據清理信息化
由于監測數據量非常龐大且來源較廣,因此在數據采集過程中不可避免會出現一些“臟數據”(即存在數據質量問題)?!芭K數據”的主要表現為:拼寫問題、錄入錯誤、不合法值、空值、不一致值、簡寫、重復值、不遵循引用完整性等。如果不對這些“臟數據”進行清理,必將會影響監測結果的準確性,因此在數據清理之前需先將采集上來的數據進行清理,數據清理主要包括:重復ID清理、一致性檢查、缺失值處理、異常值處理。
數據清理信息化的實現目前主要依靠編寫專門的計算機應用程序,但由于數據清理的復雜性,對于不同的數據源,數據清理需要適應不同的數據類型、具體業務需求。此外,在數據清理過程中,由于有很多錯誤是不可預料的,因此數據清理工作不能僅僅依靠計算機程序就能完成,人工交互是必要的。
當前數據清理的信息化主要通過預定義清理規則,使用特定的算法,利用關系型數據庫提供的數據處理能力來完成數據清理工作。對于大部分數據可以通過信息化手段進行自動清理,但是一些需要結合特定領域知識的數據清理工作,則需要有該領域的專業人員通過相應的計算機應用程序才能較好、較快地完成。
3.數據分析信息化
第一,統計分析信息化。數據清理完成后,接下來就進入到教育質量監測最為關鍵的一環——數據的統計分析。由于監測的數據量非常龐大,傳統的人工統計方式已不能完成對監測數據的統計分析,因此采用信息化手段進行監測數據的統計分析已經成為教育質量監測發展的必然要求。
監測數據統計分析信息化就是將清理后孤立的數據依據教育測量統計理論進行自動化分析。隨著計算機技術的發展,當前出現了許多統計軟件(如SPSS、SAS、S-PLUS、EXCEL等),這些統計軟件操作簡單、功能強大,并已經在中國的社會科學、自然科學的各個領域發揮了巨大作用。但是這些統計軟件存在不可修改、不靈活等缺陷,在具體的統計過程中,除了利用已有的統計軟件進行統計分析外,通常也需要利用新的方法和理論對數據進行分析。因此,借助于信息化技術,根據實際需要通過編寫計算機程序進行分析成為現代統計分析的一個重要手段。
第二,數據報告生成自動化。監測數據通過統計分析軟件很容易就能分析出所需的結果。統計分析軟件輸出結果雖然漂亮,但是普遍存在一個缺陷,就是不能為Word等常用文字處理軟件直接打開,只能采用拷貝、粘貼的方式加以交互,這在數據量巨大、分析種類眾多的情況下無疑是對分析人員一個非常大的考驗,頻繁的復制粘貼不僅工作量巨大,同時也容易因為疏忽而出錯。為了解決這個問題,我們可以將統計軟件與重用的文字處理軟件通過編寫程序將兩者相結合,即利用統計分析軟件強大的統計分析功能對監測數據進行分析,然后將分析結果(含文字和圖片)自動粘貼到文字處理軟件中,從而實現數據報告的自動生成。
四 結束語
教育質量監測隨著中國教育體制改革的不斷深入越來越受到人們的重視,然而傳統的人工數據處理方式已不能滿足當前教育質量監測的需求,因此利用計算機信息技術建立科學、完善的教育質量監測體系不但非常必要,而且具有非常現實的意義。隨著信息技術與教育質量監測不斷深入的結合,教育質量監測必能得到更好的發展,在教育教學、教育行政決策等方面發揮更重要的作用。
參考文獻
[1]辛濤、李峰、李凌艷.基礎教育質量監測的國際比較[J].北京師范大學學報(社會科學版),2007(6)
〔責任編輯:龐遠燕〕