楊道平 簡巖 陳佳
摘要:高等教育統計數據是國家了解、分析高等教育狀況的基礎數據,是國家進行高等教育管理的重要依據,統計數據質量是實現科學決策和管理的關鍵所在。本文從大數據時代出發,結合大數據的特征,從五個維度描述了教育統計數據質量的內涵,分析了大數據時代高等教育統計數據質量面臨的挑戰,從組織機構建設改革、優化統計指標體系、建立數據質量標準、拓寬數據采集手段、統計信息化建設、信息反饋機制、責任追究制7個方面,提出了高等教育統計數據質量保障體系建設的建議,希望對提升高等教育統計數據質量有一定的參考作用。
關鍵詞:高等教育;數據質量;大數據;保障體系
中圖分類號:TP393 文獻標識碼:A
文章編號:1009-3044(2019)09-0011-02
1 教育統計基礎數據質量的內涵
教育統計基礎數據作為國家掌握教育基本狀況、管理教育活動、制定教育政策及引導教育發展方向的重要依據,基礎數據質量是關鍵。關于教育統計基礎數據質量的內涵,各國研究人員有多種觀點,沒有統一、完整、全面的定義,本文主要從以下五個方面考慮[1]:
數據一致性:數據集中,不存在相互矛盾的數據以及數據本身不出現語義錯誤。比如數據(姓名=“張三”、區號=“0851”、城市=“遵義”)含有一致性錯誤,因為0851是貴陽區號而不是遵義區號。
數據完整性:數據集包含完整的數據對象且每個數據對象的屬性值不存在缺失的問題。例如要統計某學校學生獲得國家級獎項的情況,如果漏掉幾個,將對這所學校的評價產生較大影響。
數據精確性:數據集中每個數據都能準確表達現實中的實體。比如在校學生數,一定要準確到個位數。
數據時效性:數據信息能表達現實實體的實時狀態,數據不過失。
實體同一性:同一個實體在不同數據庫中的標識及數據保持一致。例如某學生在教務系統與學生管理系統中沒有相同的標識或數據不一致,將導致該學生的數據信息表達混亂。
2 大數據時代高等教育統計數據質量面臨的挑戰
自2001年我國實施教育統計工作以來,教育統計工作取得了長足發展,教育部對教育統計數據質量高度重視,多次發出通知要求各地教育主管部門及學校加強統計數據質量把關,并通過修訂數據報表內容及指標解釋、建立數據質量核查機制、每年開展統計人員培訓等手段,確保教育統計數據質量。
我國高校在實施教育數據統計工作方面,相對于其他教育組織在統計人員知識背景、利用信息手段等方面占有一定的優勢。但由于我國現行教育統計組織機構不完善、教育統計數據標準不健全、采集基礎數據的手段相對單一、教育信息化發展不均衡、不充分等因素的影響,導致教育統計數據質量仍有待進一步提高。隨著大數據時代的來臨,龐大的數據量進一步增加了高等教育數據統計工作復雜性;基于大數據應用的統計數據需求,倒逼著高等教育統計數據質量向更高層次發展,大數據時代高等教育統計數據質量面臨新的巨大的挑戰。
2.1 大數據時代要求高等教育統計數據具有更好的包容性
大數據具有“量大”“多樣”的特點。高校師生在日常生活、學習及工作中,通過各種及時通訊工具、學習平臺、應用系統等產生了大量的數據,這些數據及其形式遠遠超出了傳統高等教育統計數據的范疇,但這些數據卻能從更加廣闊的角度反映各高校建設發展及教育教學活動的真實情況。高等教育統計若不能包容這些數據,那么統計數據的有效性、精確性、完整性就無法有效保證。
2.2 大數據時代要求高等教育統計數據具有更高的時效性
大數據的另一個特點是“快”。隨著互聯網及網絡、通訊技術的迅猛發展,信息數據幾乎每秒都在產生,并通過網絡迅速積聚,教育統計部門不再是海量數據的唯一擁有者。通過網絡迅速聚集的數據能夠產生強大的聚合效應,誰先搶占了這種聚合資源,誰就能“挾數據以令諸侯”,這對高等教育統計數據的時效性提出了極高的要求。
2.3 大數據時代要求高等教育統計數據具有更高的價值效率
大數據的另一個特點是“價值密度低”。目前,我國教育事業統計工作覆蓋全國50 余萬各級各類學?;驒C構、涉及2.6 億學生和1900 多萬教職工,每年調查指標1.6 萬項,數據量達55億條 [2] 。隨著時間的進程,數據集將更龐大,在這浩瀚的數據海洋中,常常是有價值的數據混雜著冗余數據,甚至錯誤數據,導致數據一致性、實體同一性較差。如何提升高等教育統計數據的價值效率是一個具有挑戰性的問題。
3 大數據時代高等教育統計數據質量保障體系建設
新時代新統計,隨著大數據時代的來臨,視頻、圖像及網頁等非結構化數據的產生,一方面拓展了數據的來源及渠道,豐富了統計數據的來源,有利于更加全面、準確地實現統計目的;另一方面對傳統的統計數據質量保障體系也提出了新的要求。如何進一步完善和加強高等教育統計數據質量保障體系建設,使得高等教育統計數據能更加充分反映高等教育的實際發展狀況,為教育決策提供更加可靠的數據基礎,本文提出如下建議:
3.1 進一步推進高等教育統計組織機構建設改革
大數據時代,數據量的急劇增加、數據來源渠道增多以及數據形式的多樣化對數據采集提出了更高的要求。一方面,不管是各高校還是各地教育主管部門,如果沒有專門的組織機構,很難有效完成數據統計工作;另一方面,目前我國教育系統雖然建立了數據統計人員培訓的長效機制,但實際進行數據收集填報的人員素質參差不齊,大多數不具備統計專業知識,僅僅通過簡單的填報操作培訓,不能從根本上解決數據填報質量的問題,因此,建立一支具有學術背景的專業人員隊伍很有必要。
3.2 進一步優化統計指標體系
大數據蘊含的價值信息與傳統統計數據集相比,具有更加的廣泛性、全面性,對當前高等教育統計數據指標體系建設提出了更高的要求。進一步優化高等教育統計數據指標體系、修改不適用的統計指標、建立分類統計數據庫模式等是大數據時代提升高等教育統計數據質量的前提條件之一。
3.3 進一步加強統計數據質量標準建設
數據質量標準是獲得科學、可靠數據的基礎,大數據的“多樣性”特點對高等教育統計數據質量標準建設提出了更高的要求。結合大數據時代高等教育發展的特點,進一步建立和完善全國高校統計數據質量標準體系及數據采集工作規范,是新時代高等教育數據統計工作的必然要求。
3.4 進一步拓寬數據采集方式
目前,我國高校主要通過“高基報表”、基本狀態數據填報方式上報數據,為國家監測高等教育質量提供參考。大數據時代,多源多渠道的數據從更加廣泛的角度反映了高等教育發展的基本狀況,現行相對單一的數據采集方式已經無法適應高等教育大數據的發展需要,構建多元化的高等教育統計數據采集方式,積極推進第三方組織參與數據采集、建立及時數據采集模式、開展定期調查方式等,是新時代高等教育數據統計工作的重要手段。
3.5 大力推進教育統計信息化建設
大數據的特點是“大、多、快、散”,大力推進高校信息化建設和教育主管部門統計信息化平臺建設,一方面可以減輕統計人員工作負擔,避免重復勞動,提高統計數據質量;另一方面,數據采集平臺能夠更好地確保數據實效性,提高數據真實性;更加有利于統計數據分析,促進數據共享和開放。
3.6 建立高校統計信息分析結果反饋機制
當前,我國高等教育統計數據分析主要在國家層面呈現,以“中國教育統計年鑒”方式向社會發布,主要呈現內容為各高校辦學基本條件、師生規模等基礎信息,僅為數據的統計,基本不涉及分析,統計數據的價值未能充分展現。充分利用大數據處理技術和手段,對高等教育統計數據進行評估分析,并將分析結果及時反饋給相關高校,必將有利于促進高校自身反省、加快發展改革、提高辦學質量,推動我國高校在內涵建設和外延發展上取得更好的實效。
3.7 強化責任追究制度
為了確保高等教育統計數據的真實性和權威性,結合高校教育教學工作實際,按照《統計法》有關規定制定教育統計數據責任追究制度,從法律層面保證統計人員提供數據的真實性等,是實現高質量統計數據的重要保障。
4 結束語
大數據時代的到來,其數據特征的變化對高等教育統計工作產生了前所未有的影響,如何抓住時代機遇,提高統計數據質量,使得高等教育統計數據能夠更好地發揮決策參考作用,是當前高等教育統計工作的重要任務。
參考文獻:
[1] 李建中,王宏志,高宏.大數據可用性的研究進展[J].軟件學報,2016,7(27):1605-1616.
[2] 程晶.大數據背景下教育統計數據有效利用的問題與對策[J].價值工程,2017(36):182-183.
[3] 吳旻瑜,郭海駿,盧蓓蓉,等.美國國家教育統計中心對我國教育管理信息化建設的啟示[J].世界教育信息,2014(03):13-19.
【通聯編輯:光文玲】