倫關臣



摘要: 隨著“互聯網+”時代的到來,大數據技術的運用已成為當今重要發展趨勢。而政府掌握著社會各方面的數據,教育部陽光高考信息公開平臺已經將高考政策、高校名單、高校招生簡章、入選學生名單等信息進行了發布,各省市的教育考試院也公布了一分一檔等重要信息,信息量非常大,大數據的運用對高考志愿填報有著重要作用。本文重點從基于“互聯網+”和大數據的高考信息公開中高考志愿填報的現狀分析、影響分析及對策分析三個方面入手,探索量身定制的大數據分析,通過基于“互聯網+”和大數據在高考志愿填報中更深層的應用進行研究并提出解決對策。
Abstract: With the advent of the "Internet+" era, the application of big data technology has become an important trend of development today. The government holds all aspects of social data, the Ministry of Education sunshine college entrance examination information platform has released the college entrance examination policies, university list, college enrollment rules, the list of selected students and other information, the provincial education test hospital also announced a point one file and other important information, the amount of information is very large, and the use of big data on the college entrance examination voluntary reporting has an important role. This article explores tailor-made big data analysis through three aspects of the present situation analysis, impact analysis and countermeasure analysis of college entrance examination voluntary reporting based on the "Internet+" and big data, studies the further application of "Internet+" and big data in the college entrance examination voluntary reporting and proposes solutions.
關鍵詞: 互聯網+;大數據;高考信息;質量提升;志愿填報
Key words: internet+;big data;college entrance examination information;quality improvement;voluntary reporting
中圖分類號:TP392 文獻標識碼:A 文章編號:1006-4311(2018)10-0199-03
互聯網+時代下大數據不僅改變了人們的生活方式、還引起學術科研模式的巨大改變。對事物進行分析進行決策時,越發依賴該事物的所有數據,不再是進行樣本分析。在大數據時代,允許不精確,更注重相關關系,而不是因果關系。互聯網+其實就是利用互聯網去整合、去創新、去改變、去發掘其他行業的潛能。互聯網+時代下大數據已顯示出巨大的影響力,正悄悄地改變著人們。大數據時代是信息社會運作的必然結果。
教育部陽光高考信息公開平臺已經將高考政策、高校名單、高校招生簡章、入選學生名單等信息進行了發布,各省市的教育考試院也公布了一分一檔等重要信息,信息量非常大,對于考生填報高考志愿、規范高校行為起到了很好的作用,但是,這些信息對于學生來說也是非常頭疼的,信息量太大,不易將不需要的信息進行有效過濾,不能按照其自身的需求量身定制,這些都成了考生深層次的需求。為了適應考生的需求,提升信息公開質量和效益,非常有必要將公開的信息利用“互聯網+”技術進行大數據整合分析,挖掘信息潛力,提高信息服務質量和效益。
我國高考志愿填報機制的改革研究是近年來教育界熱點,考后知分填報志愿確實可以提高考生填報志愿的科學性,增加透明度,降低失誤率,體現以人為本的原則,減少了高分低就、高分落榜的現象。但是我國的志愿填報時間各省各地區均不一致,在知分后填報雖然考生知道自己的考分和高校以往的錄取分數,但不知道其他人如何選擇,心儀學校有多少人報考,也就是說雖然是知分后填報,但由于掌握的是不完全信息或者是局部信息,在知分填報的情況下很容易出現志愿填報扎堆情況,如今已經進行互聯網+時代,大數據已經在多個領域中發揮作用。
如何從這些數據中找到潛在有價值的信息,正成為數據挖掘的研究內容。每年的高考志愿填報中,各省的考生志愿數據高達數百萬條,這些數據規模巨大,蘊涵豐富的決策信息和知識。采用數據挖掘技術對之進行挖掘分析,可以給現行的志愿填報機制以數據支持。
大數據看規律,很多考生和家長在知道分數后進行填報志愿時,各種招考信息令人眼花繚亂,不知如何是好。高考填報志愿是一項比較抽象的事情,目前高考信息公開的數量已經非常多,但是對于學生和家長來說,他們掌握的都是零散的,不成系統的,沒有整理的點對點的信息。學生在填報志愿時費時費力,且易形成扎堆的現象。通過“互聯網+”和大數據分析,為學生和家長建立整合的信息,學生只要輸入高考分數,平臺就可以提供針對該分數的合適的院校,并對志愿的填報提供數據分析和信息支撐。
在河北省考試院網站上可以看到公開的信息,見表1。
需要對海量的高考信息進行數據分析和整合,力爭將分散的信息轉化為具有志愿填報支撐的整合型數據,減輕學生和家長的信息處理負擔,為其志愿的填報提供更多的信息支撐。結合先進經驗來提出比較完善的大數據發展應對策略,大數據往往由來源不同的數據集構成,且呈現出高維性和稀疏性的特點。以2017年本科一批文史一志愿平行投檔情況統計為例,見表2,整合分析將同一解釋變量在所有數據集中的回歸系數視為一個組,整合分析的組由同一變量的所有系數構成。將每個解釋變量在所有數據集中的系數視為一組,通過對系數組進行壓縮,研究變量間的關聯性并實現降維。
信息挖掘技術是大數據時代的靈魂和核心,信息挖掘技術涉及多種多類的知識節點,研究信息挖掘的關鍵技術,最終達到決策支持的作用。以2017年對口專科批一志愿投檔情況統計為例,見表3,針對數據的相似性和差異性。屬于同一類別的數據間的相似性很大,但不同類別之間數據的相似性很小。隱藏在數據項之間的關聯或相互關系,可以根據一個數據項的出現推導出其他數據項的出現。
對于考生填報高考志愿、規范高校行為起到了很好的作用,但這些信息對于學生來說信息量太大,不易將不需要的信息進行有效過濾,不能按照其自身的需求量身定制,這些都成了考生深層次的需求。為了適應考生的需求,提升信息公開質量和效益,非常有必要將公開的信息利用“互聯網+”技術進行大數據整合分析,挖掘信息潛力,提高信息服務質量和效益。
國內官方對于高考公開信息的整合力度遠遠沒有達到考生和家長的需求,量身定制的大數據分析更是幾近空白。順應社會需求,加強信息共享,提高數據效益,是新時期為民辦實事的具體體現,是時代賦予我們的責任和義務。實現高考公開信息的整合,為考生和家長志愿的填報提供數據支持,能夠為省市考試局在相關招考工作中提供可借鑒可執行的建議,另外互聯網+時代大數據技術在志愿填報方面的研究提供參考,具有一定的社會研究價值。
[1]何穎.高考平行志愿錄取機制改革的政策分析[J].教育科學,2008,24(3):16-19.
[2]劉占山.高考平行志愿的利弊分析[J].中國校外教育,2008, 9(10):6.
[3]王曉,王芳,邱玉輝.經典數據挖掘方法在客戶建模中的應用分析[J].西南師范大學學報(自然科學版),2013,28(4):544-546.
[4]Jiawei Han, Micheline Kamber. 數據挖掘:概念與技術[M].范明,孟小峰,譯.北京:機械工業出版社,2011.
[5]厲浩.高考平行志愿改革研究[J].教育發展研究,2013,11(7):32-43.
[6]黃君獻,歐薇.信息技術與信息服務國際研討會論文集:A集[C].北京:中國社會科學出版社,2013.
[7]馬宏斌,王柯,馬團學.大數據時代的數據挖掘綜述[B].測繪與空間地理信息,2014,37(7):19-22.
[8]王樹良,丁剛毅,鐘鳴.大數據下的空間數據挖掘思考[A]. 中國電子科學研究院學報,2013,8(1):8-17.
[9]Gudivada V N.Information retrieval on the World Wide Web.IEEE Internet Computing,2016.
[10]李水平.數據采掘技術回顧[J].小型微型計算機系統,2015.