張迪
摘要:隨著大數據技術的不斷發展,數據挖掘技術被應用于高校招生工作中,極大地節省了物力人力,提升了招生效率。基于此,各位立足于數據挖掘相關內容分析高校招生中應用數據挖掘的先進意義,該文重點探討高校招生中數據挖掘的應用路徑,以供參考。
關鍵詞:數據挖掘;高校招生;關聯規則算法
中圖分類號:G202? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)17-0024-02
開放科學(資源服務)標識碼(OSID):
1 背景
招生工作是高校一切活動的重要前提,高質量的招生工作能夠為人才培養目標的實現奠定良好基礎。在當前大數據時代下,通過在高校招生中應用數據挖掘技術,能夠準確掌握學生信息,為錄取通知書的打印等后續工作提供便利。
2 數據挖掘概述
所謂數據挖掘,其屬于計算機科學的一種,主要指的是通過使用算法在大量數據中尋找隱藏信息的過程,主要涉及的方法有在線分析處理、統計、專家系統、模式識別以及機器學習等。在使用數據挖掘技術獲得目標數據時,共分為七個步驟,分別是對問題進行定義、構建數據挖掘庫、對數據進行分析、準備數據、建立模式、對模型進行評價以及應用模型。目前,數據挖掘的應用十分廣泛,例如Credilogros Cia Financiera S.A.中客戶信用評分的改善以及電信行業的應用等。
3 分析高校招生中應用數據挖掘的先進意義
隨著計算機技術的不斷發展和大數據分析技術的普及應用,挖掘技術被廣泛應用于各個分析領域,并發揮了不可替代的作用。對于高校招生工作而言,招生數量、質量是高校各項工作高質量開展、人才培養計劃得以實現的重要基礎,但在學生高考結束后,高校無法獲取考生信息、報考信息,這給高校招生工作中的宣傳與咨詢工作、人才選拔工作以及招生決策的制定提出了極高的要求。因此,需要采取一定方法對學生素質進行分析,預測學生對各個專業的報考情況等,而這些需求通過應用數據挖掘技術均能夠得到滿足。通過在高校招生中應用數據挖掘技術,能夠充分發揮高考注冊數據庫、畢業生就業數據庫、大學招生數據庫等數據庫的作用,通過使用關聯規則算法掌握學生近幾年的活動數據和考試成績,進而對學生考試成績進行估算,進而為招生工作的開展奠定良好基礎。同時,由于高校間具有一定競爭性,提前掌握學生成績和素質能夠提前提供電話宣傳和咨詢工作,進而吸引考生報考本校,提高考生報考質量[1]。
4 探討高校招生中數據挖掘的應用路徑
4.1 做好數據挖掘的前期準備工作
在高校招生中應用數據挖掘技術時,應做好數據準備工作,構建高校招生數據倉庫模型,并選擇合適的關聯規則算法,從而為后續招生工作中的應用奠定良好基礎。首先,在數據準備階段主要分為兩方面,分別是數據選擇和數據預處理。對于數據選擇,在我國教育事業不斷發展的背景下,高校招生工作量越發龐大,涉及眾多數據,數據中難免夾雜著無效數據,為此,需要對其進行篩選,即數據選擇,從而為數據挖掘準確性提供保障。通過數據篩選后,剩下的數據滿足可定義要求,但仍具備零散性,所以,需要對其進行數據轉換、聚集以及集成處理,刪除無關特征,合并數據對象,建立新的數據特征,提高數據挖掘效率。其次,根據自身需求綜合運用數據挖掘技術和功能對招生數據倉庫模型進行構建,使其能夠在后續工作中發揮出招生決策的分析優化作用。其中,所應用的構建方法是數據驅動法,通過在高校學生管理體系、招生系統中對數據進行整合,從而根據自身需求構建概念模型、物理模型以及邏輯模型。最后,由于高校招生工作不僅涉及學生相關數據,還包括考生家長、就業前景等數據,為此,在對數據進行管理時應對關聯規則算法進行合理選擇,實現對相關數據庫數據的有效處理和挖掘,達到高校招生目的,提高學生到校報到率。
所謂關聯規則算法,主要指的是對數據間的關聯點進行尋找,并以此為基礎建立圖形,進而滿足后續數據處理需求。挖掘過程可分為兩個步驟,一是對所有頻繁項集進行搜索,二是以頻繁項集為基礎產生強規則。在高校招生工作使用關聯規則時,主要運用Apriori算法,該算法整體關聯形式較為簡單,通過將頻集理論為基礎開展逐層搜索迭代,進而得到候選集Ck,再根據任何非頻繁的(k-1)項集都不是頻繁k項集子集的頻集理論進行剪枝。目前,大部分關聯規則挖掘算法均是在Apriori算法的基礎上延伸而言,例如劃分技術、動態項集計數技術等,從而提高考生數據的收集效率。例如,將考生ID作為聯系點,在其進行志愿填報工作時,就可以對適合填報的專業名稱進行統計,將統計結果作為預測基礎[2]。或是利用學校高考統招以及學生成績等數據,按錄取方式以及學生素質等指標對學生信息進行相對性分析,從而掌握各項數據的隱藏信息,該過程就是定義挖掘問題環節。之后,整合多個源數據庫,開展數據準備工作,主要包括考生基本情況、學生公開的各項成績等,之后從中選擇用于數據挖掘的有效數據,進而幫助招生辦工作人員掌握能夠切實反映生源真實信息的數據,為生源質量、院校報考情況等內容進行合理預測。最后,對學生在校期間進行測評成績綜合量化,其中,智育成績和德育成績占比分別為70%和30%,通過合計成績對學生實際情況進行準確預測。
4.2 招生宣傳和咨詢工作方面的應用
數據挖掘技術的應用能夠幫助高校招生辦工作人員從大量數據中尋找目標數據,并對此類數據進行分析,將分析結果作為工作開展基礎。一般情況下,在學生報考前或是錄取前,高校往往無法得知哪些學生能夠報考該學校,只有報考者能夠單方面地知道誰能夠錄取。在該情況下,既不利于學生選擇學校和專業,也不利于高校高品質學生的選擇。因此,高校往往會在學生成績出來后、報考前就運用數據挖掘技術對該屆考生數據進行挖掘,尋找符合學校要求的高品質學生。在其進行挖掘過程中,主要對考生的歷史信息進行分析,并以目標標準庫為基礎對哪些學生能夠錄取本校進行分析,之后通過對比相對應的信息與結果判斷是否與預期相同,進而從大量數據中心挑選出咨詢關注范圍的考生。最后,對其進行數據進行歸類,以此為基礎推斷學生信息,以主動的方式聯系學生,開展招生宣傳和咨詢工作。例如,通過電話宣傳和線上宣傳,吸引符合要求的學生前往本校進行參觀,進而達到招生宣傳和咨詢工作的目的,提高招生質量。
以華北工業大學為例,在省招辦投檔前,華北工業大學無法獲得有哪些學生想要報考這所大學,在該情況下,華北工業大學利用多年來積累的學生錄取數據,通過對沒有分類的中學歷史數據庫、某省歷年歷史數據庫進行查詢,能夠使用數據挖掘技術找到符合本校錄取要求的學生,進而對學生信息進行推斷,根據推斷結果開展招生宣傳和咨詢工作。在該工作中,主要面向目標考生講解優惠政策,讓目標考生更愿意報考華北工業大學,進而通過數據挖掘、服務招聘、高校宣傳等工作為招生質量奠定良好基礎[3]。
4.3 高校人才選拔方面的應用
對于高校招生工作而言,其主要目標是盡量選擇優質考生,提高報考工作的質量和效率,為此,數據挖掘技術在高校人才選拔方面也發揮著不可替代的作用,尤其在錄取和登記工作中。由于我國人口數量較多,且教育水平較高,接受高等教育的學生人數不斷增加,導致考生信息具有極大的工程量,而數據挖掘技術的應用能夠有效減輕工作人員的工作量和工作壓力,并實現考生信息的良好定位。除此之外,數據挖掘的使用還能夠幫助高校招生辦工作人員進行考生的挑選,在一定程度上促進教育事業的發展。因此,在數據挖掘過程中,能夠為高校提供大量有效數據,使其掌握學生的相關信息,讓招生辦工作人員推測出學生的綜合素質及不足之處。通過數據挖掘技術的分析,能夠從眾多考生中挖掘中滿足本校期待的考生,提高生源質量。除此之外,通過在人才培養制定方面應用數據挖掘技術,能夠借助數據分析結構提高方案可行性。例如,利用中學學籍庫分析學生素質,此類數據庫真實地記錄著考生的學習情況以及各方面的能力和品行,為此,通過應用數據挖掘技術,能夠通過其關聯算法掌握學生與各項活動之間的聯系,并利用定性與定量相結合的分析方法和指標對學生成績進行計算,為高校人才選拔工作的順利展開提供保障。主要使用的方法有分析、演化相關數據庫,以規則推導方法對學生素質進行評價,并對其進行模糊處理,再以加權平均法對數據分析結果進行排序,最后使用動態聚類法分析評價結果,進而為人才選拔提供助力。值得注意的是,在使用數據挖掘技術對考生歷史數據進行處理后,當出現新的數據后,可以基于歷史數據處理結果對新數據進行模擬、推算,進而獲得相對準確的結果。在給高校人才選拔工作提供幫助的同時,還能夠為高校人才選拔機制的創新奠定良好基礎,使其不斷優化、更新。
4.4 科學制定招生決策方面的應用
隨著教育事業的不斷發展,高校招生工作不僅是面向學生提供高校信息,還需要為高校招生決策提供幫助,而數據挖掘技術能夠通過學生綜合素質的分析為招生決策的制定奠定良好基礎,發揮輔助作用。具體而言,在高校開展招生工作時,相關工作人員可以根據候選人分布情況以及考生對專業的報考需求對本校生源計劃進行規劃,而這需要建立在數據挖掘分析結果上,提升高校分省分專業的科學合理性。對于高校省級次專業生源計劃和社會需求而言,二者在一定程度上具有一定的序列關系,可以說,二者構成了一個鏈條系統[4]。在高校生源計劃制定不合理的情況下,會對學生未來就業的順利性造成影響;若是高校在對招生計劃進行制定時,沒有將就業形勢以及學生就業計劃很好地體現出來,那么會導致學生在畢業時出現難以就業的問題。因此,為有效避免此類問題的出現,提高招生質量、為學生順利就業提供保障,應在高考注冊數據庫、大學招生數據庫以及畢業生就業數據庫等相關數據庫中使用數據挖掘技術,通過分析海量數據并使用挖掘關聯分析和序列分析功能,能夠有效利用C45決策樹生成算法對專業及就業情況進行分析與總結,從大量數據中尋找有價值的規則。進而為各專業將來的職業需求和變化進行預測,根據預測結果制定高校招生決策,能夠保證專業設置數量的合理性、生源計劃規劃的科學性,實現人才的科學培養,為社會提供所需人才[5]。
5 結束語
綜上所述,通過在高校招生工作中應用數據挖掘技術能夠有效提高招生質量和招生效率,為高校人才培養計劃的實施奠定良好基礎。因此,應將數據挖掘技術應用于高校招生工作中的咨詢和宣傳、人才選拔以及招生決策制定等方面,從而為招生工作提供有效參考。
參考文獻:
[1] 王炳堃.數據挖掘技術在高校招生數據管理中的研究和應用[J].隴東學院學報,2020,31(5):11-14.
[2] 許佳,林雨萱.高校招生中引入數據挖掘技術的應用前景探索[J].計算機產品與流通,2019(8):265.
[3] 阿布力米提·卡依木.數據挖掘技術在高校招生數據管理中的應用研究[J].大慶師范學院學報,2018,38(3):33-36.
[4] 越縉.數據挖掘在民辦應用型本科高校招生中的應用研究[D].合肥:安徽大學,2019.
[5] 王新偉.數據挖掘在高校招生工作中的應用概述[J].才智,2018(27):166.
【通聯編輯:謝媛媛】