鐘志宏



摘 ?要:通過(guò)收集、整理和預(yù)處理,獲得較為完整的計(jì)算機(jī)類(lèi)畢業(yè)生信息數(shù)據(jù);分析專業(yè)、性別、社會(huì)實(shí)踐與政治理想、獲取精準(zhǔn)扶貧助學(xué)金、違規(guī)違紀(jì)處分、畢業(yè)情況等各種因素對(duì)學(xué)業(yè)的影響,進(jìn)而得到地方本科高校計(jì)算機(jī)學(xué)科教學(xué)管理的若干有意義的指導(dǎo)與建議,為學(xué)生在校期間的學(xué)業(yè)做出預(yù)測(cè)性的評(píng)估與預(yù)警。
關(guān)鍵詞:數(shù)據(jù)分析;學(xué)業(yè)預(yù)測(cè);計(jì)算機(jī)教育;地方本科高校;SPSS
中圖分類(lèi)號(hào):G640 ? ? ? ?文獻(xiàn)標(biāo)志碼:A ? ? ? ? ? ? 文章編號(hào):2096-000X(2021)19-0052-05
Abstract: By collecting, sorting and preprocessing, this paper obtains more complete information data of computer graduates. Then, the paper analyzes the influence of various factors on academic performance, such as major, gender, social practice and political ideal, targeted poverty alleviation grant, disciplinary punishment and graduation. In the end, some meaningful guidance and suggestions on the teaching management of computer discipline in local universities are put forward, and predictive evaluation and early warning are made for students' academic performance during the school period.
Keywords: data analysis; academic prediction; computer education; local universities and colleges; SPSS
一、問(wèn)題的提出
隨著我國(guó)工業(yè)2025和智能制造戰(zhàn)略的提出,以及信息產(chǎn)業(yè)“自主可控”的現(xiàn)實(shí)意義越來(lái)越迫切,高素質(zhì)信息技術(shù)人才成為左右國(guó)家政治命脈、經(jīng)濟(jì)發(fā)展、軍事強(qiáng)弱和文化復(fù)興的關(guān)鍵因素。覆蓋了互聯(lián)網(wǎng)、軟件開(kāi)發(fā)、硬件設(shè)計(jì)、云計(jì)算、大數(shù)據(jù)、人工智能等相關(guān)專業(yè)的計(jì)算機(jī)教育近年來(lái)得到了快速發(fā)展。據(jù)統(tǒng)計(jì),目前我國(guó)也有1200個(gè)院校開(kāi)設(shè)了計(jì)算機(jī)類(lèi)相關(guān)本科專業(yè),其中,“985”“211”院校占15%左右,地方本科院校占85%左右[1]。地方本科院校的計(jì)算機(jī)類(lèi)專業(yè)人才培養(yǎng),構(gòu)成了我國(guó)信息產(chǎn)業(yè)人才的基礎(chǔ),為區(qū)域經(jīng)濟(jì)社會(huì)發(fā)展提供了重要智力支持和人才支撐。地方本科院校的生源素質(zhì)與師資水平,決定了其辦學(xué)定位及人才培養(yǎng)目標(biāo),當(dāng)前地方本科院校的計(jì)算機(jī)類(lèi)專業(yè)均以就業(yè)為導(dǎo)向、以應(yīng)用型為目標(biāo)的人才培養(yǎng),以滿足社會(huì)發(fā)展與需求。
此外,學(xué)生在校期間的學(xué)業(yè)受多種因素的影響[2],而地方本科院校由于生源情況相關(guān)影響更為顯著;學(xué)校積極利用這些影響因素對(duì)學(xué)生在校期間學(xué)習(xí)生活進(jìn)行指導(dǎo)與激勵(lì),能夠有效提高學(xué)生的學(xué)業(yè)成績(jī);同時(shí),也能夠根據(jù)相關(guān)因素可能導(dǎo)致的不利結(jié)果,對(duì)學(xué)生做出學(xué)業(yè)和生活上的合理干預(yù)與預(yù)警,從而確保學(xué)生順利、高效的完成學(xué)業(yè),達(dá)成人才培養(yǎng)目標(biāo)[3]。
二、分析研究方法
數(shù)據(jù)分析與數(shù)據(jù)挖掘成為進(jìn)行復(fù)雜問(wèn)題分析的重要方法,通過(guò)對(duì)客觀真實(shí)的數(shù)據(jù)進(jìn)行分析,不僅能對(duì)預(yù)設(shè)問(wèn)題進(jìn)行合理解釋,也能發(fā)現(xiàn)隱藏的新問(wèn)題。數(shù)據(jù)分析與數(shù)據(jù)挖掘方法在教育領(lǐng)域得到了廣泛應(yīng)用[4-5],促進(jìn)了教育問(wèn)題的量化分析,成為制定教育教學(xué)各方面決策的主要依據(jù)。
本文通過(guò)對(duì)獲取我院2020屆計(jì)算機(jī)類(lèi)專業(yè)畢業(yè)學(xué)生的學(xué)業(yè)進(jìn)展數(shù)據(jù)、黨員發(fā)展數(shù)據(jù)、畢業(yè)認(rèn)證數(shù)據(jù)、精準(zhǔn)扶貧獎(jiǎng)學(xué)金數(shù)據(jù)、班級(jí)班干成員數(shù)據(jù)等進(jìn)行數(shù)據(jù)集成,然后利用SPSS軟件對(duì)數(shù)據(jù)信息綜合分析[6],力求獲得專業(yè)、性別、社會(huì)實(shí)踐與政治理想、獲取精準(zhǔn)扶貧助學(xué)金、違規(guī)違紀(jì)處分、畢業(yè)等各種因素對(duì)學(xué)業(yè)的影響,進(jìn)而總結(jié)出有意義的結(jié)論與建議。
三、數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)準(zhǔn)備(數(shù)據(jù)預(yù)處理)是數(shù)據(jù)分析的前提,合理的、高質(zhì)量的樣本信息是分析結(jié)果準(zhǔn)確、有效的保證。在數(shù)據(jù)預(yù)處理中,綜合使用了多種手段和工具,如C語(yǔ)言、Access數(shù)據(jù)庫(kù)、SPSS、掃描儀、文字識(shí)別軟件等。數(shù)據(jù)預(yù)處理的基本過(guò)程如圖1所示。
(一)數(shù)據(jù)抽取
分析研究涉及到2020屆畢業(yè)生的學(xué)業(yè)進(jìn)展、黨員發(fā)展、畢業(yè)認(rèn)證、精準(zhǔn)扶貧獎(jiǎng)學(xué)金、班級(jí)班干成員等數(shù)據(jù),這些數(shù)據(jù)來(lái)源于不同的系統(tǒng)和渠道、以多種文件格式(包括數(shù)據(jù)庫(kù)表、Excel、CSV、文本文檔、數(shù)據(jù)圖片、紙質(zhì)文檔等)存儲(chǔ)。數(shù)據(jù)抽取時(shí),將不同渠道獲取的數(shù)據(jù)均以畢業(yè)生的“學(xué)生編號(hào)”作為標(biāo)識(shí)屬性存儲(chǔ)在不同的數(shù)據(jù)表中,并存入用于數(shù)據(jù)初步處理的Access數(shù)據(jù)庫(kù)中。
在上述過(guò)程中,處理的難點(diǎn)在于非機(jī)構(gòu)化存儲(chǔ)的文本文檔、圖片和紙質(zhì)文檔,本文采用的處理方法如下:
1. 對(duì)于非結(jié)構(gòu)化存儲(chǔ)的文本文件,編寫(xiě)字符過(guò)濾程序?qū)?shù)據(jù)進(jìn)行格式化。
2. 對(duì)于紙質(zhì)文檔,首先利用掃描儀數(shù)字化以PDF文檔形式存儲(chǔ)在計(jì)算機(jī)中,再通過(guò)文字識(shí)別軟件進(jìn)行識(shí)別以獲得文字,最后對(duì)獲得的文字進(jìn)行核對(duì)及數(shù)據(jù)格式化。圖片文件采用相應(yīng)的處理方式。
(二)數(shù)據(jù)集成
通過(guò)數(shù)據(jù)抽取,將不同渠道信息存儲(chǔ)在Access的不同數(shù)據(jù)表中,并經(jīng)過(guò)簡(jiǎn)單的處理及分析。然后,將Access中的數(shù)據(jù)表導(dǎo)入SPSS分析軟件,利用“變量合并”功能將多個(gè)表中的信息根據(jù)“學(xué)生編號(hào)”標(biāo)識(shí)進(jìn)行數(shù)據(jù)合并;合理設(shè)計(jì)合并后數(shù)據(jù)表中的變量屬性:數(shù)據(jù)類(lèi)型、寬度、小數(shù)點(diǎn)位數(shù)、標(biāo)簽、值、度量標(biāo)準(zhǔn)、角色等,最后以SPSS支持的“sav”格式保存數(shù)據(jù);通過(guò)數(shù)據(jù)的規(guī)范化,便于后續(xù)在SPSS中進(jìn)行數(shù)據(jù)分析。