董 婧,李 麗
(曲靖師范學院信息工程學院,曲靖 655011)
高等教育信息化系統中積累的數據量日益增多,而高校管理人員往往缺乏數據分析意識以及有效的信息處理手段,導致在選擇資源時無法得到有效、優質的信息,一些有用的潛在信息得不到發掘利用,出現“信息孤島”的現象。數據挖掘與數據分析技術的日益成熟為高校管理工作的開展提供了新的機遇,也帶來了新挑戰。越來越多的高校開始關注大數據的科研價值,有效挖掘教育大數據的潛在信息,并為高校和受教育者提供科學決策,是高校教育發展的現實需求和未來趨勢。大數據對教學狀態數據以及教學質量監控提供了新路徑,實現了“智慧”高等教育教學內容創新研究、“智慧”高校管理、“智慧”人才培養和“智慧”評價。
科學評價高校現存專業辦學質量和投入產出比可以為管理和決策者提供科學依據和數據支持,推進教育決策科學化。已有研究多是注重對考核模型的研究,忽視了真實數據的類型多樣性和海量性,數據指標不夠細致,缺乏有效性判定。本文依據云南省二本院校畢業生就業與培養質量調查問卷與年度目標責任制考核大數據,利用因子分析、相關分析和生存分析等統計學方法分析了二級學院各專業的生存現狀和年度學校目標管理責任制考核影響因素。最后根據研究結果發現現存問題并為高校管理者決策時提供科學依據,實現“智慧”高校管理。
對高校教育大數據的深層次挖掘與利用離不開數據挖掘技術、統計學和信息學。本研究利用概率論建立數學模型,收集曲靖師范學院教育教學大數據,經過數據錄入、清洗等預處理工作后,進行量化分析和總結,做出推斷和預測,為相關決策提供依據和參考。具體用到的有因子分析、相關分析和生存分析。因子分析研究高校目標責任制考核多個指標內部相關的依賴關系,把具有錯綜復雜關系的變量歸結為少數幾個綜合因子,便于研究其與考核結果的相關關系;相關分析研究高校目標責任制考核等級與主要考核指標因子間的依存關系,對具有依存關系的現象探討其相關方向以及相關程度,并以相關系數作為統計指標來說明相關關系密切程度;生存分析主要研究生存率曲線的變動趨勢,生存過程影響因素分析及結局預測,本研究利用生存分析客觀評價二級學院下屬各專業人才培養質量,預測專業未來生存情況。
根據各學院畢業生填寫的《曲靖師范學院畢業生就業與培養質量調查問卷》(2017屆和2018屆),收到6300余份有效調查問卷,包含了個人信息、就業情況(就業畢業生填寫)、升學情況(升學畢業生填寫)、自主創業情況(自主創業畢業生填寫)、未就業情況(“待就業”和“其他暫不就業”畢業生填寫)、教育培養情況(所有畢業生均填寫)、對母校的評價共七個部分的內容,對學校的人才培養、就業工作以及學校下一步改革和發展有重要意義。十四個二級學院也都據此發布了2017屆和2018屆《學生就業質量年度報告》,根據以上所有大數據信息,進行了各學院各專業的生存分析。
2018年度目標管理責任制考核數據來源于曲靖師范學院目標管理責任制網絡管理平臺。各二級學院通過目標管理責任制考核系統提交的考核數據,數據類型多樣,包括了結構化、半結構化和非結構化數據格式,具體涵蓋了文本文件、圖形圖像、視頻等多媒體信息,數據量巨大。考核主要包括年度工作任務、基礎管理工作、特色發展目標、學生測評得分四項基本內容。其中特色發展目標指對增強學校核心競爭力具有重要影響的工作,包括教學與學生發展、學科建設、科學研究、師資隊伍建設、服務地方、國際交流與合作6個一級指標和若干二級指標和三級指標。
生存分析基于曲靖師范學院畢業生就業與培養質量調查問卷項目中抽取的專業名稱、畢業生對薪酬待遇滿意度、畢業生對學校人才培養工作滿意度、畢業生簽約單位滿意度、畢業生簽約單位與期望值匹配度、畢業生對就業服務工作滿意度等信息設定因子,統計了各等級滿意度的人數,其中滿意度分為三個等級:不滿意、滿意和很滿意(見表1)。根據以上信息建立有效的專業滿意度模型,分析了十四個二級學院的所有各專業的生存情況,快速準確地了解學生對各個專業的滿意度情況,下面列舉了專業總體差異相對顯著的學院進行分析。

表1 生存分析中滿意度因子等級量化標準
通過對各學院各專業進行生存分析,研究發現數學與統計學院三個專業的總體顯著性值為0.002,說明三個專業生存曲線之間的差異非常顯著,而數學與應用數學專業和信息與計算科學專業差異最顯著,顯著性值達到0.001。該學院的數學與應用數學專業整體滿意度最高,是數學與統計學院的王牌專業,而信息與計算科學專業累積生存函數下降最快,滿意度最低。信息工程學院三個專業的總體顯著性值為0.195,說明三個專業生存曲線之間的總體差異不是很顯著,計算機科學與技術專業整體滿意度最高,是該學院的王牌專業,而信息管理與信息系統專業累積生存函數下降最快,滿意度最低。經濟與管理學院四個專業的總體顯著性值為0.222,說明四個專業生存曲線之間的總體差異不是很顯著。會計學專業整體滿意度最高,是該學院的王牌專業,而市場營銷專業累積生存函數下降最快,它與會計學專業顯著性值為0.072,差異最顯著,滿意度最低。音樂舞蹈學院四個專業的總體顯著性值為0.424,說明四個專業生存曲線之間的總體差異基本不顯著,四個專業的發展比較均衡,但總體而言航空服務專業整體滿意度最高。學校和相關二級學院應高度重視整體滿意度低的專業生存問題,從人才培養方案、教學大綱、教師教學、學生就業等各個方面進行全面監控和改革,改善現存的問題。

圖1 學院各專業累積生存函數圖
目標管理責任制考核圍繞學校年度和階段性重點工作、發展的關鍵性指標確定目標考核體系,根據制定的考核指標和各教學單位的完成情況,本研究選取了年度工作任務、基礎管理工作、國家級省級教學改革與教學質量工程項目、國家級省級職業資格證書、國家級省級學科專業競賽獲獎、國家級省部級項目、核心期刊論文、學科建設、師資隊伍建設、服務地方、國際交流與合作、學生測評得分十二個考核因素作為自變量,各教學單位考核等級結果作為因變量,研究各考核因素與考核結果的相關關系、相關程度以及貢獻強度,一方面可以分析各教學單位根據既定的考核目標的完成情況以及特色目標發展情況,另一方面也檢測了考核結果是否達到了學校的考核目的,是否實現了學校年度和階段性重點工作、發展的關鍵性指標。
提取方法:主成分分析法。
首先使用因子分析法實現降維,即把多個變量化為少數幾個綜合變量來考察原變量間的聯系與區別。通過變量共同度表和主成分表(見表2)可以看出,按照特征根從大到小的次序排序,第一主成分即國家級省級學科專業競賽獲獎,特征根為3.641,方差貢獻率為36.41%;第二主成分即國際交流與合作,特征根為1.703,方差貢獻率為17.03%;第三主成分即國家級省部級項目,特征根為1.473,方差貢獻率為14.73%;第四主成分即國家級省級教學改革與教學質量工程項目,特征根為1.26,方差貢獻率為12.60%,前四個因子的方差累積貢獻率為80.773%,最終選擇前七個因子作為主成分來分析其對考核結果的影響。

表2 變量共同度表和主成分表
通過考核結果與主影響因子的相關關系研究可以得到高校的年度任務執行情況,使用相關分析中的距離分析方法來分析以上選擇的七個因子與考核結果之間的相關程度,結果如表3所示。

表3 近似性矩陣
通過近似矩陣可以觀察到變量之間的距離關系的強弱,其中考核結果與國家級省級學科專業競賽獲獎之間的距離相關系數為0.664,說明這兩個變量之間的距離關系很強,國家級省級學科專業競賽獲獎變量對考核結果的貢獻程度最大;其次,國際交流合作與考核結果之間的距離相關系數為0.625,對考核結果的貢獻程度排在第二位,主要體現在外國語學院52.7%的考核分數都來源于此項考核指標,而其他學院此項指標的得分普遍很低;再者是國家級省部級項目,與考核結果之間的距離相關系數為0.429,對考核結果的貢獻程度排在第三位;然后是學生測評得分,與考核結果之間的距離相關系數為0.398,對考核結果的貢獻程度排在第四位;教師發表核心期刊論文因素對考核結果的貢獻程度排在第五位;而國家級省級教學改革與教學質量工程項目和學生取得國家級省級職業資格證書兩個變量與考核結果的距離相關系數最小,分別為0.074和0.04,說明他們的距離相關強度最弱,對考核結果的貢獻程度非常小,幾乎不起作用。
從對2018年度二級學院目標管理責任制考核數據的影響因素分析可以看出,對考核結果貢獻程度最大的五個變量依次是國家級省級學科專業競賽獲獎、國際交流合作、國家級省部級項目、學生測評得分、教師發表核心期刊論文,由此可以看出2018年度二級學院工作重心普遍在于組織學生參加各種學科專業競賽,鼓勵教師進行科學研究,努力提升學校教育國際化水平。
針對高校信息化系統的日趨完善與數據量呈幾何級增加,研究選取了曲靖師范學院畢業生就業與培養質量調查問卷與年度目標責任制考核大數據,經過數據預處理后,利用因子分析、相關分析和生存分析等統計學方法分析了二級學院各專業的生存現狀和2018年度學校目標管理責任制考核影響因素。研究發現多數二級學院各專業間的總體顯著性值差異不是很顯著,但是諸如數學與統計學院的信息與計算科學專業累積生存函數下降最快,滿意度最低,應高度重視整體滿意度低的專業生存問題,從各個方面進行全面監控和改革,改善現存的問題,實現“智慧”人才培養。此外,2018年度二級學院工作重心普遍在于組織學生參加各種學科專業競賽,鼓勵教師進行科學研究,努力提升學校教育國際化水平。學校決策層根據該考核結果,結合年初所制定的年度任務與目標,可以分析所制定考核方案的合理性,實現“智慧”高校管理。