陳 效(中國美術學院,浙江 杭州 310024)
中國美術學院于2010 年開始進行本科招生改革,由原來的專業招生更改為現在的大類招生。改革的目的是為了配合學院 “兩段式” 的教學模式,同時能讓學生有 “二次” 選專業的機會,從而在完善本科教學的人才培養模式。
所謂大類招生,即在考生報考我院時,按造型藝術類、設計藝術類、圖像與媒體藝術類、中國畫類和藝術理論類進行錄取。考生被錄取后,一年級統一進入專業教學基礎部、中國畫系和藝術理論基礎部進行基礎學習。于一年級下半學期末進行專業分流,二年級進入相應的專業或專業方向學習(每年因專業建設需要,部分專業會停招,也會有部分新專業進行招生)。
依據《中國美術學院本科生專業分流方案(試行)》(以下簡稱《方案》),基礎教學部制定分流工作實施細則和具體日程安排,并在教務處的指導下,分動員準備、模擬分流、正式分流三個階段進行。
第一階段作為準備期,告知并讓學生確認第一學期成績和學年各門課程學分;張榜公布各分部按照加權平均分成績排序的全體學生名單以及各大類專業招生的學生計劃數;讓學生了解學院分流方案辦法和具體流程。
第二階段作為試分流期,通過模擬分流讓學生對分流工作有進一步了解,也讓具體實施的工作人員有一個適應的過程,及時掌握學生的志愿意向。
第三階段作為分流的正式階段分三輪進行。第一輪,公布各教學單位接收人數70% 的名額,學生填寫平行志愿,按照加權平均分排名依次選擇專業方向;第二輪,在學生完成第一輪選擇后,剩余各專業30% 的名額,由教學單位組織選拔,第二輪教學單位選拔順序以抽簽的方式來依次進行,被教學單位選中,而不愿意者,直接進入第三輪;第三輪,在前兩輪仍未分流到專業方向的學生,在有剩余名額的專業方向中填寫參考志愿,由學院統一安排進入各專業方向。
從分流工作的程序中,我們可以看到在目前的教學評價方法下,學生在一年級的學習成績(包括各門專業必修課和公共必修課)對于分流是關鍵。因此,學生在填報分流志愿前對于各項直接影響到成績的因素格外關注。加上藝術類院校學生對于成績的感性認識使得他們無法平衡專業必修課與公共必修課之間的關系。換言之,對于大部分成績一般或者專業文化不平衡的學生,在填報專業分流志愿時帶來了極大的困惑和壓力。而對于教學管理部門來說,倘若以傳統的僅統計專業必修課和公共必修課的加權平均分來尋找其中的規律從而指導學生填報志愿的話,勢必顯得不夠全面和詳細。因此,如何借助更為科學和嚴謹的數據分析方法,并將其作為工具使用到實際分流工作中,是本文的研究內容。
數據挖掘,是指從大量數據中提取或者挖掘有效的、新穎的、潛在有用模式的非平凡過程。廣義上講,數據挖掘是從存放在數據庫、數據倉庫或其他信息庫中的大量數據中挖掘有趣知識的過程。簡單的說,就是從數據中找出有用的部分,舍去無用的部分。
數據挖掘是知識發現的一個特定的步驟,所謂的知識發現(KDD:Knowledge Discovery in Database)是指從數據中發現有用知識的整個過程。而數據挖掘是知識發現中用專門算法從數據中抽取模式的過程。知識發現KDD 過程主要由以下7 個步驟組成:① 數據清理,② 數據集成,③ 數據選擇, ④ 數據變換,⑤ 數據挖掘,⑥ 模式評估,⑦ 知識表示。
使有價值的知識、規則或高層次的信息可以從數據庫的相關數據集中抽取出來,使大型的數據庫作為一個豐富可靠的資源為決策服務。數據挖掘有以下幾個特點:
(1)處理的數據規模十分龐大,否則簡單地使用統計方法處理就可以了。
(2)用戶查詢的要求往往是不精確的,需要數據挖掘技術幫用戶查找他們可能感興趣的東西。
(3)數據挖掘既要擔負發現潛在規則的任務,還要管理和維護規則。
(4)數據挖掘中,規則的發現基于大樣本的統計規律,當置信度達到某一閥值時,就可以認為規則成立。
數據模型的指導思想為:根據考生的基本信息(即各項文化課和專業課成績),依據學校管理部門對于文化課和專業課的賦權,結合數據挖掘算法,對歷史數據進行聚類,從而得出該學生的專業分流評估值,最后給出評估值最高的一個或兩個專業作為參考。本文將以造型分部專業分流據說為例。
根據模型的指導思想,可以得到專業推薦模型的流程(圖1)所示。

圖 1 專業推薦模型流程圖
在填報專業志愿時,學生考慮的因素較多,但就目前政策而言有以下二十四個指標:大學計算機基礎、大學英語1、綱要、解剖、外國文學、藝術概論1、大學英語2、基礎、體育1、透視、藝術概論2、中國文學、傳統書畫基礎1、色彩1、素描1、形式基礎1、傳統書畫基礎2、色彩2、素描2、形式基礎2、專業所在院系高級職稱數、專業作品獲獎次數(不同比賽層次的折算分值不同)、獎學金覆蓋率和就業率。
其中,根據目前現行《中國美術學院專業評價體系》和《中國美術學院本科招生分流方案》文件精神,將上端院系高級職稱數、專業作品獲獎次數、獎學金覆蓋率和就業率等指標體系統一作為專業評價體系來執行,學校每4 年對現有專業進行評估,從而得出最終專業分值。
因此,可將學生分流中考慮因素總體指標體系定為3 個,分別是個人文化課成績、個人專業課成績和專業評估值三項。
本文通過正方教務管理系統,利用教學任務平臺、學生成績平臺中的相關數據,抽取特定學生成績統計排名的數據作為樣本數據進行試驗。
(1)數據提取
中國美術學院一年級專業分流的重要客觀依據便是學生一整年的學習成績數據,包括各門公共必修課和專業必修課。管理部門根據每個學生所有必修課成績的加權平均分進行統計排名,由高到低進行專業選擇。本系統可根據圖4-3 進行設置,界面中 “補考、重修及格后取60 分” 意思為學生若通過補考或者重修及格后,排名時將以總評分60 分記,若仍然不及格將以正考、補考(或重修)中最高成績記;“平均分小數點位數” 最多為6 位,以降低平均分相同情況;若還是產生平均分相同情況,可選擇 “專業必修課” 進行 “總評均分相同時二次排名”。最終,生成年級學年成績統計排名情況。
由于此次數據分析以歷年數據為基礎,因此將提取2010級、2011 級和2012 級一年級課程統計排名數據作為分析基礎數據。
(2)數據處理
步驟一:將課程成績轉換為加權分
集中了3 個年級一年級的分流數據后,我們將各課程成績轉成加權分。
根據目前的專業分流辦法,學生是經過各課程的加權平均分排名后進行,同時各課程成績經過加權處理后,可以正確體現不同課程對于分流影響因素的大小。
加權公式為:加權分 = 課程成績 × 課程學分
步驟二:清楚噪點(異類數據)
由于復學后的學生在休學前所修課程可能與正常學生不同,而外國留學生、港澳臺留學生存在有部分公共必修課免修,因此將此兩類學生數據刪除。
步驟三:計算各專業中各課程的平均加權分將歷史數據中學生已分配的專業作為樣本標簽,統計出各專業各課程加權分的平均值后,與各專業評估值合并,作為最終數據分析的樣本表。
樣本數據建立后,將借助MATLAB7.0對其進行聚類實驗。 根據不同的λ,獲得不同的聚類效果,我們可以得到合理的聚類數為4。
當我們將結果分為2-4 類時,可以看到結果(表1)和(圖2)所示。

表 1 造型各專業聚類結果表
(1)結果分析
從聚類結果表和樹狀圖中,我們得到以下結果(分成4類):
第一類:雕塑、繪畫(版畫)、繪畫(油畫);
第二類:公共藝術(壁畫與漆畫)、公共藝術(景觀裝置)、公共藝術(藝術工程與科技)、美術學(藝術鑒藏);
第三類:公共藝術(公共雕塑)、繪畫(跨媒體藝術);
第四類:美術學(公共美術教育)、美術學(教師教育)
返觀表3,可以看到雕塑、繪畫(版畫)、繪畫(油畫)的各門課程加權分都很高,同時教學管理部門對于它們的評估值也是很高的。也就是說此三個專業作為傳統的造型類專業在學生中有著崇高的地位,成績優秀者必然首選這三個專業。二、三類的繪畫(跨媒體藝術)等新興造型專業,也受到了學生一定程度的關注。而處于第四類的美術教育等專業,由于受到就業等因素的影響,未得到學生的充分重視。
可以說此次聚類結果比較符合中國美術學院的事實。
(2)數據模型的實現
在得到專業分類的結果后,要將符合學生條件和想法的那一類專業推薦給他,這就是推薦模塊需實現的功能。
在得到專業類別的同時,也得到了各個類別的聚類中心值Vnm,n=4,m=20。
模塊根據輸入的學生各項指標用歐氏距離公式算出到各類別聚類中心值的距離,以結果最小值作為依據推薦給學生作為填報分流志愿的參考。
同時,模塊可提供教學管理部門對于各項指標賦權的輸入作為客觀權重,對各專業進行重新分類,以實現更為合理的分流結果。
通過實驗,我們獲得一個關于專業分流較為穩定的數據模型,基本實現了最初的設想。值得注意的是,該模型基于的數據僅是造型藝術類,并沒有覆蓋所有大類,且每個大類的評價體系和指標不盡相同;倘若需要針對不同大類建立不同數據模型,該模型也只有造型藝術類3 年的數據。可見今后深入研究的范圍還很廣。