楊宏蘭 劉會青
(1.武漢工程大學(xué)學(xué)生處,湖北武漢 430074;2.武漢工程大學(xué)理學(xué)院,湖北武漢 430074)
高等學(xué)校學(xué)生成績數(shù)據(jù)庫管理著一個學(xué)校全部學(xué)生全部課程的各類考核成績,是一個學(xué)校教師教學(xué)質(zhì)量和學(xué)生學(xué)習(xí)質(zhì)量的集中反映,是一個巨大的資源寶庫,研究如何開發(fā)利用這一資源以獲得更好的為教學(xué)服務(wù)的作用與效果是有價值的。比如通過成績資源庫的分析,可以知道專業(yè)、課程設(shè)置及更新狀態(tài);學(xué)生規(guī)模與專業(yè)分布;課程教學(xué)質(zhì)量及趨勢;分級教學(xué)、中期分流等改革措施的實際效果等[1][2]。
數(shù)據(jù)的預(yù)處理包括對異構(gòu)數(shù)據(jù)庫提供的原始數(shù)據(jù)進行導(dǎo)入、導(dǎo)出操作和數(shù)據(jù)的規(guī)范化處理等工作。具體來講就是把以Access、Excel、文本文件等形式存在的原始數(shù)據(jù)統(tǒng)一導(dǎo)入到SQL Server數(shù)據(jù)庫,然后對導(dǎo)入的原始成績記錄進行規(guī)范化預(yù)處理,包括同一門課課程名稱的統(tǒng)一、成績記分中百分制與等級制的統(tǒng)一、無用成績和班級的刪除等。
異構(gòu)數(shù)據(jù)庫之間的導(dǎo)入導(dǎo)出是指數(shù)據(jù)在不同數(shù)據(jù)庫之間的導(dǎo)入導(dǎo)出。SQL Server數(shù)據(jù)轉(zhuǎn)換服務(wù)(DTS)是一組圖形化的工具和可編程的對象集,它允許取出、轉(zhuǎn)換和合并不同來源的數(shù)據(jù)到一個或多個目標(biāo)數(shù)據(jù)庫中。DTS可以導(dǎo)入/導(dǎo)出的數(shù)據(jù)型態(tài)包括:OLE DB和ODBC資料來源、文本文件、連接其它Microsoft SQL Server的執(zhí)行個體、Oracle和Informix數(shù)據(jù)庫、Microsoft Excel電子表格、Microsoft Access和 Microsoft FoxPro數(shù)據(jù)庫、dBase和Pardox數(shù)據(jù)庫。由于某高校學(xué)生成績原始數(shù)據(jù)以Access、Excel、文本文件三種形式存在,因此需要利用導(dǎo)入數(shù)據(jù)工具從Access數(shù)據(jù)庫、Excel數(shù)據(jù)庫、文本文件導(dǎo)入數(shù)據(jù)到SQL Server數(shù)據(jù)庫。下面以Excel表與SQL Server數(shù)據(jù)庫為例介紹DTS的使用方法。
(1)運行SQL Server Enterprise Manager-->Tools-->Dtata Transfer Services-->Import Data;
(2)根據(jù)向?qū)崾具x擇數(shù)據(jù)源:Microsoft Excel 97-2000以及Excel表文件具體位置;
(3)根據(jù)向?qū)崾具x擇數(shù)據(jù)宿類型:Microsoft OLE DB Provider for SQL Server以及目標(biāo)數(shù)據(jù)庫;
(4)選擇 Copy Table(s)and View(s)from Source Database,選擇要復(fù)制的表名即可完成數(shù)據(jù)導(dǎo)入工作。
數(shù)據(jù)導(dǎo)出操作與導(dǎo)入過程相同,只是數(shù)據(jù)源與宿不同。
數(shù)據(jù)格式的統(tǒng)一就是對原始成績記錄的規(guī)范化預(yù)處理。包括同一門課課程名稱的統(tǒng)一、成績記分中百分制與等級制的統(tǒng)一、刪除無用成績和班級等。
1.2.1 課程名稱的統(tǒng)一
由于任課教師的不同,所屬專業(yè)、所屬學(xué)院的不同,成績錄入時造成了同一門課課程名稱的不統(tǒng)一,因此,原始成績記錄規(guī)范化預(yù)處理的第一步就是做好對同一門課課程名稱的統(tǒng)一。統(tǒng)一課程名稱的工作通常較復(fù)雜,關(guān)鍵在于若何判斷哪些名稱應(yīng)屬于同一門課程,實踐中發(fā)現(xiàn)有的課程名稱多達十余個,比如畫法幾何及工程制圖、畫法幾何及制圖、畫法幾何與工程制圖、畫法幾何和工程制圖、工程制圖、畫法幾何、畫法幾何與制圖等,這是需要仔細核對教學(xué)計劃才能確定的,一旦清楚了一門課程的所有可能名稱,就可以用程序來完成課程名稱的統(tǒng)一工作。部分代碼如下:
Update程序設(shè)計基礎(chǔ)$
Set課程名稱='程序設(shè)計基礎(chǔ)'
Where(課程名稱='…')
1.2.2 修改記分制
數(shù)據(jù)庫中成績可能是百分制,也可能是A、B、C、D、E或優(yōu)、良、中、及格和不及格等等級制形式存放的,如果有缺考的情況,則成績會記錄為‘/’,為便于成績分析往往要先統(tǒng)一記分制,比如統(tǒng)一成百分制。在后面成績分析時,要用到與數(shù)據(jù)相關(guān)的函數(shù)Avg等,也需要把等級成績轉(zhuǎn)換成數(shù)據(jù)成績,以便于后面進行成績的分析。部分代碼如下:
/*更新表 — 程序設(shè)計基礎(chǔ)$*/
/*把表列成績?yōu)椤瘍?yōu)’或是’優(yōu)秀’的修改為90*/
Update程序設(shè)計基礎(chǔ)$
Set成績1='90'
Where(成績1='優(yōu)'or成績1='優(yōu)秀')
1.2.3 刪除無用成績及無用記錄班
觀察導(dǎo)入的數(shù)據(jù)表,發(fā)現(xiàn)有些學(xué)生的成績是’/’或是其它的無效字符,需要把這些沒有用的記錄刪除,還有一些班級是成教、二級學(xué)院、專科等系列的,這些班級往往不參加普通班成績統(tǒng)計分析,也要將其全部刪除掉。部分代碼如下:
/*刪除記錄—刪除無用成績和無用記錄班*/
Delete From程序設(shè)計基礎(chǔ)$
Where(成績1='/'or expr2like'%(信)%'or expr2like'%(信專轉(zhuǎn))%'or expr2like'%(成)%'or expr2like'%(專)%'or expr2like'%(信轉(zhuǎn))%'or expr2like'%1111%')or(課程類型like'%YD%')
要分析有代表性課程,如公共基礎(chǔ)課、學(xué)科基礎(chǔ)課、部分專業(yè)課程教學(xué)質(zhì)量與變化趨勢,需要選擇科學(xué)的評價指標(biāo),大體上涉及橫向和縱向兩個方面的比較。以《程序設(shè)計基礎(chǔ)》這門公共基礎(chǔ)課為例,我們從以下兩個不同方面進行數(shù)據(jù)分析。
縱向分析就是對不同年級的同一門課程進行成績分析,目的是分析不同課程的教學(xué)變化趨勢。統(tǒng)計年級為00級到04級共5組數(shù)據(jù),統(tǒng)計指標(biāo)包含屬性有年級,總?cè)藬?shù),平均分,標(biāo)準(zhǔn)差,標(biāo)準(zhǔn)差系數(shù)。分析結(jié)果見表1。

表1 某高校00~04級《程序設(shè)計基礎(chǔ)》成績分析表
對比各組數(shù)據(jù),很明顯可以看出:學(xué)生成績從00年到04年的平均成績普遍有所提高,總?cè)藬?shù)也不斷增大;比較00級、01級、02級、03級、04級的標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)差系數(shù),成績離散性明顯縮小,整體教學(xué)效果明顯提高。
橫向分析就是對同一門課程不同專業(yè)學(xué)生的成績進行分析,以比較各專業(yè)的發(fā)展差異。統(tǒng)計專業(yè)包括2003級外語、經(jīng)濟管理、計算機、環(huán)境工程、材料工程、機械、電氣、化工,課程為《程序設(shè)計基礎(chǔ)》分析結(jié)果見表2。結(jié)果表明,不同專業(yè)的學(xué)生平均分、不及格率有較大差異,而標(biāo)準(zhǔn)差區(qū)別不大,反映了不同專業(yè)學(xué)生學(xué)習(xí)上的整體(群體)差異,這些差異則啟示我們應(yīng)注意教學(xué)過程中如何因材施教。

表2 某高校03級分專業(yè)《程序設(shè)計基礎(chǔ)》成績分析表
應(yīng)用于成績分析的總量指標(biāo)主要有:學(xué)生人數(shù),每個分?jǐn)?shù)段的人數(shù),它反映了考試規(guī)模大小及考試的基本情況,是最直觀的基礎(chǔ)指標(biāo)。
成績分析中的相對指標(biāo)主要有:及格率,不及格率,各分?jǐn)?shù)段的比率,這些相對指標(biāo)一般都是由兩個有聯(lián)系的指標(biāo)相互對比而計算出來的一種比值:它能夠深刻地反映考試成績的好壞,有利于不同班級,不同科目之間建立起一種直接的對比關(guān)系。
成績分析中最熟悉的平均指標(biāo)是平均成績,而計算平均成績通用的方法是簡單的算術(shù)平均為算術(shù)平均能夠反映學(xué)生成績的普遍水平和集中程度,便于同類科目在不同班級之間進行比較。但算術(shù)平均易于受極大值和極小值得影響,因此不足代表一組成績的一般水平。
全距R=最大變量值—最小變量值,R越小,平均成績的代表性就越強;反之,成績差距大,平均成績的代表性就弱。利用全距進行統(tǒng)計分析,其計算簡便,意義清楚,但過于粗劣,只考慮了最大值和最小值的影響,而沒有考慮中間各個數(shù)值的影響。因此,不能夠充分地反映學(xué)生成績之間的實際離散程度。
平均成績掩飾了成績之間的差距,而全距計算又太粗劣。采用標(biāo)準(zhǔn)差來描述一組數(shù)據(jù)的離散程度,標(biāo)準(zhǔn)差的簡單計算公式為:標(biāo)準(zhǔn)差小,說明學(xué)生之間的水平較為均衡,平均成績的代表性較強,反之,說明學(xué)生之間的水平差距較大,平均成績不具有代表性。
在兩組平均成績不等的情況下,用標(biāo)準(zhǔn)差系數(shù)來說明組與組之間平均成績的代表性,標(biāo)準(zhǔn)差系數(shù)的計算公式是標(biāo)準(zhǔn)差系數(shù)又叫做離散系數(shù),只有通過計算離散系數(shù)消除不同組間平均水平所產(chǎn)生的影響,才能做出正確的比較和判斷。計算出來,標(biāo)準(zhǔn)差系數(shù)越大,說明成績之間的差距越大,平均成績的代表性就越小;反之,標(biāo)準(zhǔn)差系數(shù)越小,說明成績之間的差距越小,平均成績的代表性越大。
現(xiàn)實生活中,人們往往局限于總量指標(biāo)、相對指標(biāo)和平均指標(biāo)對考試成績的分析,而忽略了標(biāo)志變異指標(biāo)的應(yīng)用。總量指標(biāo)、相對指標(biāo)和平均指標(biāo)固然是一組相互依存的指標(biāo),而平均指標(biāo)和標(biāo)志變異指標(biāo)也是一組相互補充的概念,兩者從不同側(cè)面說明了學(xué)生成績的個性與共性。在實際中,只有將多種指標(biāo)結(jié)合應(yīng)用,才能深刻的揭示現(xiàn)象的本質(zhì)。
對教師來說,通過對考試成績的分析,可以了解學(xué)生對教材、教法的適應(yīng)情況,以便調(diào)整教學(xué)內(nèi)容和教學(xué)方法,進而改善教與學(xué)的關(guān)系。然而,學(xué)生成績分析卻是一項比較麻煩的工作,如計算平均成績與標(biāo)準(zhǔn)差等,為此,我們采用SQL Server數(shù)據(jù)庫,設(shè)計了一個簡單用于考試成績分析基本思路和框架,由此分析成績數(shù)據(jù)表得出了一些結(jié)論,目的是減輕教師進行此項工作的負(fù)擔(dān),從而為改進教學(xué)活動提供依據(jù)。
1 馬慶國.應(yīng)用統(tǒng)計學(xué):數(shù)理統(tǒng)計方法、數(shù)據(jù)獲取與SPSS應(yīng)用[M].北京:科學(xué)出版社,2005.
2 李德寶,孟超,呂堃,阮五洲.學(xué)生成績分析系統(tǒng)設(shè)計[J].教育信息化,2005,(11):23~24.
3 石文華.基于VB的學(xué)生成績管理系統(tǒng)設(shè)計與實現(xiàn)[J].山東電力高等專科學(xué)校學(xué)報,2004,7(1):32~34.