王娜
摘 要:簡要介紹了基于貝葉斯網絡的試卷分析試驗,試驗主要用到的工具是基于MATLAB語言編寫的BNT軟件包。通過試驗研究,分析了平時的出勤率、作業提交率等五方面內容對學生成績的影響。
關鍵詞:試卷分析;貝葉斯網絡;概率推理;BNT工具包
中圖分類號:TP183 文獻標識碼:A 文章編號:2095-6835(2014)21-0137-02
考試是教學過程中不可缺少的組成部分,是對教和學的質量檢驗。考試結果可以反饋出大量的信息——反映出整個教學過程的得失,反映出各個教學環節的情況,反映出學生的能力,反映出學生的學習特點和規律。針對以上幾方面,在命題時要有多方面的設計。考試結果可以反映命題和考試本身的情況,也就是測量工具、測量方法和測量過程的情況。分析這些信息,進行一定的思考,提出一些觀點和建議,供領導決策時參考,以此作為制訂工作策略的依據,為學校老師和學生提供一定的指導。所以說,試卷分析是一件很重要的工作。
1 貝葉斯網絡與因果推理
貝葉斯網絡又稱為置信網絡,是基于概率分析、圖論的一種不確定性知識的表達和推理模型。一個典型的貝葉斯網絡由兩部分組成:①有向無環的圖,其中每一個節點代表一個變量、屬性、狀態或其他的實體,節點之間的弧反映了變量間的依賴關系,指向節點X的所有節點被稱為X的父節點。②與每個節點相聯系的條件概率表列出了此節點相對于其父節點所有可能的條件概率。貝葉斯網絡約定以節點Vi的父節點為條件,Vi與任意非Vi子節點條件獨立。
2 利用BNT軟件包分析試卷
在此次的試卷分析試驗中,以過去學生的期末考試成績為依托,隨機抽取了一部分學生的考試信息作為此次試驗的原始數據。利用軟件篩選、整理這些數據,然后通過基于MATLAB語言開發的關于貝葉斯網絡學習的BNT軟件包建模,主要完成建立貝葉斯網絡的工作,以此來反映選定因素對試卷成績的影響。影響試卷成績的因素主要有:A——作業提交率、B——上課出勤率、C——否是留級生、D——主觀題得分率和E——客觀題得分率。
2.1 為試卷分析篩選數據
第一步:把影響試卷的因素作為變量,即貝葉斯網絡模型中的節點,得到的候選數據集如表1所示。其中,R(is pass)標記為該樣本的狀態值,“1”表示成績及格,“0”表示成績不及格。
表1 變量與狀態的關系
A B C D E R
0.67 0.85 0 0.78 0.56 1
0.54 0.66 1 0.54 0.39 0
0.89 0.96 0 0.85 0.78 1
… … … … … …
第二步:由于貝葉斯網絡是用離散型變量,因此,對原始數據進行處理,數據離散處理結果如表2所示。
例如離散處理“上課出勤率”這一變量。根據教學經驗,一般同學的出勤率都在90%以上,如果低于70%,學習成績很
———————————————————————————
可能不理想,所以,將變量B分為3段——小于70%為low,70%~90%為mid,大于90%為high。
表2 對表1數據的離散處理結果
A B C D E R
high mid no high mid yes
mid low yes mid mid no
high high no high high yes
… … … … … …
第三步:數據格式轉換。
根據MATLAB的特點,將數據集轉換為矩陣的形式,而且所有屬性的取值全部依次編號為1,2,3.
表2對應的矩陣為: .
以由此得到的樣本數據集作為模型數據集來構造模型。
2.2 貝葉斯網絡的建模
接下來的工作就是以得到的數據建立貝葉斯網絡,然后對得到的貝葉斯網絡進行參數學習。從得到的貝葉斯網絡和學習得到的參數中可以看出選定的因素對試卷的影響。
經過實踐,筆者得到的結果是:“上課出勤率”和“作業提交率”是影響其他因素的原因,而“上課出勤率”又可以影響到“作業提交”,這是與限制了父節點個數的結果相同的部分,不同的是:①“是否是留級生”又影響了“客觀題得分率”和“主觀題得分率”兩項。如果出現這樣的結果,不難看出,留級生在考試分數上和正班生還是有一定差距的。②“主觀題得分率”影響了“是否及格”這一項。出現這種結果是因為在統計數據時,主觀題分值占了60%.
從以上試驗結果的數據中可以看出,作業提交率和上課出勤率對其他三個因素的影響。
3 結論
對試驗結果分析后發現,得到的結果基本符合實際情況。學生的“上課出勤率”和“作業提交率”是影響其學習成績的重要因素。由此可見,知識是平時一點一滴積累起來的,即便是在大學校園,在日常教學過程中,也應加強對學生的紀律管理,督促學生按部就班地學習。
參考文獻
[1]沈海峰.基于貝葉斯網絡數據挖掘技術理論計算法的研究[D].安徽:合肥工業大學,2005.
〔編輯:白潔〕
Paper based on Bayesian Network Analysis
Wang Na
Abstract: This paper introduces the papers based on Bayesian network analysis test; the test is based on the main tools used MATLAB language BNT package. Through experimental research, analyzes the impact of the five aspects of the usual attendance, job submission rate on student achievement.
Key words: paper analysis; Bayesian networks; probabilistic inference; BNT Kit
摘 要:簡要介紹了基于貝葉斯網絡的試卷分析試驗,試驗主要用到的工具是基于MATLAB語言編寫的BNT軟件包。通過試驗研究,分析了平時的出勤率、作業提交率等五方面內容對學生成績的影響。
關鍵詞:試卷分析;貝葉斯網絡;概率推理;BNT工具包
中圖分類號:TP183 文獻標識碼:A 文章編號:2095-6835(2014)21-0137-02
考試是教學過程中不可缺少的組成部分,是對教和學的質量檢驗。考試結果可以反饋出大量的信息——反映出整個教學過程的得失,反映出各個教學環節的情況,反映出學生的能力,反映出學生的學習特點和規律。針對以上幾方面,在命題時要有多方面的設計。考試結果可以反映命題和考試本身的情況,也就是測量工具、測量方法和測量過程的情況。分析這些信息,進行一定的思考,提出一些觀點和建議,供領導決策時參考,以此作為制訂工作策略的依據,為學校老師和學生提供一定的指導。所以說,試卷分析是一件很重要的工作。
1 貝葉斯網絡與因果推理
貝葉斯網絡又稱為置信網絡,是基于概率分析、圖論的一種不確定性知識的表達和推理模型。一個典型的貝葉斯網絡由兩部分組成:①有向無環的圖,其中每一個節點代表一個變量、屬性、狀態或其他的實體,節點之間的弧反映了變量間的依賴關系,指向節點X的所有節點被稱為X的父節點。②與每個節點相聯系的條件概率表列出了此節點相對于其父節點所有可能的條件概率。貝葉斯網絡約定以節點Vi的父節點為條件,Vi與任意非Vi子節點條件獨立。
2 利用BNT軟件包分析試卷
在此次的試卷分析試驗中,以過去學生的期末考試成績為依托,隨機抽取了一部分學生的考試信息作為此次試驗的原始數據。利用軟件篩選、整理這些數據,然后通過基于MATLAB語言開發的關于貝葉斯網絡學習的BNT軟件包建模,主要完成建立貝葉斯網絡的工作,以此來反映選定因素對試卷成績的影響。影響試卷成績的因素主要有:A——作業提交率、B——上課出勤率、C——否是留級生、D——主觀題得分率和E——客觀題得分率。
2.1 為試卷分析篩選數據
第一步:把影響試卷的因素作為變量,即貝葉斯網絡模型中的節點,得到的候選數據集如表1所示。其中,R(is pass)標記為該樣本的狀態值,“1”表示成績及格,“0”表示成績不及格。
表1 變量與狀態的關系
A B C D E R
0.67 0.85 0 0.78 0.56 1
0.54 0.66 1 0.54 0.39 0
0.89 0.96 0 0.85 0.78 1
… … … … … …
第二步:由于貝葉斯網絡是用離散型變量,因此,對原始數據進行處理,數據離散處理結果如表2所示。
例如離散處理“上課出勤率”這一變量。根據教學經驗,一般同學的出勤率都在90%以上,如果低于70%,學習成績很
———————————————————————————
可能不理想,所以,將變量B分為3段——小于70%為low,70%~90%為mid,大于90%為high。
表2 對表1數據的離散處理結果
A B C D E R
high mid no high mid yes
mid low yes mid mid no
high high no high high yes
… … … … … …
第三步:數據格式轉換。
根據MATLAB的特點,將數據集轉換為矩陣的形式,而且所有屬性的取值全部依次編號為1,2,3.
表2對應的矩陣為: .
以由此得到的樣本數據集作為模型數據集來構造模型。
2.2 貝葉斯網絡的建模
接下來的工作就是以得到的數據建立貝葉斯網絡,然后對得到的貝葉斯網絡進行參數學習。從得到的貝葉斯網絡和學習得到的參數中可以看出選定的因素對試卷的影響。
經過實踐,筆者得到的結果是:“上課出勤率”和“作業提交率”是影響其他因素的原因,而“上課出勤率”又可以影響到“作業提交”,這是與限制了父節點個數的結果相同的部分,不同的是:①“是否是留級生”又影響了“客觀題得分率”和“主觀題得分率”兩項。如果出現這樣的結果,不難看出,留級生在考試分數上和正班生還是有一定差距的。②“主觀題得分率”影響了“是否及格”這一項。出現這種結果是因為在統計數據時,主觀題分值占了60%.
從以上試驗結果的數據中可以看出,作業提交率和上課出勤率對其他三個因素的影響。
3 結論
對試驗結果分析后發現,得到的結果基本符合實際情況。學生的“上課出勤率”和“作業提交率”是影響其學習成績的重要因素。由此可見,知識是平時一點一滴積累起來的,即便是在大學校園,在日常教學過程中,也應加強對學生的紀律管理,督促學生按部就班地學習。
參考文獻
[1]沈海峰.基于貝葉斯網絡數據挖掘技術理論計算法的研究[D].安徽:合肥工業大學,2005.
〔編輯:白潔〕
Paper based on Bayesian Network Analysis
Wang Na
Abstract: This paper introduces the papers based on Bayesian network analysis test; the test is based on the main tools used MATLAB language BNT package. Through experimental research, analyzes the impact of the five aspects of the usual attendance, job submission rate on student achievement.
Key words: paper analysis; Bayesian networks; probabilistic inference; BNT Kit
摘 要:簡要介紹了基于貝葉斯網絡的試卷分析試驗,試驗主要用到的工具是基于MATLAB語言編寫的BNT軟件包。通過試驗研究,分析了平時的出勤率、作業提交率等五方面內容對學生成績的影響。
關鍵詞:試卷分析;貝葉斯網絡;概率推理;BNT工具包
中圖分類號:TP183 文獻標識碼:A 文章編號:2095-6835(2014)21-0137-02
考試是教學過程中不可缺少的組成部分,是對教和學的質量檢驗。考試結果可以反饋出大量的信息——反映出整個教學過程的得失,反映出各個教學環節的情況,反映出學生的能力,反映出學生的學習特點和規律。針對以上幾方面,在命題時要有多方面的設計。考試結果可以反映命題和考試本身的情況,也就是測量工具、測量方法和測量過程的情況。分析這些信息,進行一定的思考,提出一些觀點和建議,供領導決策時參考,以此作為制訂工作策略的依據,為學校老師和學生提供一定的指導。所以說,試卷分析是一件很重要的工作。
1 貝葉斯網絡與因果推理
貝葉斯網絡又稱為置信網絡,是基于概率分析、圖論的一種不確定性知識的表達和推理模型。一個典型的貝葉斯網絡由兩部分組成:①有向無環的圖,其中每一個節點代表一個變量、屬性、狀態或其他的實體,節點之間的弧反映了變量間的依賴關系,指向節點X的所有節點被稱為X的父節點。②與每個節點相聯系的條件概率表列出了此節點相對于其父節點所有可能的條件概率。貝葉斯網絡約定以節點Vi的父節點為條件,Vi與任意非Vi子節點條件獨立。
2 利用BNT軟件包分析試卷
在此次的試卷分析試驗中,以過去學生的期末考試成績為依托,隨機抽取了一部分學生的考試信息作為此次試驗的原始數據。利用軟件篩選、整理這些數據,然后通過基于MATLAB語言開發的關于貝葉斯網絡學習的BNT軟件包建模,主要完成建立貝葉斯網絡的工作,以此來反映選定因素對試卷成績的影響。影響試卷成績的因素主要有:A——作業提交率、B——上課出勤率、C——否是留級生、D——主觀題得分率和E——客觀題得分率。
2.1 為試卷分析篩選數據
第一步:把影響試卷的因素作為變量,即貝葉斯網絡模型中的節點,得到的候選數據集如表1所示。其中,R(is pass)標記為該樣本的狀態值,“1”表示成績及格,“0”表示成績不及格。
表1 變量與狀態的關系
A B C D E R
0.67 0.85 0 0.78 0.56 1
0.54 0.66 1 0.54 0.39 0
0.89 0.96 0 0.85 0.78 1
… … … … … …
第二步:由于貝葉斯網絡是用離散型變量,因此,對原始數據進行處理,數據離散處理結果如表2所示。
例如離散處理“上課出勤率”這一變量。根據教學經驗,一般同學的出勤率都在90%以上,如果低于70%,學習成績很
———————————————————————————
可能不理想,所以,將變量B分為3段——小于70%為low,70%~90%為mid,大于90%為high。
表2 對表1數據的離散處理結果
A B C D E R
high mid no high mid yes
mid low yes mid mid no
high high no high high yes
… … … … … …
第三步:數據格式轉換。
根據MATLAB的特點,將數據集轉換為矩陣的形式,而且所有屬性的取值全部依次編號為1,2,3.
表2對應的矩陣為: .
以由此得到的樣本數據集作為模型數據集來構造模型。
2.2 貝葉斯網絡的建模
接下來的工作就是以得到的數據建立貝葉斯網絡,然后對得到的貝葉斯網絡進行參數學習。從得到的貝葉斯網絡和學習得到的參數中可以看出選定的因素對試卷的影響。
經過實踐,筆者得到的結果是:“上課出勤率”和“作業提交率”是影響其他因素的原因,而“上課出勤率”又可以影響到“作業提交”,這是與限制了父節點個數的結果相同的部分,不同的是:①“是否是留級生”又影響了“客觀題得分率”和“主觀題得分率”兩項。如果出現這樣的結果,不難看出,留級生在考試分數上和正班生還是有一定差距的。②“主觀題得分率”影響了“是否及格”這一項。出現這種結果是因為在統計數據時,主觀題分值占了60%.
從以上試驗結果的數據中可以看出,作業提交率和上課出勤率對其他三個因素的影響。
3 結論
對試驗結果分析后發現,得到的結果基本符合實際情況。學生的“上課出勤率”和“作業提交率”是影響其學習成績的重要因素。由此可見,知識是平時一點一滴積累起來的,即便是在大學校園,在日常教學過程中,也應加強對學生的紀律管理,督促學生按部就班地學習。
參考文獻
[1]沈海峰.基于貝葉斯網絡數據挖掘技術理論計算法的研究[D].安徽:合肥工業大學,2005.
〔編輯:白潔〕
Paper based on Bayesian Network Analysis
Wang Na
Abstract: This paper introduces the papers based on Bayesian network analysis test; the test is based on the main tools used MATLAB language BNT package. Through experimental research, analyzes the impact of the five aspects of the usual attendance, job submission rate on student achievement.
Key words: paper analysis; Bayesian networks; probabilistic inference; BNT Kit