999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

藏文試題知識點抽取方法

2019-02-13 01:36:06德格加安見才讓
計算機時代 2019年1期

德格加 安見才讓

摘? 要: 在教育教學信息化的進程中,試題管理系統和組卷系統一直是人們致力研究的一個領域,對教育教學的自動化、高效化和精準化具有重要的現實意義。由于試題知識點的不確定性、多樣性和隱蔽性等特點,利用計算機技術自動抽取試題知識一直是該領域的難題之一。文章以藏文版試題為研究對象,通過深入研究試題的結構特點,探索研究了抽取藏文試題知識點的方法,力求提高試題管理和存儲的自動化,提升組卷系統的性能和效率。

關鍵詞: 組卷系統; 藏文試題; 知識點; 自動抽取

中圖分類號:TP391.1? ? ? ? ? 文獻標志碼:A? ? ?文章編號:1006-8228(2019)01-79-04

Abstract: In the process of education and teaching informationization, the test management system and the test paper generating system have always been one of the areas that people are committed to research, and have important practical significance for the automation, efficiency and precision of education and teaching. Due to the uncertainty, diversity and concealment of the knowledge point of test questions, the use of computer technology to automatically extract knowledge point of test questions has always been one of the problems in this field. This paper takes the Tibetan version of test questions as the research object, through in-depth study of the structural characteristics of test questions, explores how to extract the knowledge points of Tibetan test questions, and strives to improve the automation management and storage of test questions and improve the performance and efficiency of the test paper generating system.

Key words: test paper generating system; Tibetan test questions; knowledge points; automatic extraction

0 引言

計算機技術迅速發展,計算機輔助教學軟件相繼開發,作為教學輔助系統中的重要組成部分,試題管理系統和組卷系統是人們研究的重要領域之一,在日常教學活動中發揮著積極的作用[1]。國內外對試題管理系統中的組卷算法研究比較多,也提出了一些行之有效的組卷算法,但在試題的知識點抽取方面的研究與實現仍處于空白狀態。知識點自動抽取是組卷系統和試題管理系統的智能化和自動化的重要體現,所以,研究抽取試題知識點的方法對提升整個系統的效率具有重要的現實意義。

理工科類試題的出題形式是各式各樣的,有純文字敘述的,有圖形的,有表格的,也有多種形式混合的。文字敘述形式的試題以數學式子和符號類居多,而且數學式子和符號是用專門的軟件編輯的[2],這對利用計算機處理該類試題增加了很大難度。本文主要針對含有文字敘述性的試題進行研究,探討試題知識點的抽取方法。

知識點是通過對題目多方面深入理解的基礎上才能提取確定的。對于藏文試題,試題的知識點往往表現在題目的中的某個關鍵字上或者算式中,因此,要確定題目的知識點,首先對藏文試題進行相關的預處理,提取題目中與知識點相關的關鍵詞,最后通過對關鍵詞的分析和判斷才能確定其知識點。

1 藏文試題知識點抽取方法

1.1 建立知識點網絡

利用計算機技術自動抽取試題知識點,首先要建立一個健全的知識點網絡,根據某課程的知識點分布結構,設計合理的知識點網絡庫,知識點網絡成樹狀結構。比如建立一個人教版初中數學知識點庫,首先根據初中數學知識點的分布和編排結構,知識點編排方式有橫向上的同級知識點和縱向上的層級知識點,因此,初中數學知識點可以用含有n階層級的樹狀形式來表示,如圖1所示。

根據人教版初中數學教材大綱中的知識點的編排順序和原則,綜合考慮計算機中易于編程實現,將知識點樹狀網絡結構簡化成縱向深度限定為3級;如圖2所示。

根據知識點網絡的結構,合理設計知識點網絡庫,將各層級的知識點按結構和層級關系有序存入庫中。

1.2 藏文知識點抽取方法

要從一道藏文題目中抽取其知識點,首先對藏文題目進行預處理,包括提取題目中的文字性描述和對文字性描述進行分詞,然后提取文字性描述中的數學關鍵字,最后對關鍵字結合知識點庫計算其權值確定題目中的主要知識點。

⑴ 預處理:藏文題目中除了文字性描述之外,還包含數學中的各種符號、字母和圖片等信息,在預處理階段應把這些非文字性元素剔除,提取其藏文描述部分以便進一步對其進行處理;

⑵ 分詞:分詞是文字處理中最基礎也是最關鍵的一步,本文所采用的分詞方法是基于字典的機械分詞方法[3],與一般藏文分詞方法的不同之處在于,所使用的字典需要擴充或使用專用的分詞字典。因為一般的藏文詞典中還未加入數學等現代理工科中的專業數學和詞條,如“”等詞條。本文中進行擴充原有藏文字典,在原字典中增加中學數學中的專用術語和名詞等詞條,這樣能夠保證在分詞過程中能夠準確的切分出題目中的數學關鍵字,例如初中藏文試題:

⑶ 剔除噪音:所謂噪音是指對處理和研究主體無實際意義,甚至對研究起負面影響的元素,在提取試題知識點的問題中除了要剔除題目中的無實際意義的連詞和停用詞等虛詞外,還有數學試題中通用的一些動詞和指示詞也可剔除[4],所以要根據藏文試題的特點,建立一個比較齊全的專用停用詞詞表,部分停用詞如表1所示。

根據表1剔除題目中的停用詞后,只保留試題題干中的關鍵詞,如例題⑴中,最后所保留的關鍵詞為<E:\方正創藝5.1\Fit201812\圖\dgj藏文5.tif>。

⑷ 確定知識點:經過預處理和分詞后,需要剔除其中的停用詞和虛詞等無實際意義的詞,經過這樣的處理后用切分出的詞中只有數學術語和關鍵詞名詞等主要信息,最后用這些關鍵詞去查詢知識點網絡庫中,確定其中的知識點及級別,并賦予相應的知識點權值[5]。如上面的例題中,提取出的關鍵詞為。

一般將提取出的關鍵詞用集合S={v1,v2,…,vn}來表示,用S中的元素vi(1?i?n)查詢知識點網絡庫,根據查詢匹配情況確定題目屬于哪一類知識點。

2 藏文試題知識點提取算法策略

2.1 知識點數據庫設計

根據以上對知識點庫的結構分析,三個層級的知識點用三個相互關聯的數據表存儲,并各表之間創建合適的主外鍵關系,知識點庫E-R圖設計為如圖3所示。

2.2 知識點提取策略

根據知識點數據庫的結構,在算法設計中將知識點庫可以表示為三個集合;

集合S={K1,K2,K3}表示整個知識點網絡庫,則有:

其中知識點ki為kij的上一級知識點,kij為kijz的上一級知識點,這樣能保證各級知識點之間的從屬關系。

具體算法步驟如下:

Step 1:輸入藏文試題;進行預處理,凈化等;

Step 2:對凈化后題目內容進行分詞,剔除停用詞和虛詞等無實際意義的詞,得到題目中的關鍵數學術語和名詞,用S={v1,v2,…,vn}表示;

Step 3:用S中的每個元素vi依次查詢表Ki(1?i?3),若vw在Ki中的知識點k匹配成功,則知識點k對于關鍵字vw的權值設為r=i,否則在下一級知識點表Ki+1中查詢匹配,并賦予相應的權值r=i+1(r?3);

Step 4:對匹配成功的所有知識按其權值進行排序,選擇其中權值最大的作為該題的知識點。

根據以上步驟確定試題的知識點,算法中的權值代表的是知識點的層級,本文中知識點的層級最大有三級,層級越大,對應的知識點越具體細致,所以選擇權值最大的知識點作為試題的知識點。

3 總結

本文主要探究了藏文試題的知識點確定方法,對藏文試題的呈現方式進行了全面分析。由于試題的呈現方式各種各樣,以文、圖、數學符號和圖文混合等形式,本文討論的試題只限有文字描述或圖文并茂的試題,其主要知識點依賴于對文字描述部分的深入分析確定的,但組卷系統等試題管理系統中對試題知識點等屬性的設置方面要求較高[6],需要比較準確的設置試題各屬性才可以保證整個系統的性能,所以在提取的準確性和適用性方面都存在一定的優化和提升空間。

參考文獻(References):

[1] 蓋洋僑.智能組卷系統設計與實現[D].大連理工大學,2016.

[2] 才項俄日,張有宜.藏語文試卷的智能生成研究與實現[J].電腦與信息,2015.6.

[3] 劉穎.計算語言學[M].清華大學出版社,2014.

[4] 劉懷蘭.基于改進遺傳算法的智能組卷模型優化[J].華中科技大學學報,2013.5.

[5] 王淑佩.基于改進自適應遺傳算法的組卷研究[J].科學技術與工程,2012.2.

[6] 王慧敏.利用文本相似度改進遺傳算法的組卷實現與研究[J].現代電子技術,2016.5.

主站蜘蛛池模板: 四虎国产成人免费观看| 国产精品久久久久久久伊一| 久久婷婷六月| 日韩黄色大片免费看| 亚洲毛片网站| 无码有码中文字幕| 99热亚洲精品6码| 亚洲日本精品一区二区| 国产黑丝一区| 精品一区二区三区中文字幕| 国产精品午夜电影| 欧美在线三级| 2021国产v亚洲v天堂无码| 亚洲永久精品ww47国产| 亚洲中文字幕无码爆乳| 精品久久香蕉国产线看观看gif| 精品久久久久久中文字幕女| 亚洲人免费视频| 久久一级电影| 国产性生交xxxxx免费| 久久国产热| 亚洲成aⅴ人片在线影院八| 国产精品久久自在自线观看| 免费AV在线播放观看18禁强制| 婷婷色丁香综合激情| 国产超碰在线观看| 中文字幕不卡免费高清视频| 亚洲一级毛片免费看| 波多野结衣中文字幕一区| 最新精品久久精品| 亚洲精品欧美日本中文字幕| 国产一区二区网站| 免费在线国产一区二区三区精品| 国产成人精品一区二区三区| 国产91全国探花系列在线播放| 亚洲A∨无码精品午夜在线观看| 国产屁屁影院| 亚洲国产精品VA在线看黑人| 欧美黄网站免费观看| 精品一區二區久久久久久久網站| 1级黄色毛片| a国产精品| 国产成人综合在线视频| www.亚洲天堂| 久久婷婷五月综合色一区二区| 欧美午夜久久| 精品黑人一区二区三区| 女人天堂av免费| 欧美成人A视频| 国产丝袜第一页| 亚洲精品无码抽插日韩| 国产精品成人不卡在线观看 | 久久久久人妻一区精品| 尤物亚洲最大AV无码网站| 国产成人精品一区二区秒拍1o| 亚洲日韩国产精品综合在线观看| 99热在线只有精品| 婷婷激情五月网| 91久久天天躁狠狠躁夜夜| 国产色网站| 天堂在线亚洲| 国产激情无码一区二区三区免费| 中文字幕不卡免费高清视频| 中文无码日韩精品| 六月婷婷精品视频在线观看| 国产中文在线亚洲精品官网| 国产三级精品三级在线观看| 亚洲中文在线看视频一区| 久久99热这里只有精品免费看| av天堂最新版在线| 国产美女视频黄a视频全免费网站| 国产H片无码不卡在线视频| 91精选国产大片| 国产在线日本| 在线看AV天堂| 亚洲色图另类| 无码不卡的中文字幕视频| 久久香蕉国产线| 97超级碰碰碰碰精品| 国模在线视频一区二区三区| 亚洲成aⅴ人在线观看| 国产乱子伦手机在线|