999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于孿生神經(jīng)網(wǎng)絡(luò)的主觀題自動閱卷評分技術(shù)

2020-03-27 11:12:50張帥
現(xiàn)代計算機 2020年5期
關(guān)鍵詞:文本模型學(xué)生

張帥

(廣州工商學(xué)院計算機科學(xué)與工程系,佛山528138)

0 引言

智能閱卷是指通過計算機對學(xué)生作答的試題答案進行自動閱卷。智能閱卷能大大減輕老師人工閱卷的工作量,在一定程度上提高了評卷的公平性。當前國內(nèi)的信息化考試系統(tǒng)只能完成客觀題的自動評分,還不能實現(xiàn)主觀題的自動評閱。主觀題的答案是學(xué)生通過自然語言書寫,不存在標準、唯一的答案,人工評閱也是閱卷人參考評分標準,根據(jù)自身經(jīng)驗完成的。主觀題答案中不同種語言、字符、語言模式差異所導(dǎo)致相似度計算中的復(fù)雜性和準確性問題,所以對于主觀題的自動閱卷是一個很大的技術(shù)難題。

主觀題的自動閱卷涉及到自然語言處理技術(shù)。自然語言是指人類特有的語言,例如中文、英文等各種語言,形式包括有文本、語音等。自然語言處理是對自然語言進行理解、分析,將其轉(zhuǎn)換成計算機可理解的、結(jié)構(gòu)化的信息的方法和技術(shù)。

雖然國外在智能閱卷這一方面的研究遠遠早于國內(nèi),但是由于中文與西文在本質(zhì)上的差別,很多在西文上取得的研究成果無法應(yīng)用于中文。漢語是一個復(fù)雜開放的體系,存在大量的近義詞、同義詞以及非標準用語,因此中文主觀題自動評分系統(tǒng)的研究的難道遠遠大于英文文章評分系統(tǒng)。國內(nèi)學(xué)者專家也投入了大量的精力,并在基礎(chǔ)理論方面取得了一些突破,但距離自動評分系統(tǒng)的大規(guī)模推廣還有很長的一段距離[1-2]。

1 現(xiàn)有技術(shù)存在的問題

主觀題評分模型最主要的問題是如何計算標準答案和考生答案的相似度。通過字數(shù)相似度、詞數(shù)相似度這些指標來評價兩個文本間的相似度。這種基于句子表面特征的相似度計算方法僅考慮在字符串層面的相似度計算,因此準確度相當?shù)蚚3]。

國內(nèi)有針對作文自動評分的研究,通過分析文本連貫性評價作文。但是不同于長文本的作文,問答題的文本是短文本,增加語篇連貫性的指標并不能有效地提升準確度[4]。

2 基于孿生神經(jīng)網(wǎng)絡(luò)的主觀題自動閱卷評分技術(shù)

我們首先對文本進行預(yù)處理,分詞、去除標點、去除空白字符、去除停用詞等。然后提取幾個詞法特征,如錯別字數(shù)量、字數(shù)總和、去除停用詞和重復(fù)詞之后的字數(shù)。

為了解決主觀題自動閱卷評分精確度不高的問題,我們在以上詞法特征的基礎(chǔ)上加入了孿生神經(jīng)網(wǎng)絡(luò)模型,判斷學(xué)生答案和參考答案的相似度從而對學(xué)生答案作出評分。

孿生神經(jīng)網(wǎng)絡(luò)是一種人工神經(jīng)網(wǎng)絡(luò),也就是一種數(shù)學(xué)模型。與其他神經(jīng)網(wǎng)絡(luò)模型相比,它的特別之處在于同時輸入兩個子網(wǎng)絡(luò),并且這兩個子網(wǎng)絡(luò)共享權(quán)重。孿生神經(jīng)網(wǎng)絡(luò)的特點使得它在衡量相似度這方面有很好的效果。

孿生神經(jīng)網(wǎng)絡(luò)應(yīng)用在主觀題閱卷,是將題目的參考答案和學(xué)生答案同時輸入孿生神經(jīng)網(wǎng)絡(luò)模型里,輸出的是兩者之間的距離。我們用這個距離來衡量兩者的相似度。要計算二者的距離,也就是說從A 到B 應(yīng)該和從B 到A 的距離是一樣的,共享權(quán)重可以控制距離的一致性。即使我們調(diào)換A 和B,距離不會發(fā)生改變。

上述的孿生神經(jīng)網(wǎng)絡(luò)是一個模型框架,在同時輸入?yún)⒖即鸢负蛯W(xué)生答案后,兩個子網(wǎng)絡(luò)還分別需要用LSTM 模型對數(shù)據(jù)進行訓(xùn)練。LSTM,Long Short-Term Memory,長短期記憶神經(jīng)網(wǎng)絡(luò)是一種循環(huán)神經(jīng)網(wǎng)絡(luò),適合于處理和預(yù)測時間序列中間隔和延遲非常長的事件。我們可以把文本看作一個時間序列,例如句子“我吃蘋果”,時間0 對應(yīng)“我”,時間1 對應(yīng)“吃”,時間2 對應(yīng)“蘋”,時間3 對應(yīng)“果”。也就是說LSTM 可以解決相隔較遠的兩句話還存在著聯(lián)系這種情況。

在兩個子網(wǎng)絡(luò)用LSTM 模型訓(xùn)練后,需要計算二者的距離,這時我們用曼哈頓距離(Manhattan Dis?tance)來度量。曼哈頓距離,是歐幾里得幾何度量空間的幾何學(xué)用語,用以標明兩個點上在標準坐標系上的絕對軸距之總和。

如圖1 所示,d1 線、d2 線和d4 線都表示的是曼哈頓距離。而采用曼哈頓距離計算兩個LSTM 子網(wǎng)絡(luò)距離的模型,我們簡稱為MaLSTM。

圖2 展示的就是基于MaLSTM 的孿生神經(jīng)網(wǎng)絡(luò)模型的算法過程。我們輸入兩句話“他很帥”和“他很英俊”,分別對這兩句話訓(xùn)練兩個子網(wǎng)絡(luò)LSTMa 和LST?Mb,然后通過曼哈頓距離衡量二者的相似度。

最后我們在詞法特征的基礎(chǔ)上結(jié)合答案的相似度,算出學(xué)生答案的得分。

圖1

圖2

3 結(jié)語

應(yīng)用孿生神經(jīng)網(wǎng)絡(luò)模型,同時輸入學(xué)生答案和參考答案進行相似度計算,從而估計學(xué)生答案的得分,改善了單單基于句子表面特征的相似度計算方法,提高了準確度。

猜你喜歡
文本模型學(xué)生
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
趕不走的學(xué)生
學(xué)生寫話
3D打印中的模型分割與打包
學(xué)生寫的話
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
主站蜘蛛池模板: 国产91特黄特色A级毛片| 日韩中文无码av超清| 国产精品亚洲片在线va| 国产成人精品亚洲77美色| 强奷白丝美女在线观看| 日本免费一区视频| 国产无吗一区二区三区在线欢| 欧美一区二区啪啪| 亚洲人成网址| 国产视频欧美| 在线观看免费AV网| 久久久久亚洲AV成人人电影软件| 亚洲毛片一级带毛片基地| 亚洲欧美日韩中文字幕在线| 国产凹凸一区在线观看视频| 国产免费久久精品99re丫丫一| 亚洲免费福利视频| 日韩一级毛一欧美一国产| 色综合婷婷| 亚欧成人无码AV在线播放| 欧美天堂久久| 国产成人综合久久精品尤物| 试看120秒男女啪啪免费| 亚洲狼网站狼狼鲁亚洲下载| 99久久精品美女高潮喷水| 99热这里只有免费国产精品| 精品久久久久无码| 色综合五月| 996免费视频国产在线播放| 色欲色欲久久综合网| 无码AV日韩一二三区| 国产h视频在线观看视频| 免费在线不卡视频| 日韩欧美视频第一区在线观看| 国产美女视频黄a视频全免费网站| 久久亚洲国产最新网站| 亚洲国产欧美目韩成人综合| 日韩二区三区无| 色爽网免费视频| 亚洲人成日本在线观看| 亚洲天堂2014| 欧美 亚洲 日韩 国产| 99国产精品国产高清一区二区| 亚洲不卡影院| 成人免费一区二区三区| 无码一区二区三区视频在线播放| 香蕉久人久人青草青草| 日韩大乳视频中文字幕| 狂欢视频在线观看不卡| 亚洲精品中文字幕午夜| 国产精女同一区二区三区久| 国产高清在线精品一区二区三区| 91精品日韩人妻无码久久| 中文字幕亚洲精品2页| 8090成人午夜精品| av在线5g无码天天| 久久久受www免费人成| 国产精品专区第一页在线观看| 91外围女在线观看| 国产视频久久久久| 久久国产精品波多野结衣| 久久久久亚洲精品成人网 | 免费国产不卡午夜福在线观看| 精品一區二區久久久久久久網站| 国产欧美精品一区aⅴ影院| 欧美一区二区福利视频| 久久久精品国产SM调教网站| 欧美一级高清片欧美国产欧美| 久久semm亚洲国产| 日韩欧美中文在线| 日韩欧美国产精品| 99一级毛片| 国产福利一区视频| 激情视频综合网| 国产国语一级毛片在线视频| 亚洲综合色在线| 91视频精品| 国产成人AV综合久久| 国产成人亚洲精品无码电影| 自慰高潮喷白浆在线观看| 97超级碰碰碰碰精品| 一区二区午夜|