999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多特征相似度計算在考試評閱系統中的應用探索

2019-11-03 13:11:42穆煒煒劉其琛
電腦知識與技術 2019年24期
關鍵詞:文本

穆煒煒 劉其琛

摘要:在信息化考試的主觀題自動評閱中,文本相似度計算是一個較為復雜的系統,包括詞語、句子相似度計算等。其中,詞語是構成語言體系的基本單位,計算其相似度往往是計算句子相似度的基礎,而句子相似度計算則是文本相似度計算的前提。只有通過詞語、句子等多特征的相似度計算,才能得出文本的相似度。

關鍵詞:多特征;文本;相似度;計算

中圖分類號:TP391.6? ? ?文獻標識碼:A

文章編號:1009-3044(2019)24-0080-02

開放科學(資源服務)標識碼(OSID):

1 背景

隨著信息技術的不斷發展和互聯網進入日常教育教學,“互聯網+教學”已經成為教育現代化進程中的重要改革方式,智慧課堂、智慧教學、智能化考試的理念日趨發展成為實踐,越來越多的教師和學生通過信息網絡完成日常的教學,這種打破傳統的學習方式,使得學習不再拘束于時間與空間,實現了人人、處處、時時地泛在學習,更加強了教師之間、師生之間和學生之間的交流溝通,實現了優質資源的共享與應用。特別是信息化教學中考試系統的應用,為教師和學生的教學評價帶來全新的改變。但考試系統的普遍應用還有待改進,尤其是主觀題的自動評閱難以達到人工評閱的準確度,本文采用文本語句相似度、詞語相似度和語義相似度等多個特征相似度計算的方式創新自動評閱算法,達到科學、準確評閱的目的,提升考試系統的公平公正性。

2 多特征相似度計算概念

在現在的各類考試系統中,針對選擇題、判斷題和填空題等客觀題的自動評閱技術已經非常成熟,計算機根據固定的答案驗證其匹配度即可判斷是否正確。但主觀題自動評閱一直難以廣泛應用,其主要原因是漢語言表達的多樣性和復雜性導致系統很難準確把握答案的正確性,特別是對中文的處理技術等一些關鍵的核心技術還在研發試驗階段,如,自然語言的理解、模式識別、人工智能等一些技術還未完全成熟。計算機要實現對主觀題的自動評閱,首先要把自然語言處理成機器能理解的形式,然后進行答案的相似度比較計算,才能進行科學評閱。傳統的人工評閱主觀題時,教師是根據評分細則將學生的答案表述進行理解,再查看學生答案和標準答案的相似程度進行打分,包括同義詞匯及同義語句的關鍵詞匯判別等,再分為不同的分數檔次,進行打分和統計。根據人工閱卷規律,本文采用詞語語義相似度、句子語義相似度和句長相似度[1]等相結合的多特征方式對主觀題文本進行相似度計算。

詞語的語義相似度是指兩個詞語或多個詞語在不一樣的語言表述中可以相互替換而使其核心要義不發生變化,類似于近義詞。目前,詞語語義相似度計算主要有基于統計和基于規則的兩種方法[2],其中,基于統計的方法主要是對大量的詞語庫進行統計分析,并將詞語在上下文中的概率分布作為相似度的計算參考依據;而基于規則的方法主要是采用詞語結構中層次關系組織的語義詞典,如,同義詞詞林、知網[3]、概念圖等概念間的同位關系及上下位關系計算語義相似度。

句子語義相似度計算主要有基于語法分析和不基于語法分析兩種分析計算方法。基于語法分析的相似度計算方法,國內外均有應用,如楊思春等[4]提出根據句子的語法句型模式來判斷相似度等,但由于漢語言表達的多樣性和不規則性,特別是不同的專業有其固定的術語或表達方式,采用不基于語法分析的句子語義相似度計算方法有利于降低系統計算復雜性,提高適應性。

句長相似度主要是指兩個句子在形態上的相似情況,即兩個句子詞語個數的多少,根據相似度比較,兩個句子的長度越接近,兩個語句就越相似。

3 多特征相似度計算原理

3.1 詞語語義相似度計算

本文采用基于同義詞詞林的詞語相似度計算方法,同義詞詞林不僅比較詞語的詞義相似性還涉及詞語的相關聯程度,如“上班”與“勞動”詞義相似度較低,但是卻有很強的相關性。《同義詞詞林》是梅家駒等人于1983年編纂而成的。目前,在改進的《哈工大同義詞詞林擴展版》中分為5層樹狀結構,隨著層次級別的增加,詞義越來越細分,在第五層,每個分類中詞語只有一個并已不可再細分,即稱為原子詞群或原子節點。如圖1所示:

根據上圖形成了8位的5層詞義編碼體系如表1所示[5]。

表中的編碼位是按照從左到右的順序排列。第八位的標記有3 種,“=”表示“相等”或“同義”,“#”表示“不相等”或是“同類”是相關詞語,“@”代表示“獨立”,既沒有同義詞,也沒有相關詞。由上圖可看出,不同層級的分類結果可以提供不同的語言處理服務,進一步改善和加強信息檢索、文本分類等方面的性能。

3.2 句子語義相似度計算

句子相似度指兩個有待比較的句子在語義上的匹配程度,如,設定值為a=[0,1]之間的實數,值越小說明兩個句子的相似度越小,當a=0時,說明兩個句子意義無關聯;值越大說明相似度越高,當a=1時,說明兩個句子意義相同。由于漢語言表達方式的多樣性和靈活性,本文通過矩陣計算詞語相似度,首先計算出相關詞語的相似度,并以此為數據構建句子相似度矩陣,然后通過相應算法計算出句子相似度。假設有兩個句子A和B,A={A1,A2,…Am} B={B1,B2,…Bn} Ai是組成A的詞,Bj是組成B的詞,1≤i≤m, 1≤j≤n。則詞Ai詞的相似度表示為S(Ai,Bj) ;句子A和B的相似度為表示為SIM(A,B)。

[? SIM A,B=i=1maim+j=1nbjn2]

[ai=maxsAi,B1,sAi,B2...sAi,Bn,][bj=maxsBj,A1,sBj,A2...sBj,Am,]

3.3 句長相似度計算

句長的相似度可以表示兩個句子在形態上的相似情況,設有兩個句子分別為X和Y,句子X中有len(X)個詞語、句子Y中有len(Y)個詞語,則句子X和Y的相似度為表示為Lensim(X,Y),計算如下所示:

[LensimX,Y=1-lenX-len(Y)lenX+len(Y)]

從而得出了兩個句長X和Y的相似度。

4 多特征相似度計算在考試系統自動評閱中的應用

由于中文主觀題答案的表示往往是由字構成詞、詞形成句。要判斷已做答案和標準答案兩段文本的相似度,可以將其逐級分成子項,如分句、分詞、詞語相似度及句子相似度等多特征進行計算,并引用決策樹分類器,將關鍵詞的相似度、句子的相似度及句長相似度作為決策樹的文本屬性,通過決策樹分類器進行分類計算,從而實現自動評閱。

例如:一個試題為10分,可生成如下決策樹。其中SIMi是決策樹屬性。枝節點為各個屬性的值,葉子節點是對應的答案分值。如圖2所示

主觀題自動評閱主要是基于人工智能和大數據分析的自然語言處理技術。雖然漢語言識別與處理具有很大的難度,但是從人工智能及大數據等技術的發展趨勢來看,實現考試系統中的主觀題自動評閱是智慧教育的必然。一方面,計算機自動評閱能避免在高強度、高密度的閱卷工作中造成的人為誤差和紕漏,能夠更客觀地反映出考試結果,保證了閱卷的客觀公正性。另一方面,計算機自動評閱提高了工作效率,并能對學生的得分點和失分點進行大數據分析,對教學成效進行科學診斷,有利于教學工作的不斷改進。

參考文獻:

[1] 呂學強, 任飛亮. 句子相似模型和最相似句子查找方法[J]. 東北大學學報: 自然科學版, 2003, 24(6): 531-534.

[2] 于江生, 俞士汶. 中文概念詞典的結構[J]. 中文信息學報, 2002, 16(4): 13-21.

[3] 張承立, 陳劍波, 齊開悅. 基于語義網的語義相似度算法改進[J]. 計算機工程與應用, 2006, 42(17): 165-179.

[4] 楊思春. 一種改進的句子相似度計算模型[J]. 電子科技大學學報, 2006(35): 956-959.

[5] 鄭家恒. 中文分詞中歧義切分處理策略[J]. 山西大學學報: 自然科學版, 2007(2).

【通聯編輯:謝媛媛】

猜你喜歡
文本
文本聯讀學概括 細致觀察促寫作
重點:論述類文本閱讀
重點:實用類文本閱讀
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
作為“文本鏈”的元電影
藝術評論(2020年3期)2020-02-06 06:29:22
在808DA上文本顯示的改善
“文化傳承與理解”離不開對具體文本的解讀與把握
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
從背景出發還是從文本出發
語文知識(2015年11期)2015-02-28 22:01:59
主站蜘蛛池模板: 88av在线| 日韩欧美中文在线| 亚洲国产精品人久久电影| 午夜啪啪福利| 欧美日韩一区二区三| 国产成人无码久久久久毛片| 波多野结衣一区二区三区AV| 精品自窥自偷在线看| 综合久久五月天| 久久综合婷婷| 91成人精品视频| 日韩一区二区在线电影| 国产精品19p| 亚洲中文字幕在线精品一区| 亚洲系列无码专区偷窥无码| 国产精品久久精品| 欧美日韩导航| 无码 在线 在线| 美女潮喷出白浆在线观看视频| 国产精品久久久久久久久kt| 精品国产欧美精品v| 日韩在线影院| 精品视频免费在线| 香蕉伊思人视频| 伊人天堂网| 免费无遮挡AV| 色婷婷电影网| 中文字幕乱码二三区免费| 日韩无码黄色| 久久成人免费| 四虎永久免费地址在线网站| 国产精品30p| 亚洲人视频在线观看| 亚洲国产日韩欧美在线| 久久a毛片| 不卡无码h在线观看| 中文字幕 日韩 欧美| 婷婷丁香色| 国产免费看久久久| 成人精品区| 欧美日韩理论| 国产成人综合日韩精品无码不卡| 91精品国产一区| 欧美a在线看| 2018日日摸夜夜添狠狠躁| 天天摸夜夜操| 国产在线观看成人91 | 日本一区二区不卡视频| 国产精品太粉嫩高中在线观看| 丁香五月亚洲综合在线| 亚洲人成色在线观看| 广东一级毛片| 亚洲香蕉伊综合在人在线| 国产精品免费电影| 精品久久综合1区2区3区激情| 久久久精品国产SM调教网站| 国产精品亚洲片在线va| 国产成人狂喷潮在线观看2345| 91亚洲免费视频| 亚洲美女操| 国内视频精品| 久久精品这里只有国产中文精品| 国产欧美另类| 成人国产精品视频频| 99视频在线观看免费| 国产一区二区人大臿蕉香蕉| 一级毛片中文字幕| 97视频免费在线观看| 日韩久草视频| 91麻豆国产视频| 美女无遮挡拍拍拍免费视频| 欧洲精品视频在线观看| 午夜不卡视频| 国产亚洲视频中文字幕视频| 91外围女在线观看| 色悠久久久| 亚洲日韩高清无码| 久久99热这里只有精品免费看| 亚洲天堂精品视频| 婷婷色在线视频| 无遮挡国产高潮视频免费观看| 亚洲天堂久久久|