999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

論文摘要學術規范自動檢測模型研究初探*

2019-04-20 07:34:52葉繼元
圖書館 2019年4期
關鍵詞:規范評價模型

呂 遠 葉繼元

(1.南京大學信息管理學院 南京 210023;2.南京工業大學圖書館 南京 211816)

引言

改革開放以來,隨著經濟社會的高速發展,在科研學術方面我國也取得了令世人矚目的巨大成就。但與之而來的學術失范、不端現象也是越來越猖獗,論文學術不規范的問題即是其中一個重要表現形式,該問題在高校研究生群體中表現尤為突出。由于研究生群體初涉科研工作,每一篇學術論文的發表都需要經過大量的學術規范方面的評審。目前對論文學術規范方面的評審主要是定性的主觀性評價,這需要耗費大量的時間和人力成本。如何對論文的學術規范水平做一個高效的科學合理的客觀評價,達到提升評審效率,降低評審成本的預期效果。這已經成為當下亟待解決的一個課題。

近幾年關于學術規范和評價研究,國內外的研究成果較為豐富。劉大可從研究生學術規范意識培養的角度進行了研究,界定了學術規范的內涵與作用,并分析了造成學術失范的主要原因,在此基礎上,從發揮師生關系作用的角度,提出高等院校及導師對研究生學術規范意識培養的管理機制[1]。王剛教授對社會科學學術研究規范做了詳細分析,他認為一個科學、全面的社會科學學術研究規范應該包括以下三個方面:哲學上的思辨、科學上的實證、人文上的關懷。哲學上的思辨為社會科學研究提供研究的源泉和動力,科學上的實證為其提供研究的論證工具,而人文上的關懷則為社會科學研究提供價值規范[2]。葉繼元教授對學術規范進行了科學定義,并提出了基本研究規范、研究程序規范、研究方法規范、論著寫作規范、引文規范、署名及著作方式規范、學術批評和評價規范等內容體系。早在10多年前就出版了《學術規范通論》一書。一個學術作品是否規范,可以利用葉教授近些年提出的“全評價”理論框架來評價。所謂 “全評價”理論框架,他認為,簡單地說就是,“六個要素”(六位一體)和“三大維度”?!傲鶄€要素”是指評價主體、評價客體、評價目的、評價標準及指標、評價方法和評價制度,其中評價主體是核心,評價目的是龍頭,制約著其他要素?!叭缶S度”是指任一評價客體都可以從三個維度去考察:形式評價、內容評價和價值、效用評價。形式評價主要是根據評價對象的表象來評價,往往可以定量評價,相對直觀、簡單。內容評價主要深入評價對象的內核,往往依靠同行專家來評價,費時費力。效用評價是指對評價對象的實際貢獻、社會和經濟效益、應用結果、人們思想變化等的評價,它依賴于一段時間或較長時間的評價,是“進行時”或“未完成時”,可以用數字,也可以用文字來表述[3]。

具體針對論文摘要的學術規范,全國文獻工作標準化技術委員會于1986年發布了GB6447—86文摘編寫規則[4],其中規定文摘是以提供文獻內容梗概為目的,不加評論和補充解釋,簡明、確切地記述文獻重要內容的短文;文摘包含四大要素,分別為目的、方法、結果、結論。基于這一國家標準,很多學者對摘要的規范做了相應的研究。比較有代表性的有:高建群針對中文學術論文摘要的寫作規范[5],其將摘要分為研究報告型,綜述型,論證型,發現、發明型,計算型五大類,并分別探討了相應摘要的寫作格式,最終概括了摘要的寫作總要求“忠實于原文、簡潔明了、章法規范”;金丹通過分析《工程索引》(EI)對英文摘要的要求[6],從寫作要求、時態、人稱和語態、常用詞匯等方面,總結了英文摘要寫作的規范。她認為英文摘要的結構可以概括為IMARD(Introduction、Material and Methods、Result and Discussion),包括引言、材料與方法、結果和討論部分。而利用數據挖掘技術對摘要學術規范做自動化監測的相關研究目前尚少。

論文摘要也可以通過計算機自動生成,目前主要有兩種方式:一類是以TextRank算法為代表的抽取關鍵詞句的方式[7];另一類則是借助于深度神經網絡讓計算機自動“造句”,最終生成摘要。由于后者在技術上還有一些關鍵性的難點有待突破,現在應用比較廣泛的是第一種方式。但由于抽取式摘要生成主要是基于詞頻,并沒有過多的語義信息,造成很多相關聯的詞匯都會被獨立對待,以至于無法建立文本段落中完整的語義信息,生成的摘要可閱讀性較差。因此借助于計算機自動生成符合學術規范的摘要信息目前還不成熟。

綜上可以看出,目前學界關于學術規范及其評價研究的理論已經很充實,相關的模型框架也比較完備。但是在定量化的評價研究方面還有待深入。文章根據“全評價”理論框架,主要就其中的形式評價維度,嘗試利用機器學習技術,結合卷積神經網絡,以摘要的文本內容為研究對象(涉及到內容評價的一部分),初步構建了一個自動化智能檢測模型,相較于傳統論文評審方式,不但可以節省大量人力物力,結果亦更具準確性和客觀性。

1 相關工作

卷積神經網絡(Convolution Neural Network,CNN)自20世紀60年代由Hubel和Wiesel首次提出以后[8],由于當時缺乏訓練數據和硬件設備性能不足的原因,一直沒有引起足夠的重視。2010年以后,像ImageNet這樣的大規模標記數據的出現和GPU計算性能的快速提升,使得關于CNN的研究重新得到井噴式的發展。

CNN的應用早期主要在手寫字符分類、圖像分類領域,比較有代表性的CNN結構模型有Krizhevsky 2012年提出的AlexNet[9],該模型在ImageNet圖像分類競賽中以絕對優勢奪冠。隨后不斷有新的CNN模型提出,比如牛津大學的VGG(Visual Geometry Group)、Google的 GoogleNet、微軟的ResNet等,這些研究都使得CNN的性能在圖像識別和分類的應用中不斷得到提升。

圖1 CNN基本結構

近幾年,CNN的應用正逐步向更深層次的人工智能發展,自然語言處理就是其中一個重要領域。較有代表性的,2014年Yoon Kim提出了一個經典的用于文本分類的單層CNN 模型[10]。

圖2 Yoon Kim提出的CNN結構

該結構使用長度不同的過濾器對詞向量進行卷積,過濾器的寬度等于詞向量的長度,然后使用Max-polling池化層對每一個過濾器提取的向量進行操作,最后模型的預測都是基于這些拼接起來的過濾器。較經典的多層CNN模型為Nal Kalchbrenner 2014提出的Dynamic Convolutional Neural Network[11]。相較于前者,該模型更加復雜,多加入了一層用來實現“情感聚類”。

CNN作為一種特殊的神經網絡,在自然語言處理過程中,它的局部關聯特性能夠對輸入文本進行大量的特征提取,從而可以對輸入對象進行精確的模擬;另外由于在卷積層中權重參數都是共享的,這就大大降低了模型的計算復雜度,與 N-Gram相比,運行速度更快??傮w而言,CNN在自然語言處理中的性能表現是不錯的。文章就是同時基于Yoon Kim的單層CNN結構和傳統經典的CNN模型結構,試圖將兩者結合起來,對論文摘要建立學術規范評價模型。

圖3 Nal Kalchbrenner提出的CNN結構

2 以摘要為對象的學術規范評價模型的構建

根據國家有關論文摘要的撰寫規范,摘要通常應具有研究目的、研究方法、研究結果和結論的陳述。摘要撰寫是否規范,專家通過閱讀文本即能判斷。如果要大規模的檢測摘要撰寫的規范程度,利用專家來閱讀和判斷的話,那很費時費力。如果能通過機器自動檢測,則可以大大節省專家閱讀和判斷的時間和精力,且在某個方面可提高檢測精度。

為了對論文摘要數據進行數據挖掘,首先要建立數據集。文章以中國知網(CNKI)為數據源,選定圖書情報為檢索學科,檢索出了有結構化數據的摘要信息2 500余條(均為符合規范的完整摘要文本),經過導出和數據預處理操作,得到9 767條數據(同時包含規范和非規范的人造摘要文本),利用這些數據建立相應的訓練數據集(Train set,7 867條)、校驗數據集(Validate set,1 500條)、測試數據集(Test set,400條)和詞匯表(Vocabulary set)。

2.1 源數據預處理

以中國知網為檢索源,選取《圖書情報工作》和《情報科學》期刊為文獻來源,將檢索出來的摘要中有“目的/意義”“方法/過程”“結果/結論”標識的論文下載下來,經過剔除一些會議通知等無關內容之后,將論文的摘要單獨提取出來,共計2 500余條數據信息。

經過以下數據預處理操作:

將每一條摘要中的“目的/意義”“方法/過程”“結果/結論”分別提取出來,分別用A、B、C標識。

構造訓練數據集、校驗數據集、測試數據集和詞匯表。其中數據集的結構主要包含三個部分:id、cotent和label,其中id為每條數據的唯一標識,content為文本內容,label驗證結果(1為符合學術規范,2為缺少目的意義,3為缺少方法過程,4為缺少結果結論)。label的判定規則如下:如果content中同時包含A、B、C,則label為1;如果content中沒有包含A,則label為2;如果content中沒有包含B,則label為3;如果content中沒有包含C,則label為4。(這里主要以期刊發表為準則,即基于以下事實:如果論文在期刊中發表,則默認該論文的摘要部分符合學術規范;對于個別有明顯錯誤的摘要內容,輔之于人工標注)

將每一條摘要中的A、B、C分別排列組合,構造相應的訓練數據(共計7 867條)。對訓練數據進行數據清洗操作,包括清除無效數據、對空數據進行補全等。通過編寫相應Python程序,構造好的數據集如下圖所示:

圖4 數據集圖

2.2 模型的構建

首先采用傳統的CNN模型(以下簡寫為模型1),完整結構如下圖所示,包含輸入層、3個卷積層、1個池化層、1個全連接層和輸出層:其中模型的輸入為詞向量(Word embedding),輸出為每一段文本對應的標簽(即1、2、3、4,各自代表相應的含義)。由于模型的參數對結果的準確性影響很大,利用網格搜索經過反復調參,對模型作如下參數初始化:

模型詞向量(Word embedding)維度設定為64,卷積核個數為8,卷積核大小為64,全連接層中神經元個數為64,初始權重矩陣隨機選取符合正態分布的數值。池化層中采用Max Polling方式,輸出層中激活函數采用修正線性單元(Rectified linear unit,ReLu)激活并采用SoftMax進行分類。準確率校驗過程采用交叉熵測度(Cross Entropy),權重優化過程采用自適應矩估計優化器(Adam Optimizer)。另外,由于模型的數據量較小,為避免模型訓練過程中發生過擬合,將Dropout比例設定為0.7,迭代次數為10。

類似的,利用Kim Y的單層CNN結構(見圖2),對該模型(以下簡寫為模型2)參數做如下初始化操作:

模型詞向量(Word embedding)維度設定為520,卷積核大小有三類,分別為3、4、5,每一類卷積核的個數均為128,初始權重矩陣隨機選取符合正態分布的數值;池化層中采用Max Polling方式,輸出層中激活函數采用修正線性單元(Rectified linear unit,ReLu)激活并采用SoftMax進行分類;準確率校驗過程采用交叉熵測度(Cross Entropy),權重優化過程采用自適應矩估計優化器(Adam Optimizer);Dropout比例為0.5,迭代次數為200;L2 規范化參數為0。

圖5 CNN結構圖

根據模型1和模型2的輸出結果可以判斷一段文本是否完整包含摘要結構的四要素,如果不包含的話,亦可指出文本具體缺少哪一個要素。

2.3 模型的評估和預測

利用TensorFlow和Sklearn框架,通過編寫Python程序可以將上述兩個模型很方便的實現出來。運行程序發現,模型1在測試集上的精確度為80.13%,模型2精確度為82.57%,基本達到了預期目標(大于80%)。

結合TensorFlow提供的TensorBoard分析工具,可以看到模型圖(Graph)結構分別如下所示:

圖6 模型1圖結構(Graph)

圖7 模型2圖結構(Graph)

其中模型訓練過程中的精度(accuracy)和損失率(loss)變化趨勢圖如下:

圖8 模型1精度趨勢圖

圖9 模型1損失率趨勢圖

圖10 模型2精度趨勢圖

圖11 模型2損失率趨勢圖

進一步觀察程序輸出結果中的模型評估指標:

圖12 模型1評估指標

圖13 模型2評估指標

可以看到模型1、2的查準率(Precision)和召回率(Recall)這兩個指標均達到80%以上,由于兩者是互斥的關系,80%的結果基本符合預期。

綜合利用上面兩個預測模型,對模型1、2的輸出結果求平均值,以該值作為我們最終模型的最終結果。觀察最終模型的評價指標如下:

圖14 最終模型的評估指標

可以看到最終模型的各項指標都要高于單個模型(模型1、2)。其中精確達到83.20%,查準率和召回率分別為84%和83%。

3 總結和進一步優化

文章基于數據挖掘技術初步構建了一個以論文摘要為研究對象的學術規范檢測模型,準確率總體達到了83%+,雖然還沒有符合產品級的高精度(95%+)要求,但其證明通過利用機器學習的相關技術實現論文學術規范的智能化檢測是可行的。概括起來,該模型相較于傳統學術規范評審方式有以下幾方面優勢:

評審效率高,節省大量人力成本。上述模型除了在訓練階段耗費較長時間(模型1為11分鐘,模型2為28分鐘),在應用階段對400條樣本的預測僅耗時5秒,效率得到大幅度提升;并且模型只需初始訓練一次即可,后續階段無需再次訓練。

結果更具有客觀性和統一性。傳統的人工評審方式主觀性較大,可能會出現錯誤, 甚至不同的專家之間也可能得出不同的結論。而利用機器學習的技術手段評審,就可以避免主觀性的誤判,提高評審的準確率。

有利于論文的學術規范標準化。由于論文是由計算機評審,省去人工評審繁瑣的工作,從而可以把精力主要放在論文內容的學術規范的評定上。標準作為模型訓練階段的一個基石,標準統一了,評審結果也就更具有一致性。

為了進一步提高模型的準確率,對上述CNN模型的進一步優化,后續工作可以考慮從以下幾方面展開:

數據集數量規模較小。模型訓練數據集總量共計7300余條,這對于構建一個高精度的神經網絡而言,是遠遠不夠的,一般來說,數據集的量級最好在萬以上。CNN模型結構過于簡單。模型1目前僅包含三個卷積層和一個池化層,可以考慮引入多個卷積層和多個池化層以提高精度,比如采用LeNet模型等。詞向量的構建目前采用的Id標識(即每個字唯一對應于詞匯表中的相應Id),這樣不能從語義上對詞義相近的字進行區分,優化過程中可以考慮采用Word2vec或Tf-Idf的方法。模型的初始權重矩陣目前為隨機矩陣,可以考慮采用Xavier初始化方法[12],防止梯度消減和梯度爆炸,從而提高模型的穩定性。

(來稿時間:2018年10月)

猜你喜歡
規范評價模型
一半模型
來稿規范
來稿規范
PDCA法在除顫儀規范操作中的應用
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
來稿規范
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
基于Moodle的學習評價
主站蜘蛛池模板: 无码精油按摩潮喷在线播放 | 国产综合精品日本亚洲777| 久久精品66| 日本道中文字幕久久一区| 国产精品一区二区久久精品无码| 自拍亚洲欧美精品| 四虎成人免费毛片| 在线无码九区| 欧美19综合中文字幕| 国产一级视频久久| 国产后式a一视频| 精品第一国产综合精品Aⅴ| 亚洲成a人片77777在线播放| 亚洲熟女中文字幕男人总站| 999精品色在线观看| 亚洲AV永久无码精品古装片| 五月丁香在线视频| 特级aaaaaaaaa毛片免费视频| 高清无码一本到东京热| 40岁成熟女人牲交片免费| 在线免费无码视频| 高清免费毛片| 青草视频网站在线观看| 国产丝袜无码精品| 黄色成年视频| 国产拍在线| 国产精品林美惠子在线观看| 永久成人无码激情视频免费| 人妻无码中文字幕一区二区三区| 色天堂无毒不卡| 毛片最新网址| 五月天综合网亚洲综合天堂网| 中文精品久久久久国产网址| 成人国产精品2021| 九月婷婷亚洲综合在线| 国产高清国内精品福利| 日韩成人午夜| 国产精品永久不卡免费视频| 亚洲精选无码久久久| 午夜成人在线视频| 国产精品香蕉在线观看不卡| 国产麻豆福利av在线播放| 亚洲色图欧美| 久久黄色影院| 中文字幕日韩久久综合影院| 欧美一道本| aⅴ免费在线观看| 亚洲丝袜第一页| 黄色网页在线播放| 青青草国产免费国产| 国产女人爽到高潮的免费视频 | av一区二区三区在线观看| 亚洲精品在线影院| 亚洲无码视频一区二区三区 | 国产精品手机视频| 成人国产精品网站在线看| 亚洲一区二区三区香蕉| 狠狠色成人综合首页| 高清无码手机在线观看 | 亚洲IV视频免费在线光看| 亚洲一区二区成人| 四虎永久免费地址| 九九免费观看全部免费视频| 国产乱子伦一区二区=| 久久免费看片| 欧美亚洲欧美区| 97精品久久久大香线焦| 成人永久免费A∨一级在线播放| 亚洲男人天堂2018| 欧美精品aⅴ在线视频| 欧美国产综合色视频| 亚洲三级色| 亚洲自拍另类| 99久久精品免费看国产电影| 自拍亚洲欧美精品| 国产欧美专区在线观看| 欧美成人一级| 在线国产毛片| 国产亚洲成AⅤ人片在线观看| 亚洲三级a| 华人在线亚洲欧美精品| 成·人免费午夜无码视频在线观看|