999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于專家知識的評審專家推薦算法研究

2017-03-24 18:35:55冷昕陽
環球人文地理·評論版 2016年11期

冷昕陽

摘要:科研論文是科學研究的重要表現方式,是引領技術發表的指南針。對論文發表流程的把控是保證論文質量的關鍵。在論文的發表過程中,為其尋找特定的評審專家又是論文發表中關鍵的一環。因此,為了保證論文的質量,應為投稿論文選擇合適的評審專家。本研究首先收集候選專家已發表的科技論文作為分析專家知識的基礎,然后,分析投稿論文的研究內容,提取投稿論文的研究主題,最后,把專家推薦的問題建模成一個信息檢索的問題,采用向量空間模型(Vector Space Model, VSM)來計算投稿論文的研究內容與專家知識的相關性,并以此為依據為投稿論文推薦出特定的審稿專家。

關鍵詞:推薦系統;主題提取;評審專家推薦

1.引言

信息過載是各行各業所面臨的一個嚴重問題,如電子商務網站,需要針對每位用戶的需要,在海量的商品信息中,判斷出用戶更傾向于要購買的商品;如公司的招聘人員,需要在大量的求職者中,識別有能力的求職者給予進行面試機會;如期刊的編輯需要面對龐大的評審專家庫,識別出合適的評審專家來對投稿論文進行審稿。推薦系統的出現在一定程度緩解了過量的信息給人們所帶來的壓力,在一定程度上提高了工作的效率,并迅速擴展到其它領域。然而,目前關于推薦系統大多都應用到電子商務、社交網絡以及數字圖書館等領域,而較少對評審專家推薦的研究,即根據投稿論文的研究特征來推薦合適的評審專家。

在學術環境下,同樣也暴露出信息過載等問題,許多的科研成果需要依靠論文的形式來讓其他同一領域的科研人員也了解到,這時期刊編輯部對于論文的評選應該更加細致認真,以防止投稿論文審稿工作分配不當導致出現偏差。然而若單純的靠人工的遴選便會有許多弊端。比如:在選擇上會帶有不可避免的主觀性以及對于專家信息的更新不夠及時等因素,這些都會導致有些真正有價值的論文沒有及時發表從而導致學術領域的發展減緩。而且在海量的信息面前僅依靠人去識別區分顯然工作效率很低也浪費時間。在這種情況下專家推薦系統應運而生,評審專家推薦系統使這份工作變得十分簡單。

評審專家推薦系統能夠針對投稿論文遴選出合適的審稿專家,該系統首先提取專家知識并分析投稿論文的研究內容,理解編輯需求,并為編輯推薦合適的評審專家。隨著投稿論文的數量持續增長以及專家知識的擴散性,充分準確的理解專家知識對于編輯來說是十分困難,因此,能夠自動分析專家知識,為投稿論文遴選出合適的審稿專家的系統顯得尤為必要。

本研究首先收集候選專家已發表的科技論文作為分析專家知識的基礎,然后,分析投稿論文的研究內容,提取投稿論文的研究主題,最后,把專家推薦的問題建模成一個信息檢索的問題,采用向量空間模型(Vector Space Model, VSM)來計算投稿論文的研究內容與專家知識的一個相關性和匹配度,并以此為依據為投稿論文推薦出特定的審稿專家。

2.相關研究

專家推薦系統的構建,主要包括專家的選擇以及專家特長的識別,從而基于專家的特長屬性與查詢條目的匹配相關性進行推薦。目前,就專家特長角度而言,主要來源于兩個方面,一種是專家個人提供關于自身特長和經驗的準確和綜合的文檔描述;另一種則是通過文章、Email交流以及學術論壇挖掘專家的特長信息;由于第一種方法主觀性較高,所以大多數學者都是從第二種角度出發對于專家特長識別進行研究。

基于主題信息的專家推薦主要是借助于關鍵詞、作者的學科標簽等信息為稿件遴選相關的專家。例如,劉一星[1]等學者把評審專家推薦的問題視為一個分類問題,該研究首先把投稿論文對應到相應類別中,再從該類別中尋找相關的專家對投稿論文進行評審。余峰[2]等學者首先把利用文本相似度的計算方法,首先把專家知識和投稿論文的研究內容向量的形式表示出來,然后,再利用相似度公式計算投稿論文與專家知識的相關性。鞏軍[3]等學者引入知識圖的方法來為投稿論文推薦相關的評審專家,該研究首先把投稿論文的研究內容和專家知識映射到反映知識相似性的知識地圖中去,然后,計算投稿論文和候選專家在在知識地圖的相關性距離為投稿論文遴選合適的專家。Gollapalli[4]等人通過ADT(Author- Document- Topic)以及主題模型建模工具,建立作者、文檔以及主題之間的權重關系圖,進而通過計算圖和路徑計算任何一對節點的相似度,進而發現在不一定具有合作作者關系的情況下,達到基于內容的專家發現,從而用以進行專家推薦。

3.研究方法

3.1 研究思路

本研究主要包括三大步驟:數據準備、數據預處理、計算專家與論文的匹配度以及專家推薦。

(1)數據準備:該部分主要收集兩部分的數據:一個是專家庫,其中包括專家的個人信息(隱私信息除外)比如名字、年齡、主要的成就等等,并遴選出專家被引量較高的幾篇論文作為其代表作。另一方面就是投稿論文的數據庫的建立,本研究從萬方數據庫中隨機遴選出幾篇論文作為投稿論文。

(2)數據預處理:從“萬方數據庫”中爬取專家發表的論文后,遴選出高被引的論文作為其知識的表示。另外,從“萬方數據庫”中隨機遴選出投稿論文作為評審專家推薦算法的輸入數據。本研究首先通過停用詞表將常用詞篩選出去,停用詞表是人為的建立的常用語集合的一個文檔,將常用詞,沒有實際意義,沒有實際指代的詞生成一個集合,形成一個停用詞表。篩選出去之后會得到專家論文的詞表以及投稿論文的詞表,然后用TF- IDF算法分別計算每個詞針對于專家知識和投稿論文研究內容的權重。

(3)計算專家與論文的匹配度以及專家推薦:利用空間向量模型計算投稿論文與專家適應的余弦相似性,并降序排列計算出的結果,排在最前面的專家就說明這些專家與投稿論文匹配度高,最后只需將論文送至這些專家然審閱。

3.2數據獲取與數據預處理

數據獲取主要是從“萬方數據庫”中獲取專家姓名、專家的主題標簽、專家發表的論文等數據。依據論文被引數來評價論文質量,遴選出專家被引量較高的幾篇論文作為其代表作,將其作為提取專家知識、分析專家研究方向的基礎。另一方面就是投稿論文的數據庫的建立,本研究從萬方數據庫中隨機遴選出幾篇論文作為投稿論文,作為評審專家算法的輸入。

數據獲取后,需要對專家發表的論文以及專家主題關系詞等信息進行分詞操作。為了使計算機更好的理解語句的含義,我們應該把一句話變為一個個獨立的詞。我們知道,在英文的書寫習慣中,空格是分隔詞與詞的主要標志。然而,在中文的行文習慣中,沒有明顯的標志區分不同的詞。因此,本研究需要首先對專家發表論文以及專家興趣描述等數據進行分詞處理。在這里,我們使用IK Analyzer作為分詞工作,IK Analyzer是一個基于Java語言開源的中文分詞工具。

3.3特征選擇

這里介紹一個TF- IDF(Term Frequency–Inverse Document Frequency)算法,該算法是一種常用關鍵詞遴選工具,TF- IDF算法的思想如果一個詞在一篇文章中出現的頻率越高,則說明該詞對于該篇文章越重要;如果這個詞在其它文章中出現的次數很少,則認為此詞或短語具有越高的區分能力。在本研究中,我們借助IF- IDF計算每個詞的權重。

3.4評審專家知識與投稿論文相關性計算

本研究以投稿論文的研究內容與專家知識的相關性為依據為投稿論文遴選出合適的評審專家。本研究引入向量空間模型(VSM, Vector Space Model)計算兩者的相關性。VSM算法是借助于詞表和遴選關鍵詞的權值把投稿論文的研究內容和專家知識表示為空間向量,并利用COS來計算兩個向量的夾角,表示其相關性。第i位候選專Ei家與投稿論文S之間的相關性標記為:

4.結論

科研論文是科學研究的重要表現方式,是引領技術發表的指南針。因此,對論文發表流程的把控是保證論文質量的關鍵。在論文的發表過程中,為其尋找特定的評審專家又是論文發表中關鍵的一環。因此,為了保證論文的質量,首先應該建立科學合理的評審專家遴選與推薦方法。然而,目前關于推薦系統的大多都應用到電子商務、社交網絡以及數字圖書館領域,而較少的對評審專家推薦的研究。為此,本研究首先從專家的研究興趣描述、專家發表的論文以及相應的資料數據中挖掘專家知識并利用停用詞表對無實際意義的詞以及特殊符號進行剔除,并用IF- IDF為每個代表性的詞計算權重,然后,計算投稿論文的研究內容與專家知識之間的相關性,并以此為依據為投稿論文遴選出相關的專業。

但是,在專家推薦的過程中,仍有一些實際的問題值得深入探討。例如,專家在其科研活動中發表多篇論文,但是并不是每一篇論文專家都能夠以完全足夠的精力投入到該論文中去。因此,在后續的研究中,我們更應該首先遴選出專家的代表作,并以此為依據遴選出相關的專家。

參考文獻

[1] 劉一星,梁山.基于改進ATSVM算法的評審專家自動推薦模型[J].重慶科技學院學報(自然科學版),2010,01:134-136.

[2] 余峰,余正濤,楊劍鋒,郭劍毅,嚴馨.基于主題信息的項目評審專家推薦方法[J].計算機工程,2014,06:201-205.

[3] 鞏軍,劉魯.基于個人知識地圖的專家推薦[J].管理學報,2011,09:1365-1371.

[4] Gollapalli S D, Mitra P, Giles C L. Ranking authors in digital libraries[C]//Proceedings of the 11th annual international ACM/ IEEE joint conference on Digital libraries. ACM, 2011: 251-254.

主站蜘蛛池模板: 91探花在线观看国产最新| 欧美成人二区| 国产91熟女高潮一区二区| 又粗又大又爽又紧免费视频| 免费一级成人毛片| 国产成人综合日韩精品无码不卡 | 国产 在线视频无码| 亚洲一区无码在线| 综合天天色| 青草精品视频| 欧美视频在线播放观看免费福利资源| 日韩色图区| 婷婷综合亚洲| 国产成人乱无码视频| 成人日韩欧美| 国产视频a| 亚洲中文无码h在线观看 | 久久永久免费人妻精品| 日本在线视频免费| AV不卡无码免费一区二区三区| 国产三区二区| 国产福利一区二区在线观看| 国产精品福利导航| 国产精品三级av及在线观看| 成人免费网站在线观看| 国产sm重味一区二区三区| 91在线国内在线播放老师| 精品小视频在线观看| 无码国产伊人| 91精品国产一区自在线拍| 亚洲VA中文字幕| 久久精品视频一| 久久免费精品琪琪| 99re精彩视频| 亚洲欧美激情小说另类| 日韩无码视频专区| 国产在线啪| 久久无码av三级| 69精品在线观看| 国产幂在线无码精品| 中文字幕波多野不卡一区| 婷婷激情亚洲| 成人福利在线观看| 亚洲人成影院在线观看| 亚洲国产日韩在线成人蜜芽| 婷婷激情亚洲| 国产精品自在拍首页视频8| 超碰免费91| 亚洲黄色网站视频| 欧美日韩成人| 欧美精品二区| 青青国产在线| 国产欧美另类| 直接黄91麻豆网站| 成人精品视频一区二区在线| 欧美亚洲欧美| 园内精品自拍视频在线播放| 亚洲午夜福利精品无码不卡| 欧美区一区| 波多野结衣中文字幕一区| 久久99热66这里只有精品一| 久久久久亚洲精品无码网站| 成年人福利视频| 欧美日韩国产高清一区二区三区| 高清无码手机在线观看| 99久久精品无码专区免费| 久久一日本道色综合久久| 丁香亚洲综合五月天婷婷| 国产精品尹人在线观看| 激情六月丁香婷婷四房播| 国产91全国探花系列在线播放| 国产91特黄特色A级毛片| 香蕉综合在线视频91| 国内精品久久久久久久久久影视 | av一区二区人妻无码| 午夜毛片免费看| 日本精品视频| 亚洲精品国偷自产在线91正片| 国产人人干| 国产免费a级片| 成人福利在线免费观看| 深夜福利视频一区二区|