999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

領域性科研機構的研究熱度評價方法

2015-09-27 08:22:58劉金花
現代計算機 2015年29期
關鍵詞:評價研究

劉金花

(山西醫科大學汾陽學院衛生信息管理系,汾陽 032200)

領域性科研機構的研究熱度評價方法

劉金花

(山西醫科大學汾陽學院衛生信息管理系,汾陽032200)

0 引言

科學技術的高速發展促使科技文獻知識的研究也日益專門化,作為創新主體的科研工作者他們對快速獲取有用的信息和知識變的更為迫切,在現實情況中,通過查找關鍵詞在電子檢索系統檢索到的相關文獻成千上萬篇。很多準備從事科研工作的人員,希望能夠對某一科研領域的主要研究機構有一個完整的、具體的認識;然后決定奔赴哪個科研機構學習或者是增加與哪個科研機構的學術交流等。

本文提出了科技文獻科研機構的熱度挖掘方法,文中綜合考慮了某領域研究機構中研究人員的數量、發表文章的數量和學術水平三方面的因素,對科研機構在給定領域的研究熱度進行打分。然后用同樣的評價方法獲得每個機構在各個時間段的研究熱度值,我們就可以清晰的看出各個研究機構在給定領域的研究熱度趨勢,以便預測將來的發展趨勢。

1 實驗數據結構

1.1數據來源

本文研究的數據來源于1999-2010年的中國學術期刊網站,以“機器翻譯”作為搜索的關鍵詞搜索文獻。選取其中被引用頻次超過一次(包含一次)的文獻,抽取了文獻數據中的論文標題、作者、摘要、標題、研究機構、發表時間、被引用頻次、被下載頻次、分類編號等10個字段,導入到MySQL數據庫中。舍棄被引頻次小于1的文獻,是因為沒有引用頻次的文章我們可以認為這些文獻的學術價值是比較低的,并且沒有引用頻次的文獻大都不是來自主流的期刊和會議。

1.2文獻機構信息統計

對于每篇文章所隸屬的研究機構進行統計,因為論文的研究機構署名在不同的階段單位名稱會有稍微的差別,但是其實都屬于一個研究單位,例如:“中國科學院自動化研究所”,有時候也簡稱為“中科院自動化研究所”。所以本文在統計機構信息時,對這些機構單位進行了統一處理,將同一所大學的整理為同一個研究機構。我們對本文的實驗數據的機構信息及其所在1999-2010這12年間發表的文章數量做了統計,在“機器翻譯”領域發表的文章中,署名的機構數總共有688個,大部分是高等院校,還有一些研究所等。表1中只列出了發文數量超過20(包括20)篇的研究機構。

2 研究機構的研究熱度分析

由于絕大多數的人都關心的是某一領域中的核心研究機構,因為這些機構的研究人員和發文數量都是非常高的,故我們在對研究機構進行熱度評價之前,可以進行一些過濾操作以確定主要的研究機構,然后再對這些主要的研究機構進行研究熱度值評價。另外,各個研究機構對該領域研究熱度可以通過該機構發表的論文數量、研究人員數量等信息來反映出來,但是一般反映一個研究機構的學術研究水平及研究的深度,僅僅通過數量是不夠的,還應該考慮到該機構發表論文的質量。因此研究機構的熱度分析可以按照以下流程進行,如圖1所示。

圖1 研究機構熱度分析流程圖

表1文獻的機構信息及發文數量統計

2.1主要研究機構的確定

一般情況下,一個研究機構發表的論文數量越多,說明該機構對該領域的研究越深入,但是不能忽略掉一個因素——研究人員的數量。如果一個研究機構A在某一領域總共發表了論文數為100篇,但是A機構中的研究人員數為20;而另外一個研究機構B在該領域發表的論文數為20篇,但是B機構的研究人員為1人次。A機構與B機構的人均發文量是一樣的,我們該認為哪個機構更有影響力?通常我們會認為機構A比B更有影響力。為了避免這種情況的大量發生,本文采取了對研究機構進行初步篩選的過程,過濾掉那些機構中研究人員特別少的或者是發表的論文數量特別少。制定的研究機構過濾準則如下:

(1)如果一個機構的研究人員的數量少于12,則去掉該機構。

(2)如果一個機構的發文數量少于12(包含12),則去掉該機構。

為了保證在12年間年均研究人員數是1人,年均發文量是1。述兩條過濾準則的中提到的閾值都設為12。在上文已經對文獻機構信息進行了統計共有688個機構,按照上述研究機構的過濾準則進行初步的過濾之后,剩下了31個研究機構。

另外,一個研究機構在某領域的研究水平,僅僅通過論文數量和人員數量是不行的,如果一個研究機構研究人員壯大,但是發表了一堆沒有什么含金量的文章,那么我們也不能認為該機構是非常有影響力的機構。一般來說被引用頻次是評價學術論文學術質量的重要指標,如果一個機構發表的論文的引用頻次越高越能體現出該機構的學術研究質量,在一定程度上發表的論文的被引用頻次、篇均被引頻次能說明該機構的研究水平。下面對各個研究機構的人員分布和被引用情況的統計,表中列出了去掉了篇均被引率小于14的機構。

表2機器翻譯領域主要的研究機構

2.2機構的研究熱度評價方法

當我們確定了該研究領域的核心研究機構之后,接下來制定評價一個研究機構對某一領域的研究熱度值,不光要考慮該機構投入的研究人員數量,還應該考慮該機構的產出量和學術水平,故本文綜合了這三個因素來評價某一研究機構對特定領域的研究熱度,如公式(1):

其中Hot(Oi)表示機構Oi的研究熱度值,persons(Oi)表示機構Oi的研究人員總數,papers(Oi)表示機構Oi發表的論文總數,cited(Oi)表示機構Oi的文獻被引用的總次數,m是已確定的核心研究機構的個數。因為公式(1)中三部分都是一個比例關系,這種比例值有時候會出現非常小甚至趨向于零的情況,因此為了計算的準確性本文在計算的過程中對最終的熱度值Hot (Oi)進行了取對數操作。

表3 1999-2010年各個研究機構機器翻譯領域的研究熱度值

表3是本文根據上述的熱度計算公式計算的在1999-2010這12年機器翻譯領域各個研究機構的熱度值。從表中來看,排在前幾位的研究機構確實是在人員投入、發文的數量和質量方面都是比較高的,因此,用本文提出的對研究機構的熱度值打分的方法一定程度上是有效的,但是對于排名靠后的機構的次序就不確定是否準確。

2.3研究機構研究熱度趨勢變化

類似的我們可以計算某一研究機構在不同年度的研究熱度值,這樣就可以描繪出該研究機構在該領域的研究熱度曲線圖。通過這個熱度變化趨勢可以進一步預測在接下來的時間內,該機構在該領域的研究趨勢是處于較高狀態還是較低的狀態。如圖2所示,是我們選取的五個主要的研究機構在“機器翻譯”領域的研究熱度曲線圖。從圖中趨勢就可以預測在未來的幾年之內中科院在機器翻譯領域的研究會一直處于比較高的狀態。

圖2  1999-2010年五個研究機構在機器翻譯領域的研究熱度曲線

3 結語

本文對某一領域文獻知識進行了研究機構的熱挖掘工作。并且以“機器翻譯”領域來舉例,從實驗數據的設置到研究點的熱度分析步驟,研究機構的熱度分析步驟都做了詳細的講解,并且對實驗的結果進行了分析,證實了此種方法在一定程度上還是可行有效的,而且用了可視化的方法展示給用戶,符合了本文研究的初衷。另外,本文的熱度挖掘方法不僅是針對機器翻譯這一領域的,還可以運用到其他的領域,只要保證數據是文獻數據,并且能夠達到一定的規模,用本文提出的方法對某一領域的研究機構進行熱度分析,都是可行的。另外,本文的針對科技文獻的挖掘工作都是針對下載到本地的文獻數據做的挖掘工作,但是現實生活中網絡的發達,導致文獻數據的更新很快,如果我們能夠針對在線的數據進行挖掘工作,并且能夠提供出可視化的熱度分析趨勢圖,那將會造福很多的科研工作者。因此,基于實時性的在線文獻挖掘工作也是將來工作的一個重點。

[1]HAN Jia-wei,Micheline Kamber,PEI Jian.數據挖掘概念與技術(原書第3版)[M].北京:機械工業出版社,2012.

[2]宗成慶.統計自然語言處理(第2版)[M].清華大學出版社.北京:清華大學出版社,2013.

[3]柯健,李超.我國社會科學領域數據挖掘研究的文獻計量分析.現代情報,2010,31(6):102-106.

[4]黃永煤.讀者需求分析中的數據挖掘技術[J].大學圖書情報學刊,2006,24(4):48-50.

[5]邱均平,繆雯婷.文獻計量學在人才評價中應用的新探索[J].評價與管理,2007,2(6):1-5

Literature Mining;Research Institutions;Evaluation of Research Hot

Research Hot Degree of the Evaluation Method of Research Institutions in a Certain Field

LIU Jin-hua
(Fenyang College Shanxi Medical University,Fenyang 032200)

1007-1423(2015)29-0045-04

10.3969/j.issn.1007-1423.2015.29.012

劉金花(1987-),女,山西汾陽人,碩士,助教,研究方向為自然語言處理、數據挖掘

2015-09-24

2015-10-07

從大量文獻中快速獲得某一領域的核心科研機構,對準備開展科研工作的科研人員具有極大的導向作用。爬取網上某一領域文獻數據,綜合考慮機構的研究人員數、發文量和被引文量,提出針對研究機構的研究熱度的評價方法,并且對每一個研究機構在各個時間段進行熱度評價,然后繪制出熱度趨勢圖。

文獻挖掘;研究機構;研究熱度評價

It has a great role in guiding for research staff whom preparing to carry out research work,if we can obtain the core research institutions for a given field from a large number of scientific literature rapidly.Crawls a certain field literature data from Internet,and proposes an evaluation method of research hot value for each institute considering the number of researchers,the volume of published articles and the amount of the citation comprehensively,uses a visual way to display distribution graph of the field in a certain period.

猜你喜歡
評價研究
FMS與YBT相關性的實證研究
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
2020年國內翻譯研究述評
遼代千人邑研究述論
中藥治療室性早搏系統評價再評價
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
基于Moodle的學習評價
關于項目后評價中“專項”后評價的探討
主站蜘蛛池模板: 亚洲成人77777| 最新国产你懂的在线网址| 亚洲精品国产首次亮相| 国产成人综合亚洲欧美在| 欧美性爱精品一区二区三区| 国产激爽爽爽大片在线观看| 无码在线激情片| 日韩天堂视频| 中文字幕在线看| 97免费在线观看视频| 91香蕉视频下载网站| 无码网站免费观看| 萌白酱国产一区二区| 老司国产精品视频91| 91精品国产91久无码网站| 欧美一区二区精品久久久| 最新国产精品第1页| 久久黄色一级视频| 久夜色精品国产噜噜| 亚洲愉拍一区二区精品| 色综合激情网| 日本草草视频在线观看| 国产成人精品2021欧美日韩| 亚洲自拍另类| 国产色婷婷| 日本成人在线不卡视频| 99国产在线视频| 性视频久久| 国产手机在线ΑⅤ片无码观看| 欧美成人一级| 三级毛片在线播放| 国产美女无遮挡免费视频| 欧美在线天堂| 久久国产成人精品国产成人亚洲| 2021最新国产精品网站| 欧美性色综合网| 久久伊人久久亚洲综合| 日韩精品毛片人妻AV不卡| 色成人亚洲| 久久无码高潮喷水| 亚洲婷婷六月| 2021天堂在线亚洲精品专区| 国产亚卅精品无码| 日韩高清一区 | 丁香亚洲综合五月天婷婷| 国产精品永久在线| 天天干天天色综合网| 国产特级毛片aaaaaaa高清| 99re在线免费视频| 欧美精品成人| 国产精品香蕉在线| 四虎国产永久在线观看| 久久semm亚洲国产| 不卡网亚洲无码| 一本无码在线观看| 老色鬼久久亚洲AV综合| 久久一级电影| 4虎影视国产在线观看精品| 青草视频免费在线观看| 91在线国内在线播放老师| 婷婷五月在线| 人人澡人人爽欧美一区| 伊人成人在线视频| 亚洲欧美不卡| 99九九成人免费视频精品| 91无码人妻精品一区| 国内熟女少妇一线天| 免费观看精品视频999| 美女被躁出白浆视频播放| 国产精品成人观看视频国产| 亚洲一区毛片| 欧美日一级片| 大香网伊人久久综合网2020| 欧美国产视频| 四虎精品黑人视频| 国产99精品视频| 在线观看亚洲精品福利片| 午夜国产精品视频| 国产凹凸视频在线观看| 99视频在线免费| 少妇精品久久久一区二区三区| 亚洲三级色|