999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

領(lǐng)域性科研機(jī)構(gòu)的研究熱度評(píng)價(jià)方法

2015-09-27 08:22:58劉金花
現(xiàn)代計(jì)算機(jī) 2015年29期
關(guān)鍵詞:評(píng)價(jià)研究

劉金花

(山西醫(yī)科大學(xué)汾陽學(xué)院衛(wèi)生信息管理系,汾陽 032200)

領(lǐng)域性科研機(jī)構(gòu)的研究熱度評(píng)價(jià)方法

劉金花

(山西醫(yī)科大學(xué)汾陽學(xué)院衛(wèi)生信息管理系,汾陽032200)

0 引言

科學(xué)技術(shù)的高速發(fā)展促使科技文獻(xiàn)知識(shí)的研究也日益專門化,作為創(chuàng)新主體的科研工作者他們對(duì)快速獲取有用的信息和知識(shí)變的更為迫切,在現(xiàn)實(shí)情況中,通過查找關(guān)鍵詞在電子檢索系統(tǒng)檢索到的相關(guān)文獻(xiàn)成千上萬篇。很多準(zhǔn)備從事科研工作的人員,希望能夠?qū)δ骋豢蒲蓄I(lǐng)域的主要研究機(jī)構(gòu)有一個(gè)完整的、具體的認(rèn)識(shí);然后決定奔赴哪個(gè)科研機(jī)構(gòu)學(xué)習(xí)或者是增加與哪個(gè)科研機(jī)構(gòu)的學(xué)術(shù)交流等。

本文提出了科技文獻(xiàn)科研機(jī)構(gòu)的熱度挖掘方法,文中綜合考慮了某領(lǐng)域研究機(jī)構(gòu)中研究人員的數(shù)量、發(fā)表文章的數(shù)量和學(xué)術(shù)水平三方面的因素,對(duì)科研機(jī)構(gòu)在給定領(lǐng)域的研究熱度進(jìn)行打分。然后用同樣的評(píng)價(jià)方法獲得每個(gè)機(jī)構(gòu)在各個(gè)時(shí)間段的研究熱度值,我們就可以清晰的看出各個(gè)研究機(jī)構(gòu)在給定領(lǐng)域的研究熱度趨勢,以便預(yù)測將來的發(fā)展趨勢。

1 實(shí)驗(yàn)數(shù)據(jù)結(jié)構(gòu)

1.1數(shù)據(jù)來源

本文研究的數(shù)據(jù)來源于1999-2010年的中國學(xué)術(shù)期刊網(wǎng)站,以“機(jī)器翻譯”作為搜索的關(guān)鍵詞搜索文獻(xiàn)。選取其中被引用頻次超過一次(包含一次)的文獻(xiàn),抽取了文獻(xiàn)數(shù)據(jù)中的論文標(biāo)題、作者、摘要、標(biāo)題、研究機(jī)構(gòu)、發(fā)表時(shí)間、被引用頻次、被下載頻次、分類編號(hào)等10個(gè)字段,導(dǎo)入到MySQL數(shù)據(jù)庫中。舍棄被引頻次小于1的文獻(xiàn),是因?yàn)闆]有引用頻次的文章我們可以認(rèn)為這些文獻(xiàn)的學(xué)術(shù)價(jià)值是比較低的,并且沒有引用頻次的文獻(xiàn)大都不是來自主流的期刊和會(huì)議。

1.2文獻(xiàn)機(jī)構(gòu)信息統(tǒng)計(jì)

對(duì)于每篇文章所隸屬的研究機(jī)構(gòu)進(jìn)行統(tǒng)計(jì),因?yàn)檎撐牡难芯繖C(jī)構(gòu)署名在不同的階段單位名稱會(huì)有稍微的差別,但是其實(shí)都屬于一個(gè)研究單位,例如:“中國科學(xué)院自動(dòng)化研究所”,有時(shí)候也簡稱為“中科院自動(dòng)化研究所”。所以本文在統(tǒng)計(jì)機(jī)構(gòu)信息時(shí),對(duì)這些機(jī)構(gòu)單位進(jìn)行了統(tǒng)一處理,將同一所大學(xué)的整理為同一個(gè)研究機(jī)構(gòu)。我們對(duì)本文的實(shí)驗(yàn)數(shù)據(jù)的機(jī)構(gòu)信息及其所在1999-2010這12年間發(fā)表的文章數(shù)量做了統(tǒng)計(jì),在“機(jī)器翻譯”領(lǐng)域發(fā)表的文章中,署名的機(jī)構(gòu)數(shù)總共有688個(gè),大部分是高等院校,還有一些研究所等。表1中只列出了發(fā)文數(shù)量超過20(包括20)篇的研究機(jī)構(gòu)。

2 研究機(jī)構(gòu)的研究熱度分析

由于絕大多數(shù)的人都關(guān)心的是某一領(lǐng)域中的核心研究機(jī)構(gòu),因?yàn)檫@些機(jī)構(gòu)的研究人員和發(fā)文數(shù)量都是非常高的,故我們在對(duì)研究機(jī)構(gòu)進(jìn)行熱度評(píng)價(jià)之前,可以進(jìn)行一些過濾操作以確定主要的研究機(jī)構(gòu),然后再對(duì)這些主要的研究機(jī)構(gòu)進(jìn)行研究熱度值評(píng)價(jià)。另外,各個(gè)研究機(jī)構(gòu)對(duì)該領(lǐng)域研究熱度可以通過該機(jī)構(gòu)發(fā)表的論文數(shù)量、研究人員數(shù)量等信息來反映出來,但是一般反映一個(gè)研究機(jī)構(gòu)的學(xué)術(shù)研究水平及研究的深度,僅僅通過數(shù)量是不夠的,還應(yīng)該考慮到該機(jī)構(gòu)發(fā)表論文的質(zhì)量。因此研究機(jī)構(gòu)的熱度分析可以按照以下流程進(jìn)行,如圖1所示。

圖1 研究機(jī)構(gòu)熱度分析流程圖

表1文獻(xiàn)的機(jī)構(gòu)信息及發(fā)文數(shù)量統(tǒng)計(jì)

2.1主要研究機(jī)構(gòu)的確定

一般情況下,一個(gè)研究機(jī)構(gòu)發(fā)表的論文數(shù)量越多,說明該機(jī)構(gòu)對(duì)該領(lǐng)域的研究越深入,但是不能忽略掉一個(gè)因素——研究人員的數(shù)量。如果一個(gè)研究機(jī)構(gòu)A在某一領(lǐng)域總共發(fā)表了論文數(shù)為100篇,但是A機(jī)構(gòu)中的研究人員數(shù)為20;而另外一個(gè)研究機(jī)構(gòu)B在該領(lǐng)域發(fā)表的論文數(shù)為20篇,但是B機(jī)構(gòu)的研究人員為1人次。A機(jī)構(gòu)與B機(jī)構(gòu)的人均發(fā)文量是一樣的,我們該認(rèn)為哪個(gè)機(jī)構(gòu)更有影響力?通常我們會(huì)認(rèn)為機(jī)構(gòu)A比B更有影響力。為了避免這種情況的大量發(fā)生,本文采取了對(duì)研究機(jī)構(gòu)進(jìn)行初步篩選的過程,過濾掉那些機(jī)構(gòu)中研究人員特別少的或者是發(fā)表的論文數(shù)量特別少。制定的研究機(jī)構(gòu)過濾準(zhǔn)則如下:

(1)如果一個(gè)機(jī)構(gòu)的研究人員的數(shù)量少于12,則去掉該機(jī)構(gòu)。

(2)如果一個(gè)機(jī)構(gòu)的發(fā)文數(shù)量少于12(包含12),則去掉該機(jī)構(gòu)。

為了保證在12年間年均研究人員數(shù)是1人,年均發(fā)文量是1。述兩條過濾準(zhǔn)則的中提到的閾值都設(shè)為12。在上文已經(jīng)對(duì)文獻(xiàn)機(jī)構(gòu)信息進(jìn)行了統(tǒng)計(jì)共有688個(gè)機(jī)構(gòu),按照上述研究機(jī)構(gòu)的過濾準(zhǔn)則進(jìn)行初步的過濾之后,剩下了31個(gè)研究機(jī)構(gòu)。

另外,一個(gè)研究機(jī)構(gòu)在某領(lǐng)域的研究水平,僅僅通過論文數(shù)量和人員數(shù)量是不行的,如果一個(gè)研究機(jī)構(gòu)研究人員壯大,但是發(fā)表了一堆沒有什么含金量的文章,那么我們也不能認(rèn)為該機(jī)構(gòu)是非常有影響力的機(jī)構(gòu)。一般來說被引用頻次是評(píng)價(jià)學(xué)術(shù)論文學(xué)術(shù)質(zhì)量的重要指標(biāo),如果一個(gè)機(jī)構(gòu)發(fā)表的論文的引用頻次越高越能體現(xiàn)出該機(jī)構(gòu)的學(xué)術(shù)研究質(zhì)量,在一定程度上發(fā)表的論文的被引用頻次、篇均被引頻次能說明該機(jī)構(gòu)的研究水平。下面對(duì)各個(gè)研究機(jī)構(gòu)的人員分布和被引用情況的統(tǒng)計(jì),表中列出了去掉了篇均被引率小于14的機(jī)構(gòu)。

表2機(jī)器翻譯領(lǐng)域主要的研究機(jī)構(gòu)

2.2機(jī)構(gòu)的研究熱度評(píng)價(jià)方法

當(dāng)我們確定了該研究領(lǐng)域的核心研究機(jī)構(gòu)之后,接下來制定評(píng)價(jià)一個(gè)研究機(jī)構(gòu)對(duì)某一領(lǐng)域的研究熱度值,不光要考慮該機(jī)構(gòu)投入的研究人員數(shù)量,還應(yīng)該考慮該機(jī)構(gòu)的產(chǎn)出量和學(xué)術(shù)水平,故本文綜合了這三個(gè)因素來評(píng)價(jià)某一研究機(jī)構(gòu)對(duì)特定領(lǐng)域的研究熱度,如公式(1):

其中Hot(Oi)表示機(jī)構(gòu)Oi的研究熱度值,persons(Oi)表示機(jī)構(gòu)Oi的研究人員總數(shù),papers(Oi)表示機(jī)構(gòu)Oi發(fā)表的論文總數(shù),cited(Oi)表示機(jī)構(gòu)Oi的文獻(xiàn)被引用的總次數(shù),m是已確定的核心研究機(jī)構(gòu)的個(gè)數(shù)。因?yàn)楣剑?)中三部分都是一個(gè)比例關(guān)系,這種比例值有時(shí)候會(huì)出現(xiàn)非常小甚至趨向于零的情況,因此為了計(jì)算的準(zhǔn)確性本文在計(jì)算的過程中對(duì)最終的熱度值Hot (Oi)進(jìn)行了取對(duì)數(shù)操作。

表3 1999-2010年各個(gè)研究機(jī)構(gòu)機(jī)器翻譯領(lǐng)域的研究熱度值

表3是本文根據(jù)上述的熱度計(jì)算公式計(jì)算的在1999-2010這12年機(jī)器翻譯領(lǐng)域各個(gè)研究機(jī)構(gòu)的熱度值。從表中來看,排在前幾位的研究機(jī)構(gòu)確實(shí)是在人員投入、發(fā)文的數(shù)量和質(zhì)量方面都是比較高的,因此,用本文提出的對(duì)研究機(jī)構(gòu)的熱度值打分的方法一定程度上是有效的,但是對(duì)于排名靠后的機(jī)構(gòu)的次序就不確定是否準(zhǔn)確。

2.3研究機(jī)構(gòu)研究熱度趨勢變化

類似的我們可以計(jì)算某一研究機(jī)構(gòu)在不同年度的研究熱度值,這樣就可以描繪出該研究機(jī)構(gòu)在該領(lǐng)域的研究熱度曲線圖。通過這個(gè)熱度變化趨勢可以進(jìn)一步預(yù)測在接下來的時(shí)間內(nèi),該機(jī)構(gòu)在該領(lǐng)域的研究趨勢是處于較高狀態(tài)還是較低的狀態(tài)。如圖2所示,是我們選取的五個(gè)主要的研究機(jī)構(gòu)在“機(jī)器翻譯”領(lǐng)域的研究熱度曲線圖。從圖中趨勢就可以預(yù)測在未來的幾年之內(nèi)中科院在機(jī)器翻譯領(lǐng)域的研究會(huì)一直處于比較高的狀態(tài)。

圖2  1999-2010年五個(gè)研究機(jī)構(gòu)在機(jī)器翻譯領(lǐng)域的研究熱度曲線

3 結(jié)語

本文對(duì)某一領(lǐng)域文獻(xiàn)知識(shí)進(jìn)行了研究機(jī)構(gòu)的熱挖掘工作。并且以“機(jī)器翻譯”領(lǐng)域來舉例,從實(shí)驗(yàn)數(shù)據(jù)的設(shè)置到研究點(diǎn)的熱度分析步驟,研究機(jī)構(gòu)的熱度分析步驟都做了詳細(xì)的講解,并且對(duì)實(shí)驗(yàn)的結(jié)果進(jìn)行了分析,證實(shí)了此種方法在一定程度上還是可行有效的,而且用了可視化的方法展示給用戶,符合了本文研究的初衷。另外,本文的熱度挖掘方法不僅是針對(duì)機(jī)器翻譯這一領(lǐng)域的,還可以運(yùn)用到其他的領(lǐng)域,只要保證數(shù)據(jù)是文獻(xiàn)數(shù)據(jù),并且能夠達(dá)到一定的規(guī)模,用本文提出的方法對(duì)某一領(lǐng)域的研究機(jī)構(gòu)進(jìn)行熱度分析,都是可行的。另外,本文的針對(duì)科技文獻(xiàn)的挖掘工作都是針對(duì)下載到本地的文獻(xiàn)數(shù)據(jù)做的挖掘工作,但是現(xiàn)實(shí)生活中網(wǎng)絡(luò)的發(fā)達(dá),導(dǎo)致文獻(xiàn)數(shù)據(jù)的更新很快,如果我們能夠針對(duì)在線的數(shù)據(jù)進(jìn)行挖掘工作,并且能夠提供出可視化的熱度分析趨勢圖,那將會(huì)造福很多的科研工作者。因此,基于實(shí)時(shí)性的在線文獻(xiàn)挖掘工作也是將來工作的一個(gè)重點(diǎn)。

[1]HAN Jia-wei,Micheline Kamber,PEI Jian.數(shù)據(jù)挖掘概念與技術(shù)(原書第3版)[M].北京:機(jī)械工業(yè)出版社,2012.

[2]宗成慶.統(tǒng)計(jì)自然語言處理(第2版)[M].清華大學(xué)出版社.北京:清華大學(xué)出版社,2013.

[3]柯健,李超.我國社會(huì)科學(xué)領(lǐng)域數(shù)據(jù)挖掘研究的文獻(xiàn)計(jì)量分析.現(xiàn)代情報(bào),2010,31(6):102-106.

[4]黃永煤.讀者需求分析中的數(shù)據(jù)挖掘技術(shù)[J].大學(xué)圖書情報(bào)學(xué)刊,2006,24(4):48-50.

[5]邱均平,繆雯婷.文獻(xiàn)計(jì)量學(xué)在人才評(píng)價(jià)中應(yīng)用的新探索[J].評(píng)價(jià)與管理,2007,2(6):1-5

Literature Mining;Research Institutions;Evaluation of Research Hot

Research Hot Degree of the Evaluation Method of Research Institutions in a Certain Field

LIU Jin-hua
(Fenyang College Shanxi Medical University,F(xiàn)enyang 032200)

1007-1423(2015)29-0045-04

10.3969/j.issn.1007-1423.2015.29.012

劉金花(1987-),女,山西汾陽人,碩士,助教,研究方向?yàn)樽匀徽Z言處理、數(shù)據(jù)挖掘

2015-09-24

2015-10-07

從大量文獻(xiàn)中快速獲得某一領(lǐng)域的核心科研機(jī)構(gòu),對(duì)準(zhǔn)備開展科研工作的科研人員具有極大的導(dǎo)向作用。爬取網(wǎng)上某一領(lǐng)域文獻(xiàn)數(shù)據(jù),綜合考慮機(jī)構(gòu)的研究人員數(shù)、發(fā)文量和被引文量,提出針對(duì)研究機(jī)構(gòu)的研究熱度的評(píng)價(jià)方法,并且對(duì)每一個(gè)研究機(jī)構(gòu)在各個(gè)時(shí)間段進(jìn)行熱度評(píng)價(jià),然后繪制出熱度趨勢圖。

文獻(xiàn)挖掘;研究機(jī)構(gòu);研究熱度評(píng)價(jià)

It has a great role in guiding for research staff whom preparing to carry out research work,if we can obtain the core research institutions for a given field from a large number of scientific literature rapidly.Crawls a certain field literature data from Internet,and proposes an evaluation method of research hot value for each institute considering the number of researchers,the volume of published articles and the amount of the citation comprehensively,uses a visual way to display distribution graph of the field in a certain period.

猜你喜歡
評(píng)價(jià)研究
FMS與YBT相關(guān)性的實(shí)證研究
SBR改性瀝青的穩(wěn)定性評(píng)價(jià)
石油瀝青(2021年4期)2021-10-14 08:50:44
2020年國內(nèi)翻譯研究述評(píng)
遼代千人邑研究述論
中藥治療室性早搏系統(tǒng)評(píng)價(jià)再評(píng)價(jià)
視錯(cuò)覺在平面設(shè)計(jì)中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
新版C-NCAP側(cè)面碰撞假人損傷研究
基于Moodle的學(xué)習(xí)評(píng)價(jià)
關(guān)于項(xiàng)目后評(píng)價(jià)中“專項(xiàng)”后評(píng)價(jià)的探討
主站蜘蛛池模板: 最新午夜男女福利片视频| 欧美国产日韩另类| 亚洲国产精品日韩av专区| 精品日韩亚洲欧美高清a| 亚洲成a∧人片在线观看无码| 亚洲国产天堂在线观看| 一本一道波多野结衣av黑人在线| 欧美性色综合网| 成人一级黄色毛片| 97人妻精品专区久久久久| 超级碰免费视频91| 欧美www在线观看| 欧美色亚洲| 自拍偷拍一区| 91精品福利自产拍在线观看| 免费一级无码在线网站| 国产欧美日韩va| 精品亚洲国产成人AV| 国产福利微拍精品一区二区| 国产精品永久久久久| 色亚洲激情综合精品无码视频| 国产99热| 又黄又湿又爽的视频| 一级毛片无毒不卡直接观看| 成人毛片在线播放| 国产亚洲精品91| 毛片久久久| 日韩毛片免费| 久久动漫精品| 九九热在线视频| 亚洲美女视频一区| 欧美劲爆第一页| 日韩天堂在线观看| 激情成人综合网| 亚洲一级毛片在线观播放| 欧美激情网址| 免费在线看黄网址| 欧美日韩一区二区三区四区在线观看| 亚洲第一成年人网站| 亚洲人在线| 午夜免费视频网站| 18黑白丝水手服自慰喷水网站| 99手机在线视频| 日韩欧美中文| 欧美精品高清| 日韩在线中文| 亚洲精品片911| 精品欧美视频| 久久一本日韩精品中文字幕屁孩| 国产黄在线免费观看| 国产精品福利社| 成人字幕网视频在线观看| 亚洲人成日本在线观看| 久久综合干| 亚洲三级成人| 亚洲综合一区国产精品| 99国产精品一区二区| 欧美区国产区| 在线观看亚洲天堂| 婷婷综合在线观看丁香| 久青草免费在线视频| 麻豆精品在线视频| 高清无码一本到东京热| 91极品美女高潮叫床在线观看| 国产一区亚洲一区| 国产91色| 亚洲男人的天堂在线| 国产欧美日韩91| 国产一级在线观看www色| 精品国产成人三级在线观看| 69视频国产| 成人国产精品网站在线看| 欧美日韩成人在线观看 | 国产综合精品一区二区| 久久久久久久久18禁秘| 亚洲欧美国产视频| 69免费在线视频| 性69交片免费看| 亚洲日韩精品无码专区| 91视频青青草| jijzzizz老师出水喷水喷出| 99热国产这里只有精品9九|