999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘在科技信息管理中的應(yīng)用研究

2015-03-10 01:00:48雷文利
關(guān)鍵詞:科技成果數(shù)據(jù)挖掘關(guān)聯(lián)

陶 劍,雷文利

(安陽(yáng)市科學(xué)技術(shù)信息研究所,河南安陽(yáng) 455000)

隨著信息社會(huì)的發(fā)展,科技管理信息化促成信息量大幅增長(zhǎng),同時(shí)對(duì)于信息提取也帶來(lái)難度,提取精確度也不斷提高要求,傳統(tǒng)提取方式越來(lái)越難以滿(mǎn)足在大量數(shù)據(jù)中尋求決策的需求,信息社會(huì)只有借助于信息手段才能適合現(xiàn)代需求,我們可以通過(guò)數(shù)據(jù)挖掘工具發(fā)現(xiàn)海量數(shù)據(jù)背后未知的規(guī)律或模式,同時(shí)為決策層在科學(xué)管理決策時(shí)提供了有力的依據(jù)和有效的支持。

1 數(shù)據(jù)挖掘與關(guān)聯(lián)規(guī)則

“數(shù)據(jù)挖掘”也稱(chēng)為從數(shù)據(jù)中發(fā)現(xiàn)知識(shí),具體來(lái)講就是從大規(guī)模海量數(shù)據(jù)中抽取人們所感興趣的非平凡的、隱含的、事先未知的和具有潛在的模式或知識(shí)。數(shù)據(jù)挖掘的目的是從海量的看似雜亂無(wú)章、毫無(wú)關(guān)聯(lián)的數(shù)據(jù)當(dāng)中將信息集中、萃取和提煉出來(lái),從而找出所研究對(duì)象的內(nèi)在規(guī)律。通過(guò)對(duì)歷史數(shù)據(jù)和當(dāng)前數(shù)據(jù)的分析,發(fā)現(xiàn)隱藏的關(guān)系和模式,進(jìn)而預(yù)測(cè)未來(lái)可能發(fā)生的趨勢(shì)。換句話(huà)說(shuō),數(shù)據(jù)挖掘改變提升了人們對(duì)數(shù)據(jù)信息的應(yīng)用,從最初簡(jiǎn)單的、低層次的數(shù)據(jù)應(yīng)用上升到從大型數(shù)據(jù)中挖掘出有價(jià)值的信息資源,從而最終為決策支持提供依據(jù)。數(shù)據(jù)挖掘的過(guò)程大致可分為問(wèn)題定義、數(shù)據(jù)抽取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、結(jié)果評(píng)估與表示等幾個(gè)階段。現(xiàn)在常用的數(shù)據(jù)挖掘技術(shù)有關(guān)聯(lián)規(guī)則、決策樹(shù)、聚類(lèi)、分類(lèi)、變化和偏差分析、回歸分析、Web頁(yè)挖掘等。

關(guān)聯(lián)規(guī)則作為一種比較重要的數(shù)據(jù)挖掘知識(shí)模式,是指從數(shù)據(jù)庫(kù)中找出置信度(Confidence)和支持度(Support)都大于給定值的強(qiáng)壯規(guī)則,挖掘不同數(shù)據(jù)項(xiàng)集之間的隱藏的關(guān)聯(lián)規(guī)則。Apriori算法是一種最有影響的挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法,是一種基于兩階段頻集思想的遞推算法。它主要是采用逐層搜索的迭代方法,從大量數(shù)據(jù)中找出數(shù)據(jù)項(xiàng)與數(shù)據(jù)項(xiàng)之間的關(guān)系或規(guī)則。Apriori算法的過(guò)程如下:首先設(shè)定最小支持度minsup和最小置信度minconf;其次,遍歷所有事務(wù)集,找出所有的頻繁1項(xiàng)集標(biāo)記為L(zhǎng)1;然后利用L1找頻繁2項(xiàng)集的集合L2,通過(guò)L2找L3,依此類(lèi)推,直至生成所有的頻繁項(xiàng)目集(當(dāng)支持度大于最小支持度時(shí)被稱(chēng)作頻繁項(xiàng)集)。最后從頻繁項(xiàng)目集中找出符合條件的關(guān)聯(lián)規(guī)則。而本文采用Apriori算法對(duì)科技信息之間的關(guān)系進(jìn)行建模和分析,從而找到科技信息之間的關(guān)系和規(guī)律,為科技管理提供決策支持。

2 數(shù)據(jù)挖掘在科技信息管理中的應(yīng)用

隨著信息化在科技系統(tǒng)中的應(yīng)用,科技部門(mén)建立了科技業(yè)務(wù)信息管理系統(tǒng),積累了大量的科技人員、科技項(xiàng)目、科技成果等科技信息。如何找到隱藏這三者之間的深層關(guān)系,發(fā)現(xiàn)其中的相關(guān)規(guī)律,方便科技管理、發(fā)揮數(shù)據(jù)挖掘在科技信息管理的作用,本文通過(guò)構(gòu)建數(shù)據(jù)挖掘模型較好的發(fā)現(xiàn)科研人員與科技項(xiàng)目、科技論文之間的關(guān)聯(lián),并通過(guò)數(shù)據(jù)挖掘從海量的個(gè)體信息中提取到有效的數(shù)據(jù)便于科技管理層參考,提取的各種規(guī)律也可以為合理的分配科技人才和管理科技項(xiàng)目提供參考。本實(shí)驗(yàn)數(shù)據(jù)源選自安陽(yáng)市科技信息管理系統(tǒng),該系統(tǒng)已收集自2006年以來(lái)的科技人員512名,涉及農(nóng)業(yè)、化工、醫(yī)療、教育、衛(wèi)生、環(huán)境等各個(gè)領(lǐng)域;科技成果899項(xiàng);科技項(xiàng)目已達(dá)3014項(xiàng),涉及工業(yè)、農(nóng)業(yè)、成果推廣、國(guó)際合作、軟科學(xué)等類(lèi)型。

數(shù)據(jù)挖掘包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘和結(jié)果分析理解三個(gè)步驟。本文研究的重點(diǎn)是分析科技人員的年齡階段、職稱(chēng)、單位等信息與其所產(chǎn)出的科技成果、參與的科技項(xiàng)目之間的數(shù)據(jù)關(guān)聯(lián)規(guī)則。具體操作如下:

2.1 數(shù)據(jù)準(zhǔn)備

數(shù)據(jù)準(zhǔn)備包括數(shù)據(jù)選擇、數(shù)據(jù)預(yù)處理和數(shù)據(jù)變換等工作。數(shù)據(jù)選擇是從現(xiàn)有的數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中提取相關(guān)數(shù)據(jù),形成目標(biāo)數(shù)據(jù)。本文研究的數(shù)據(jù)庫(kù)由科技人員表、職稱(chēng)表、單位表、科技成果表、科技獎(jiǎng)勵(lì)表、項(xiàng)目表和項(xiàng)目經(jīng)費(fèi)等,并從這部分?jǐn)?shù)據(jù)庫(kù)中選擇數(shù)據(jù),并分別構(gòu)建了科技人員—科技成果、科技人員—科技項(xiàng)目以及科技人員—科技成果—科技項(xiàng)目等數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行挖掘,其基本關(guān)系如圖2所示。

按照數(shù)據(jù)挖掘算法的要求對(duì)所提取到的數(shù)據(jù)進(jìn)行整理,并對(duì)數(shù)據(jù)可能的取值進(jìn)行編碼處理(如表1所示)。通過(guò)精簡(jiǎn)維數(shù)后所建立的科技人員--科技成果--科技項(xiàng)目挖掘表數(shù)據(jù)結(jié)構(gòu)如表2所示。

表1 數(shù)據(jù)可能取值的符號(hào)表示

表2 科技人員—科技成果—科技項(xiàng)目挖掘表數(shù)據(jù)結(jié)構(gòu)

2.2 數(shù)據(jù)挖掘

設(shè)定MinSup=6% ,MinConf=70%時(shí),通過(guò)應(yīng)用Apfiofi

算法對(duì)數(shù)據(jù)進(jìn)行挖掘得到結(jié)果如表3、4和5所示:

表3 科技人員—科技成果關(guān)聯(lián)規(guī)則

表4 科技人員—科技項(xiàng)目關(guān)聯(lián)規(guī)則

表5 科技人員—科技成果—科技項(xiàng)目關(guān)聯(lián)規(guī)則

在表3科技人員與科技成果的關(guān)聯(lián)規(guī)則中,由I03=>I23置信度為89.23可以看出,在參與科技項(xiàng)目并產(chǎn)生科技成果的科技人員當(dāng)中,年齡在40歲-50歲的副高級(jí)工程師占到89.23%;在表4科技人員與科技項(xiàng)目的關(guān)聯(lián)規(guī)則中,由I03I37=>I23置信度為81.08可以看出,年齡在40歲-50歲并且參與重大科技項(xiàng)目的科技人員中副高級(jí)工程師占到81.08%;在表5科技人員、科技成果、科技項(xiàng)目的關(guān)聯(lián)規(guī)則中,由I30I36=>I26+I27置信度為71.42可以看出,在承擔(dān)省級(jí)科技攻關(guān)項(xiàng)目的科技人員中有71.42%的人員申報(bào)了省級(jí)、市級(jí)科技成果。

3 挖掘結(jié)果的分析與對(duì)策

從初步挖掘出的關(guān)聯(lián)規(guī)則中,得到如下幾點(diǎn)結(jié)論:

第一,科技項(xiàng)目負(fù)責(zé)人中大部分為年齡在40-50歲之間的副高級(jí)工程師。由此可見(jiàn),這部分科研人員的研究意識(shí)、科研能力較強(qiáng),應(yīng)加強(qiáng)對(duì)這部分科技人員在科技政策和科技項(xiàng)目的支持和引導(dǎo)。

第二,40歲以上科技人員參與項(xiàng)目并登記的成果在全市研究成果并獲獎(jiǎng)的比重較大,應(yīng)積極引導(dǎo)并發(fā)揮科技項(xiàng)目帶頭人的作用,鼓勵(lì)培養(yǎng)更多科技人員參與項(xiàng)目建設(shè)研究。

第三,畢業(yè)于重點(diǎn)院校、學(xué)歷高的科技人員所產(chǎn)出的科技成果和參與的科技項(xiàng)目的比例相對(duì)于比較高,應(yīng)當(dāng)重視科技人員的深造和繼續(xù)學(xué)習(xí)。

第四,科技人員比重大、有針對(duì)性的基礎(chǔ)應(yīng)用研究的科研項(xiàng)目,其研究開(kāi)發(fā)周期短,且實(shí)際應(yīng)用價(jià)值高,能高效快速地解決企業(yè)、社會(huì)的實(shí)際問(wèn)題,建議加大科技項(xiàng)目中科技人員的比例,在項(xiàng)目選擇時(shí)應(yīng)注重與企業(yè)、社會(huì)的實(shí)際問(wèn)題、需求相結(jié)合。制定相關(guān)的科技政策,鼓勵(lì)引導(dǎo)科技人員更多的參與科技項(xiàng)目,使科技項(xiàng)目具有更高的科技含量,更高的實(shí)用價(jià)值。

科技管理部門(mén)應(yīng)進(jìn)一步加強(qiáng)數(shù)據(jù)挖掘在科技信息管理中的應(yīng)用,將數(shù)據(jù)挖掘的范圍擴(kuò)展到科技企業(yè)、科技論文、科技活動(dòng)、科技獎(jiǎng)勵(lì)、科技創(chuàng)新、科技服務(wù)等領(lǐng)域。一方面,整合安陽(yáng)市現(xiàn)有的科技人員,對(duì)科技人員按照所屬專(zhuān)業(yè)進(jìn)行歸類(lèi),突出科技專(zhuān)家的技術(shù)優(yōu)勢(shì);另一方面,充分收集科技企業(yè)對(duì)科技技術(shù)的需求,加強(qiáng)與高等院校和科研院所的密切合作,引導(dǎo)科技人員與科技項(xiàng)目進(jìn)行雙向選擇,做好科技需求與科技成果對(duì)接,切實(shí)做好科技人員與科技企業(yè)項(xiàng)目之間的橋梁,搭建好企業(yè)、科研人員、項(xiàng)目、成果等信息服務(wù)對(duì)接平臺(tái)。

4 總結(jié)

運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)科技管理信息進(jìn)行分析研究,找出科技管理信息中的隱性知識(shí)和內(nèi)在聯(lián)系,揭示其內(nèi)在隱含規(guī)律并應(yīng)用在實(shí)際的管理工作中,對(duì)科研項(xiàng)目的前期立項(xiàng)管理、科技人員的綜合評(píng)價(jià)、科技成果的評(píng)估等方面都能發(fā)揮重要的作用,對(duì)于進(jìn)一步提升科技信息化管理水平,輔助科技信息管理決策都有積極的促進(jìn)作用。

[1]傅韜,史贄.數(shù)據(jù)挖掘技術(shù)在水利信息化中的應(yīng)用[J],江西水利科技,2009,(1).

[2]劉仕筠,盛志偉,郭本俊.數(shù)據(jù)挖掘在高校教育信息化中的應(yīng)用[J].教育與職業(yè),2009,(2).

[3]袁堂朋.基于用戶(hù)行為模式的Web日志挖掘模型的研究與實(shí)現(xiàn)[D].南京:南京郵電大學(xué),2013.

[4]朱新星 等.高校科技信息數(shù)據(jù)挖掘方法研究[J].中國(guó)農(nóng)業(yè)教育,2009.

[5]唐雪春 等.中醫(yī)藥科技項(xiàng)目電子化管理探索[J].中醫(yī)藥管理雜志,2008.

[6]花開(kāi)明.基于本體的元數(shù)據(jù)互操作在電子政務(wù)中的應(yīng)用研究[D].上海:東華大學(xué),2007.

[7]熊芯.基于粗糙集的數(shù)據(jù)挖掘方法研究[D].哈爾濱:哈爾濱工程大學(xué),2009.

[8]陳寶等.數(shù)據(jù)挖掘技術(shù)在財(cái)產(chǎn)保險(xiǎn)行業(yè)非現(xiàn)場(chǎng)內(nèi)部審計(jì)中的應(yīng)用[D].合作經(jīng)濟(jì)與科技,2013.

猜你喜歡
科技成果數(shù)據(jù)挖掘關(guān)聯(lián)
“苦”的關(guān)聯(lián)
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
打通科技成果轉(zhuǎn)化“最后一公里”
商周刊(2019年1期)2019-01-31 02:36:24
奇趣搭配
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
智趣
讀者(2017年5期)2017-02-15 18:04:18
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
科技成果
航天器工程(2014年6期)2014-03-11 16:36:16
科技成果
航天器工程(2014年5期)2014-03-11 16:36:03
科技成果
航天器工程(2014年4期)2014-03-11 16:35:49
主站蜘蛛池模板: 国产激情影院| 欧美成人综合在线| 无码'专区第一页| 日韩黄色精品| 伊人国产无码高清视频| 日本爱爱精品一区二区| 免费精品一区二区h| 永久天堂网Av| 成人亚洲视频| 国产成人精品视频一区二区电影| 久久精品视频亚洲| 免费无码网站| 欧美激情,国产精品| 亚洲人成成无码网WWW| 国产流白浆视频| 无码啪啪精品天堂浪潮av| 玖玖免费视频在线观看 | 99热这里只有精品5| 日本三区视频| 国产产在线精品亚洲aavv| 亚洲国产成熟视频在线多多| 国产三级韩国三级理| 日韩性网站| 亚洲九九视频| 一本无码在线观看| 久久综合干| 成人在线观看一区| 国模私拍一区二区三区| 伊人网址在线| 免费观看亚洲人成网站| 国产午夜精品一区二区三区软件| 亚洲国产成人精品无码区性色| 日韩精品成人网页视频在线| 婷婷色中文网| 国产女人18水真多毛片18精品 | 熟妇无码人妻| 国产一级无码不卡视频| 日韩在线永久免费播放| 99久久精彩视频| 自拍中文字幕| 久久综合亚洲色一区二区三区| 丁香婷婷综合激情| 91免费片| 欧美国产精品不卡在线观看| 免费又黄又爽又猛大片午夜| 在线观看视频99| 无码中字出轨中文人妻中文中| 71pao成人国产永久免费视频| 91丝袜乱伦| 国产无码精品在线播放| 免费毛片网站在线观看| 亚洲欧美自拍中文| 成人综合久久综合| 精品午夜国产福利观看| 无码AV动漫| 欧美中文字幕一区| 亚国产欧美在线人成| 九九精品在线观看| 亚洲欧美日韩中文字幕一区二区三区| 五月激激激综合网色播免费| 久久99国产视频| 久久99精品久久久久纯品| 福利姬国产精品一区在线| 91精品国产情侣高潮露脸| 亚洲成人动漫在线| 伊人久久久大香线蕉综合直播| 蜜臀AV在线播放| 色爽网免费视频| 亚洲日韩AV无码一区二区三区人| 女同久久精品国产99国| 亚洲欧美日韩久久精品| 精品一区国产精品| 亚洲精品在线影院| 国产精品熟女亚洲AV麻豆| 性色一区| 国产一区亚洲一区| 99999久久久久久亚洲| 欧美一级大片在线观看| www欧美在线观看| 国产乱码精品一区二区三区中文 | 91在线免费公开视频| 国产日本视频91|