999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺談數(shù)字圖書館與數(shù)據(jù)挖掘

2014-11-12 14:17:08陳紅云
無線互聯(lián)科技 2014年10期
關(guān)鍵詞:數(shù)據(jù)挖掘

陳紅云

摘 要:數(shù)字圖書館技術(shù)的發(fā)展為圖書館服務(wù)質(zhì)量以及服務(wù)模式的提高提供了契機(jī),傳統(tǒng)的圖書館管理模式已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足讀者的借閱需求,讀者不僅僅會專注于本專業(yè)所學(xué)知識、項目開發(fā)以及科研活動的研究。因此,將數(shù)據(jù)挖掘中的各種技術(shù)方法應(yīng)用于圖書信息的挖掘具有非常重要的現(xiàn)實意義。

關(guān)鍵詞:數(shù)字圖書館;數(shù)據(jù)挖掘;數(shù)據(jù)挖掘技術(shù)

1 數(shù)字圖書館研究進(jìn)展

80年代末和90年代初,圖書館自動化向著高度自動化、電子化、網(wǎng)絡(luò)化、虛擬化的深度和廣度進(jìn)軍。進(jìn)入20世紀(jì)90年代,隨著信息技術(shù)的長足進(jìn)步和飛速發(fā)展,隨著Internet的建立和廣泛應(yīng)用,數(shù)字圖書館成為現(xiàn)代圖書館的發(fā)展趨勢。21世紀(jì)初,數(shù)字圖書館及其相關(guān)概念,網(wǎng)絡(luò)環(huán)境下的館藏發(fā)展、采訪、分類、編目等技術(shù)服務(wù)、讀者服務(wù)以及圖書館員素質(zhì)的提高和角色的轉(zhuǎn)換等均成為主要的研究問題。此外,如何對待、處理和解決數(shù)字圖書館從理論走向現(xiàn)實的技術(shù)實現(xiàn)問題也必然成為我們天天要談?wù)摰闹饕掝}。如今很多國內(nèi)外研究人員都致力于數(shù)字圖書館發(fā)展的研究過程中,在對其中各種主要技術(shù)研究一定水平之后,未來數(shù)字圖書館的發(fā)展模式主要集中在三種類型:特種館藏型模式、服務(wù)主導(dǎo)型模式以及商用文獻(xiàn)型模式。數(shù)字圖書館的特點(diǎn)是:收藏數(shù)字化、操作電腦化、傳遞網(wǎng)絡(luò)化、信息存貯自由化、資源共享化和結(jié)構(gòu)連接化。

2 數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘技術(shù)功能以及它們可以發(fā)現(xiàn)的模式類型主要包括以下幾個部分:⑴概念/類描述:特征化和區(qū)分。用簡潔的、匯總的和精確的方式描述各個類和概念,這種描述稱為概念/類描述,而要實現(xiàn)這種描述,就需要采用數(shù)據(jù)區(qū)分和數(shù)據(jù)特征化這兩種方法。數(shù)據(jù)特征化(data characterization)是匯總目標(biāo)類數(shù)據(jù)的一般特性或特征。它的輸出形式包括餅圖、條圖、曲線、多維數(shù)據(jù)立方體和多維表。數(shù)據(jù)區(qū)分是比較目標(biāo)類數(shù)據(jù)對象和一個或多個對比類對象的一般特性。其輸出提供的形式類似于特征化描述;⑵挖掘頻繁模式、關(guān)聯(lián)和相關(guān)。頻繁模式是在數(shù)據(jù)中頻繁出現(xiàn)的模式,主要包括項集、子結(jié)構(gòu)和子序列。對頻繁模式的挖掘可以導(dǎo)致發(fā)現(xiàn)數(shù)據(jù)中有趣的關(guān)聯(lián)和相關(guān)。通常,關(guān)聯(lián)規(guī)則必須同時滿足最小支持度閾值和最小置信度閾值,同時也可以發(fā)現(xiàn)相關(guān)聯(lián)的屬性-值對之間的有趣的統(tǒng)計相關(guān);⑶分類和預(yù)測。分類是找出描述和區(qū)分?jǐn)?shù)據(jù)類或概念的模型(或函數(shù)),以便能夠使用模型預(yù)測類標(biāo)號未知的對象類。導(dǎo)出的模型可以有多種形式,如分類(IF-THEN)規(guī)則、決策樹、數(shù)學(xué)公式或神經(jīng)網(wǎng)絡(luò)。預(yù)測是建立連續(xù)值函數(shù)模型,而分類預(yù)測是用來預(yù)測不知道的或空缺的數(shù)值數(shù)據(jù)值。還有其他方法比如回歸分析是一種統(tǒng)計學(xué)中最常用的數(shù)值預(yù)測方法;⑷聚類分析。與分類和預(yù)測不同的是,聚類事先不知道劃分?jǐn)?shù)據(jù)對象的類標(biāo)號,在這種情況下對象可以根據(jù)類內(nèi)最大化以及類間最小化的相似性原則進(jìn)行分組或者聚類;⑸離群點(diǎn)分析。數(shù)據(jù)庫中存在著與一般行為或模型不一致的一些數(shù)據(jù)對象,這些對象叫做離群點(diǎn)。在大多數(shù)情況下人們都會將其視為噪聲或異常而丟棄。然而在一些具體的應(yīng)用中卻比正常發(fā)生的事件更令人感興趣,比如欺詐檢測,銀行獲取信用卡使用不良記錄者等行為;⑹演變分析。演變分析是描述行為隨時間變化的對象之間的趨勢或規(guī)律,并為其建立模型。這種分析不同于先前所提及的幾種方法,它具體可包括序列或周期模式匹配、時間序列數(shù)據(jù)分析以及基于相似性的數(shù)據(jù)分析等。比如股票交易數(shù)據(jù)挖掘就可以識別整個或者特定公司股票演變規(guī)律,進(jìn)而為股票投資者提供預(yù)測未來股票價格以及市場方向的決策。

3 數(shù)字圖書館中的數(shù)據(jù)挖掘

傳統(tǒng)圖書館是由專門技術(shù)人員或者專家通過以往的經(jīng)驗來安排圖書信息的采集,由于存在著各種主觀性,因此在這種情況下信息就有可能不準(zhǔn)確。而使用數(shù)據(jù)挖據(jù)技術(shù)就會解決上述存在的問題。首先它會充分有效的利用文獻(xiàn)信息,去除過失數(shù)據(jù),使圖書數(shù)據(jù)具有時效性。其次,運(yùn)用數(shù)據(jù)挖掘技術(shù),可以總結(jié)歷史用戶信息來推薦給未來讀者,滿足他們的研究方向和興趣愛好。再者,應(yīng)用數(shù)據(jù)挖掘檢索技術(shù)可以摒棄部分地域、學(xué)校以及文獻(xiàn)類別的束縛,為用戶檢索出最全面而又具有很高使用價值的信息。最后借助數(shù)據(jù)挖掘技術(shù)可以拓寬圖書信息庫,不僅僅局限于某些大型數(shù)據(jù)庫或者數(shù)據(jù)倉庫,它會使個性化服務(wù)推廣到整個網(wǎng)絡(luò),讓讀者獲取最豐富最全面的信息資源。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于數(shù)字圖書館主要從以下幾個方面進(jìn)行挖掘:(1)對數(shù)字圖書館的內(nèi)容進(jìn)行挖掘。基于數(shù)字圖書館的內(nèi)容的挖掘是通過對數(shù)字圖書館信息的模式識別和分析理解,從中發(fā)現(xiàn)有意義的知識。根據(jù)某一領(lǐng)域的信息需求,自動捕捉、采集和整理領(lǐng)域所需信息,過濾無用冗余信息,通過信息推送等方式,直接數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識,提供給讀者,主動提供個性化服務(wù)。(2)對數(shù)字圖書館的用戶進(jìn)行挖掘。從數(shù)字圖書館的大量訪問信息中挖掘用戶的訪問模式、訪問興趣,采用關(guān)聯(lián)性法則和聚類方法發(fā)現(xiàn)不同的用戶群體,然后對這些不同的群體提供信息定制服務(wù)。同時還可以利用web挖掘所得到的信息,動態(tài)地調(diào)整web頁面,更好地滿足讀者的需要。通過對用戶訪問信息、使用信息的挖掘,在數(shù)字對象和用戶、對象分類和主題之間進(jìn)行模式匹配,采用不同挖掘技術(shù)自動提取知識,從而確定個性化服務(wù)內(nèi)容,提高為用戶知識服務(wù)的自動化水平。(3)此外,收集整理圖書館網(wǎng)上咨詢、薦購書刊等欄目中的數(shù)據(jù),利用數(shù)據(jù)挖掘技術(shù),可以預(yù)先發(fā)現(xiàn)讀者群體的興趣,調(diào)整館藏方向,提升館藏資源的針對性。

[參考文獻(xiàn)]

[1]王艷.數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用[J].情報科學(xué).2003(02).

[2]馮進(jìn).利用數(shù)據(jù)挖掘技術(shù) 深入挖掘圖書館工作[J].現(xiàn)代情報.2005(03).

[3]高巨山.數(shù)字圖書館構(gòu)建中的數(shù)據(jù)挖掘應(yīng)用研究[J].圖書館工作與研究. 2009(04).

[4]唐吉深.圖書館數(shù)據(jù)挖掘技術(shù)研究現(xiàn)狀述評[J].圖書館界.2011(01).

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實踐
主站蜘蛛池模板: 女人爽到高潮免费视频大全| 亚洲aaa视频| 99青青青精品视频在线| 久996视频精品免费观看| 国产精品夜夜嗨视频免费视频| 亚洲AV电影不卡在线观看| 在线观看无码av五月花| 91视频国产高清| 色婷婷成人| 99re在线免费视频| 大乳丰满人妻中文字幕日本| 久久性妇女精品免费| 国产91蝌蚪窝| 国产成人久视频免费| 国产黄网站在线观看| 亚洲欧美自拍一区| 国产H片无码不卡在线视频| 亚洲天堂视频在线观看| 欧美日韩高清在线| 亚洲人成网站观看在线观看| 欧美色丁香| 久久综合结合久久狠狠狠97色| 中国丰满人妻无码束缚啪啪| 国产特一级毛片| AⅤ色综合久久天堂AV色综合 | 国产亚洲欧美日韩在线观看一区二区| 欧美在线精品怡红院| 国产精品视频免费网站| 久久国产精品电影| 亚洲av日韩av制服丝袜| 国产视频一二三区| 欧美色视频日本| 久久精品国产亚洲麻豆| 99er精品视频| 欧美日韩午夜| 在线看免费无码av天堂的| 四虎影视永久在线精品| 91免费精品国偷自产在线在线| 亚洲无限乱码| 这里只有精品国产| 午夜不卡福利| 日韩AV无码一区| 97人人模人人爽人人喊小说| 中文无码毛片又爽又刺激| 国产欧美在线观看精品一区污| 伊人久久大香线蕉aⅴ色| 久久久久久尹人网香蕉 | 在线无码九区| 亚洲美女一级毛片| 91伊人国产| 亚洲一级色| 九九九九热精品视频| 成人福利在线看| 91毛片网| 精品福利视频网| 茄子视频毛片免费观看| 99爱视频精品免视看| 国产av一码二码三码无码| 在线综合亚洲欧美网站| 亚洲毛片网站| 亚洲欧美成人网| 国产亚洲高清在线精品99| 亚洲国产日韩一区| 亚洲不卡网| 日韩在线中文| 亚洲中文字幕av无码区| 国产精品深爱在线| 精品一区二区三区中文字幕| 亚洲无码在线午夜电影| 日本五区在线不卡精品| 亚洲欧美日韩综合二区三区| 亚洲精品午夜天堂网页| 午夜三级在线| 国产www网站| 丁香综合在线| 成人亚洲国产| 高清免费毛片| 日本高清免费一本在线观看| 又大又硬又爽免费视频| 草逼视频国产| 亚洲乱码在线视频| 在线高清亚洲精品二区|