999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用研究

2014-12-30 11:13:56劉玫
科技創(chuàng)新導(dǎo)報 2014年31期
關(guān)鍵詞:數(shù)據(jù)挖掘應(yīng)用研究

劉玫

摘 要:21世紀(jì)是數(shù)字化、科技化的時代,數(shù)據(jù)挖掘技術(shù)在為實現(xiàn)數(shù)字化提供了有力支持,該文不僅對數(shù)據(jù)挖掘技術(shù)、數(shù)字圖書館的基本概念做出了闡述,而且研討了數(shù)據(jù)挖掘在數(shù)字化圖書館運營管理當(dāng)中的應(yīng)用問題,表明數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館中應(yīng)用的重要性。

關(guān)鍵詞:數(shù)據(jù)挖掘 ?數(shù)字圖書館 ?應(yīng)用研究

中圖分類號:G25 文獻標(biāo)識碼:A 文章編號:1674-098X(2014)11(a)-0193-01

在現(xiàn)代科技帶動下,圖書館也向信息化、自動化與數(shù)字化的方向邁進。數(shù)據(jù)挖掘就是在這個時代應(yīng)運而生的,如今,它已經(jīng)在金融業(yè)、銷售業(yè)、建筑業(yè)等行業(yè)取得了許多成功,為這些領(lǐng)域的更快更好發(fā)展立下了汗馬功勞。目前,互聯(lián)網(wǎng)上的數(shù)字圖書館數(shù)量與日俱增,因此數(shù)字圖書館的數(shù)據(jù)挖掘技術(shù)就具有很重要的意義。數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館中的應(yīng)用,將為數(shù)字圖書館在圖書資源組織管理、服務(wù)質(zhì)量的提升與服務(wù)方式的擴展等方面提供有力的技術(shù)支持。

1 數(shù)據(jù)挖掘概述

數(shù)據(jù)挖掘這個技術(shù)是近幾年來從計算機科學(xué)研究中發(fā)展出來的一個分支學(xué)科。具體是指從海量數(shù)據(jù)中提取或挖掘出隱藏的信息。所有信息載體或信息存儲上都可以使用數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘的整個過程是由準(zhǔn)備數(shù)據(jù)、數(shù)據(jù)采集、顯示結(jié)果與解釋分三個部分組成的。整個采集過程是對數(shù)據(jù)的循環(huán)精練過程,離不開人為的操作。數(shù)據(jù)挖掘技術(shù)大大降低了從大型數(shù)據(jù)庫中挖掘出有用信息的難度,采集人員并不需要有很強的數(shù)據(jù)分析和數(shù)據(jù)統(tǒng)計的能力。數(shù)據(jù)挖掘與知識挖掘既存在一定聯(lián)系,同時又有一些差別。通常認(rèn)為數(shù)據(jù)挖掘是知識挖掘過程的一個基本過程,它采用特定算法把數(shù)據(jù)從數(shù)據(jù)庫中采集出來的模式,最后再經(jīng)過系統(tǒng)解釋與翻譯功能把這種模式變換成用戶能夠理解的信息。另外,數(shù)據(jù)挖掘的過程是隨機發(fā)生的,用戶預(yù)先不能知道結(jié)果;信息檢索的初衷是幫助用戶從大量數(shù)據(jù)中挖掘出滿足其查詢條件的信息,而數(shù)據(jù)挖掘是把文檔內(nèi)隱藏的知識提取出來。這兩個系統(tǒng)是相輔相成的。因此可以利用數(shù)據(jù)挖掘的研究結(jié)果來提高信息檢索的效率與準(zhǔn)確度,優(yōu)化檢索結(jié)果的顯示,使信息檢索系統(tǒng)更優(yōu)良、更全面。

2 數(shù)字圖書館的定義

如今對掘數(shù)字圖書館的定義有很多,總體概括起來,數(shù)字圖書館就是依靠計算機互聯(lián)網(wǎng)絡(luò)、信息檢索技術(shù)、圖書分類技術(shù)、管理等技術(shù),把圖書整理、保存、保護、數(shù)字信息收集與使用等功能融于一體的綜合智能數(shù)字信息管理與服務(wù)中心,這里包含了計算機網(wǎng)絡(luò)、人工智能、數(shù)據(jù)庫、圖書情報學(xué)等最新技術(shù)。數(shù)字圖書館是基于本著盡最大可能滿足用戶的所有需要,方便用戶使用的宗旨,向用戶提供能夠滿足特定需求的優(yōu)質(zhì)服務(wù),同時它又能夠培養(yǎng)用戶個性,引導(dǎo)用戶的需求,這種方式大大促進的現(xiàn)代圖書館的發(fā)展。促進人類文明的進步。如今國內(nèi)外數(shù)字圖書館的數(shù)量顯著增加,對信息服務(wù)系統(tǒng)的研究也越來越深入,信息服務(wù)的應(yīng)用也更加廣泛。

3 數(shù)據(jù)挖的功能特性

(1)聚類。聚類就是把所有數(shù)據(jù)個體根據(jù)它們所具有的相同特點歸納在一起,形成一組具有特定屬性的數(shù)據(jù)群組,同種類聚類就是把同一種類的數(shù)據(jù)放在一起,不同類聚類則是把不同種類的數(shù)據(jù)放在一起。,這樣就能反映出同種事物的共同屬性與不同事物間的差異屬性。通過這種方式,數(shù)據(jù)庫中的數(shù)據(jù)就會被劃分成許多有特定屬性的子集。

(2)關(guān)聯(lián)分析。它反映了各數(shù)據(jù)單元間關(guān)聯(lián)的信息,如果一組數(shù)據(jù)多項屬性都存在關(guān)聯(lián),那么其中某一項的屬性就可根據(jù)其他一些屬性來判斷分析。

(3)概念描述。概念描述就是對某類對象的本質(zhì)進行探討分析,并總結(jié)這類對象的相關(guān)特點,概念描述有區(qū)別描述與特征描述兩種,前者描述不同類對象間的差別,后者則是描述某類對象的相同特征,最后形成一個類的特征性描述,并且只涉及這類對象中全部對象的共同特性。

(4)預(yù)測趨勢與行為。數(shù)據(jù)挖掘系統(tǒng)能夠以時間為依據(jù),從過去或當(dāng)前的大型數(shù)據(jù)庫中自動挖掘未知信息來預(yù)測以后的信息。

(5)偏差檢測。數(shù)據(jù)庫中的數(shù)據(jù)也會發(fā)生錯誤,從數(shù)據(jù)庫中檢測這些錯誤是非常重要的,因為錯誤中也包括許多隱藏的信息。

4 數(shù)據(jù)挖掘在數(shù)字圖書館中的應(yīng)用

數(shù)字圖書館旨在將不同區(qū)域不同屬性的數(shù)字信息資源進行整合從而達到用戶共享的效果。它主要是一種通過數(shù)字技術(shù)將信息進行整合處理從而使得用戶方便瀏覽。根據(jù)處理對象的屬性差異,可以把數(shù)字圖書館數(shù)據(jù)挖掘基本分為三類:結(jié)構(gòu)挖掘、內(nèi)容挖掘與用戶使用記錄挖掘。結(jié)構(gòu)挖掘是從web文檔中結(jié)構(gòu)下手,除文檔中的超鏈接結(jié)構(gòu),更對文檔內(nèi)部結(jié)構(gòu)以及目錄路徑結(jié)構(gòu)進行挖掘。內(nèi)容挖掘即對web文檔中的內(nèi)容信息進行挖掘。而用戶使用記錄挖掘則是對于一些服務(wù)器上的用戶注冊信息購買記錄等數(shù)據(jù)進行挖掘。

4.1 進行結(jié)構(gòu)挖掘

對數(shù)字圖書館等結(jié)構(gòu)挖掘主要是通過網(wǎng)頁的鏈接和組織結(jié)構(gòu)從而能夠發(fā)現(xiàn)圖書館頁面的結(jié)構(gòu)模式并且對此進行分類和聚類并加以分析,這樣可以使得更好的對網(wǎng)絡(luò)建設(shè)提供指導(dǎo)以及方便通過超鏈接等方式從而分析各學(xué)術(shù)未來發(fā)展。

4.2 進行內(nèi)容挖掘

內(nèi)容挖掘主要包含如下幾點,首先是組織文獻數(shù)據(jù)。通過對數(shù)字圖書館內(nèi)文件的組織分類,將其分為若干個組,充分區(qū)分好各個組所涉及的內(nèi)容。這樣就可以大大縮短用戶搜索所需時間,用更短的時間找到更準(zhǔn)確的內(nèi)容。第二是對特征的自動提取和描述。可以由一個內(nèi)容分析器來從中分析并且提取充相關(guān)的內(nèi)容特征,用戶采取提取特征后才能更加準(zhǔn)確快速的實現(xiàn)信息定位。其三是自動采集整理專題信息。這主要是通過對圖書管內(nèi)的海量信息進行了解,并且能夠從中挖掘到一些有規(guī)律的信息反映給用戶,從而使得用戶無需瀏覽大量無用信息,能夠自動捕捉提取概要信息。

4.3 進行用戶使用記錄挖掘

由數(shù)字圖書館的海量訪問信息中歸納出圖書館用戶的訪問規(guī)律信息,運用關(guān)聯(lián)性法則與聚類法則,將不同類型用戶需求進行分類總結(jié),提供針對服務(wù),從而提高瀏覽速度優(yōu)化用戶體驗。同時還應(yīng)當(dāng)鼓勵用戶建立自己的Web站點從而更好的了解到使用數(shù)字圖書用戶的了解意向,更能由此推析出未來發(fā)展趨勢,進而研究出其行為規(guī)律。

5 結(jié)語

通過將數(shù)據(jù)挖掘技術(shù)引入數(shù)字圖書館這一舉措,能夠大大提高數(shù)字圖書館的信息資源量,優(yōu)化圖書館的信息服務(wù)的質(zhì)量,用戶可以更方便、更多的獲取想要的知識,同時圖書館的業(yè)務(wù)范圍也將得到大幅度擴展,為圖書館帶來巨大的經(jīng)濟與社會效益,達到雙贏的效果。但數(shù)據(jù)挖掘終究是一種新興的智能科技產(chǎn)物,它的發(fā)展還是有很多挑戰(zhàn)與難題需要面對。如何將數(shù)據(jù)挖掘系統(tǒng)更好的應(yīng)用到數(shù)字圖書館中還需要進一步的探討與研究。

參考文獻

[1] 周文云.數(shù)據(jù)挖掘在數(shù)字圖書館個性化服務(wù)中的研究與應(yīng)用[J].軍民兩用技術(shù)與產(chǎn)品,2012(1):56.

[2] 田瑞雪.國內(nèi)圖書館數(shù)據(jù)挖掘技術(shù)應(yīng)用研究述評[J].科技信息,2014(1):167.

[3] 付紅偉,盧春,周楊.數(shù)據(jù)挖掘技術(shù)及其在數(shù)字圖書館中的應(yīng)用[J].軟件導(dǎo)刊,2013(1).endprint

猜你喜歡
數(shù)據(jù)挖掘應(yīng)用研究
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
現(xiàn)代機械制造工藝與精密加工技術(shù)的應(yīng)用分析
“黑農(nóng)”大豆育種技術(shù)及應(yīng)用研究
進駐數(shù)字課堂的新興教學(xué)媒體
AG接入技術(shù)在固網(wǎng)NGN的應(yīng)用研究
空域分類關(guān)鍵技術(shù)及應(yīng)用研究
分層教學(xué),兼顧全體
考試周刊(2016年76期)2016-10-09 08:38:18
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
主站蜘蛛池模板: 美女视频黄频a免费高清不卡| 一级毛片网| 任我操在线视频| 色香蕉影院| 欧美一区二区三区国产精品| 久青草国产高清在线视频| 91亚瑟视频| 日韩精品毛片人妻AV不卡| 久久久久人妻一区精品| 国产一级裸网站| 国产 在线视频无码| 免费av一区二区三区在线| 国产呦视频免费视频在线观看| 国产jizz| 国产迷奸在线看| 国产丰满成熟女性性满足视频| 久久综合伊人 六十路| 国产精彩视频在线观看| 91九色国产在线| 亚洲国产高清精品线久久| 国产视频入口| 国产精品极品美女自在线网站| 在线观看国产精美视频| 国产日本欧美亚洲精品视| 国产屁屁影院| 欧美中文字幕第一页线路一| 无码高潮喷水在线观看| 国产自在自线午夜精品视频| 国产成人精品第一区二区| 久久国产精品麻豆系列| 麻豆AV网站免费进入| 亚洲最大在线观看| 国产aaaaa一级毛片| 国产靠逼视频| 全午夜免费一级毛片| 91福利片| 色网在线视频| 一边摸一边做爽的视频17国产| a亚洲视频| 精品免费在线视频| 国产精品漂亮美女在线观看| 久久77777| 亚洲精品免费网站| 色综合天天娱乐综合网| 久久精品人人做人人爽| 国产欧美日韩精品第二区| 久热精品免费| 久久久四虎成人永久免费网站| 极品国产在线| 亚洲国产理论片在线播放| 国产亚洲欧美在线专区| 国产精品第5页| 午夜国产大片免费观看| 日韩精品一区二区三区中文无码| 性色在线视频精品| 成人伊人色一区二区三区| 97视频精品全国在线观看| 男女男精品视频| 日韩精品少妇无码受不了| 亚洲日韩第九十九页| 国产高颜值露脸在线观看| 亚洲熟女中文字幕男人总站| 永久在线精品免费视频观看| 91亚洲精选| 凹凸精品免费精品视频| 99精品国产自在现线观看| 高潮毛片无遮挡高清视频播放| 久久91精品牛牛| 高清久久精品亚洲日韩Av| 亚洲人成人伊人成综合网无码| 国产91精品调教在线播放| 午夜精品久久久久久久99热下载| 激情综合五月网| 婷婷六月综合网| 18禁影院亚洲专区| 91青青草视频在线观看的| 无码精品国产dvd在线观看9久| 一级毛片视频免费| 激情综合网激情综合| 亚洲无线国产观看| 操操操综合网| 在线亚洲精品福利网址导航|