999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

海量學術文獻資源的知識挖掘技術與模式

2017-01-26 16:59:36方婷
中國中醫藥圖書情報雜志 2017年4期
關鍵詞:圖書館資源用戶

方婷

安徽省蕪湖市圖書館,安徽 蕪湖 241000

海量學術文獻資源的知識挖掘技術與模式

方婷

安徽省蕪湖市圖書館,安徽 蕪湖 241000

知識挖掘技術是采集檢索海量學術文獻資源所必需具備的。文章分析了知識挖掘的四大關鍵技術:聯機分析挖掘技術、Web挖掘技術、數據倉庫技術和信息可視化技術,重點研究了海量學術文獻資源的用戶知識挖掘和學科知識挖掘模式,詳細探討了海量學術文獻資源知識挖掘創新模式:知識服務、Lotus知識發現、綜合知識挖掘。

海量學術文獻資源;知識挖掘;知識發現

圖書館海量學術文獻資源知識管理已經從手工管理、計算機管理向網絡化管理改進,目前圖書館領域的研究熱點就是智能化、個性化管理。通過對讀者的查找計劃,比如想要做什么、對什么感興趣等進行推理,為讀者提供所需的知識。海量學術文獻資源數據庫中的知識挖掘主要是用一些復雜的統計分析及模型技術,在大量的數據和信息中篩選出不清楚、不被人們理解的信息,最終轉化為可利用的信息。通過挖掘技術對數據庫中的數據進行處理,重新獲得有價值的信息資源[1]。

知識挖掘是通過數據挖掘完成的,即新知識=數據+已有知識+目標。在知道讀者的需求后,通過數據分析,加上原來已有的知識進行計算,幫助讀者得到他們之前不知道的知識。知識挖掘使人們找尋知識不再困難。現代圖書館可以根據人們對知識的需求程度,對原理、知識信息等進行重新整理、規劃,提取出最主要的、對人們有用的且容易識別的信息。本文的研究目的在于通過圖書館館藏的海量學術文獻資源進行知識挖掘,從而提高館藏資源的開發與利用效率。

1 利用知識挖掘技術的必要性

1.1 采集海量學術文獻資源信息所必需

現在人們對圖書的需求量越來越多,知識面越來越廣,對知識以及閱讀的需求量更加多樣化。圖書館購買圖書的費用降低,加大了采購的難度[2]。圖書館自動化功能可以產生很多對采購有用的數據,但是只有那些數據還是不能直接進行采購,需要應用知識挖掘技術,統計各種數據,比如尋找專家、查找光盤、調查書籍借還速度等[3]。知識挖掘技術幫助采購人員得到很多有價值的信息,是采購工作不可缺少的環節。知識挖掘技術在網絡上的圖書館智能化系統可以幫助采購人員通過網上合作采購書刊,起到預測信息以及決策分析的作用。

1.2 檢索海量學術文獻資源信息所必需

信息檢索方式從索引檢索、打孔穿卡片檢索已經發展到現在的計算機信息檢索[4]。在大數據時代,人們需要信息檢索更加完整、正確并且快速,而智能檢索技術可以通過預測讀者需求,快速提供檢索結果[5]。知識挖掘技術通過復雜的數據分析,從海量信息中統計出對人們有用的信息,經過數據庫進一步的處理,用機器學習的方法從其中得到有用信息。通過知識挖掘,特別是知識挖掘的分支——文本挖掘及Web挖掘技術得到文本中的有用信息,再把這些信息通過動態方式展現給讀者,滿足讀者要求。同時,它還可以與計算機存儲、組織、管理、使用的領域的本關理論、知識事實數據進行交換、聯系、集合,這用戶提供個性化服務。

2 知識挖掘的關鍵技術

2.1 聯機分析挖掘技術

聯機分析挖掘技術(OLAM)由聯機分析處理(online analytical processing, OLAP)及數據挖掘(data mining, DM)組成,OLAP和DM是通過數據倉庫技術發展而來的信息分析和挖掘工具[6],二者相輔相成。OLAP通過多維數據進行分析,和數據倉庫原有的數據取長補短。OLAP分析主要是通過數據庫對模型進行剖析、旋轉等方式來得到有用的信息,給決策者提供幫助。多維結構是OLAP的重要組成部分,多維結構里面的維不僅僅指的是三維,還可以是超立方體和多立方體的一些結構。OLAP有2個顯著特征:一方面是在線性,就是能很快感應到讀者的需求;另一方面是多維性,對統計分析、整理后的數據再進行多維分析。DM數據挖掘分為2個步驟:建立模型和預測結果,通過對各種信息源尤其是最原始的數據進行挖掘。

2.2 Web挖掘技術

現在網絡在技術應用、規模復雜程度等方面都有突飛猛進的發展,包括多行業的內容信息、廣泛的超鏈接信息還有Web自身頁面的訪問及使用信息。Web挖掘指的是通過數據挖掘技術從Web文檔以及Web活動中抽取出人們感興趣的、對人們有幫助的信息。

Web挖掘分為3種類型[7]:⑴Web內容的挖掘。對Web自身頁面的內容進行挖掘,主要通過對非結構化的數據,像文本、音頻、視頻以及圖形圖像等多種數據結合的信息進行挖掘。⑵Web結構的挖掘。通過對Web頁面之間的結構來進行挖掘,通過對WWW之間的組織結構以及連接間的關系來推理知識,例如HITS算法即屬于對Web結構的挖掘。⑶Web使用信息的挖掘。通過Web日志文件及相關數據,對用戶查看Web時留下的記錄進行挖掘,從而發現人們查找Web頁面的規律及模式。

2.3 數據倉庫技術

數據倉庫是由面向主題的、集成的、穩定的、并且隨時間變化而變化的數據組成的,對經營管理起決策性作用。一方面,數據倉庫用來支持決策,對分析型數據進行處理,與現在數據庫的操作模式不一樣;另一方面,數據倉庫對不同主題、不同來源的數據庫進行重新組合。

數據倉庫系統由4個方面組成:⑴數據源,是數據倉庫系統的基本組成部分。⑵數據的存儲與管理。是數據倉庫系統的主要組成部分,對數據庫的管理起到了關鍵性的作用。⑶OLAP服務器。通過對有用的數據進行分析,按照多維模型結構進行重組,有利于朝更廣、更深層次的方向發展,從而發現未來的走向。⑷前端工具,是由各種報表工具、查詢工具、數據分析工具、數據挖掘工具等組成。其中數據分析工具主要是針對OLAP服務器的,報表工具、數據挖掘工具是在數據倉庫中使用。

2.4 信息可視化技術

信息可視化技術是信息科學非常重要的一部分,正向信息的知覺化、感知化方向發展。信息可視化應用領域非常廣,由信息的抽取和描述、人工和機器的交換、數據的挖掘、制圖學和成像學等組成[8]。信息可視化能把抽象的數據以及文字信息通過二維或者多維模式體現出來。在對信息進行可視化處理時,能夠看出數據的屬性,那些不容易發現的數據之間的關系也能清晰地體現出來,用戶可獲得更豐富的信息資源。

3 海量學術文獻資源的知識挖掘模式

知識挖掘是從海量學術文獻資源中挖掘出有用的信息,再對相同類型的數據元進行比較、處理及分類等,得出他們之間的某些關系,從而生成、獲得更多的知識信息。

3.1 用戶知識挖掘

因為讀者有需求才有個性化的服務,只有足夠了解讀者的需求,才可能設計、構思出能夠滿足讀者要求的更高層次的知識信息。

用戶知識可以分為3類:可以滿足用戶需要的知識、本身出自用戶的知識和與用戶相關的知識,每種知識都有各自的特征。能滿足人們要求的知識是指圖書館能夠給用戶提供的知識;本身出自用戶的知識是指用戶表達的知識信息,是在利用圖書館時向工作人員所反饋的信息;與用戶相關的知識是指用戶在圖書館時需要的信息。用戶知識挖掘為圖書館的發展打下良好的基礎,充分了解用戶,把圖書館的管理水平和人們的知識需求相結合,就會形成滿足人們需要的個性化服務。

知識挖掘非常顯著的特征就是它能把一些人們沒有表達清楚的信息挖掘出來,再通過這些信息點預測未來的發展走向。

知識挖掘通過對用戶需要什么知識、曾經訪問過的記錄和某種行為,將這些知識再重新整理、分類、規劃,形成一個用戶知識的海洋,利用反饋出來的信息,來推測人們以后對知識的需求會往什么方向發展,根據這些推測,圖書館便能開發出符合人們要求的不同類型的知識。通過時間的不同、需要信息的種類不同,把知識種類進行歸納整理、分類劃分,從而滿足人們的信息需求。

3.2 學科知識挖掘

和用戶知識挖掘相似,學科知識挖掘主要是通過挖掘技術對學科進行某種分析,得到某些不容易發現的知識,再形成面向學科的專業知識的海洋。可以觀察不知道的那些知識他們之間的某種關系,從而進行整理。

學科知識挖掘由5個部分組成:⑴信息采集。知識挖掘的主要目的是研究和學科有關的信息。資源信息的采集大部分都是從簡單到復雜,先整理出自身圖書館的信息資源,再慢慢向其他圖書館、網絡機構等進行擴展。⑵信息過濾。指對這些信息進行篩選,再通過各種信息之間的關系進行歸類整理。⑶信息匯總。把相同類型的學科知識信息進行整理,形成信息庫。⑷信息提供。針對不同用戶的不同需求提供信息。⑸反饋評價。知識挖掘非常重要的步驟。通過人們反饋的意見,對知識挖掘各方面進行改進。

4 海量學術文獻資源知識挖掘創新模式

4.1 知識服務

知識服務是通過把一些知識進行重新整理、分類,組成新的知識,以滿足不同用戶對知識的不同需求。高校數字圖書館利用查找、整理信息的能力,來實現自身的價值。

圖書館提供知識服務,還需要有更加完善的管理機制,豐富館藏資源,加強館際合作,對各種信息整合、規范,提升完成知識服務的能力。

4.2 Lotus知識發現

Lotus是一種新的知識挖掘方式,主要通過知識倉庫完成。前端的 Lotus知識工作站是最基礎的關于Web的知識信息解決,它融合了Lotus先進的門戶技術、實時協作平臺以及群組共同協作完成方案等核心的協作工具與服務,把應用、團隊協作服務和個人服務融合在一起,通過把“人物、地點和事件”這三個不同的知識信息相融合,群組之間的相互協作,讓工作人員通過 LotusNotes客戶端或瀏覽器進行訪問,從而發現、使用和實現知識間的相互傳遞。后臺的 LotusNotes服務器可總結出“人物、地點和事件”三者的關系,從存儲在企業的文檔、數據庫、電子郵件、Web和 ERP(企業資源計劃)等業務系統的信息庫中得到自己想要的知識。

4.3 綜合知識挖掘

雙庫協同知識發現(KDD&K)是數據庫和知識庫的綜合知識挖掘系統,使知識之間相互組合以及知識增加,系統深度知識也是通過它來完成和實現深化。KDD&K系統主要是將原來數據間的關系,再通過分析、歸納、整理,從而發現更深層次的知識,即具有無窮盡的知識。KDD&K系統使用很多種推理方法,發現的知識是有價值的并且人們能夠理解的。因為數據和知識本來就是截然不同的 2個概念,KDD&K過程非常復雜并且會有很多方法和途徑的,它和數據庫、數據倉庫、知識庫的組織、以及人們對最終想要的知識類型息息相關,需要KDD&K必須具備很強的知識挖掘能力。

5 結語

知識挖掘的目的是通過最新的智能型工具找到隱藏在海量學術文獻資源中的隱性知識,再形成專業的知識庫和知識倉庫。對圖書館館藏的海量學術文獻資源進行知識挖掘研究,有利于促進館藏學術資源的有效開發與利用,從而進一步提升圖書館服務質量。

[1] 鄭立新.論圖書館員工隱性知識挖掘[J].現代情報,2010,30(3):29-31.

[2] 蔡皎潔,張玉峰.企業電子商務中客戶知識挖掘模型研究[J].江蘇商論,2012(8):52-55,83.

[3] 王峰,汪華方.數字圖書館信息檢索技術的智能化發展趨勢[J].現代情報,2008,28(11):93-95,99.

[4] 蔡皎潔.Web環境下的語義挖掘模型研究[J].情報理論與實踐,2015,38(5):121-124,111.

[5] 張春燕,覃海生.數據挖掘在多媒體資源庫建設中的應用[J].無線互聯科技,2015(14):138-139.

[6] 鐘文一.大數據時代下的圖書館數據挖掘和情報分析研究——以中文發現系統為例[J].教育觀察,2014,25(3):88-91.

[7] 龐觀松,張黎莎,蔣盛益.跨語言智能學術搜索系統設計與實現[J].山東大學學報(工學版),2011,41(5):63-68.

[8] 凃寓,王志彥.淺談資源發現系統在圖書館服務中的現狀與趨勢[J].圖書情報論壇,2014(5):55-58.

Knowledge Mining Technology and Modes of Huge Amounts of Academic Literature Resources

FANG Ting
(Library of Wuhu City Anhui Province, Wuhu Anhui 241000, China)

In this thesis, the necessity of applying knowledge discovery techniques to collecting huge amounts of academic literature resources is analyzed at first. The four key knowledge discovery techniques are then introduced: online analytic mining (OLAM) technique,Web mining technique, data warehouse(DW)technique, and information visualization technique. User knowledge mining mode and subject knowledge mining mode of huge amounts of academic literature resources are further studied empirically. At last,innovative knowledge mining modes of huge amounts of academic literature resources are discussed in details:knowledge service mode, Lotus knowledge discovery mode, and comprehensive knowledge mining mode.

huge amounts of academic literature resource; knowledge mining; knowledge discovery

G250.7

:A

:2095-5707(2017)04-0007-04

2017-03-13)

2017-04-11;編輯:魏民)

方婷.海量學術文獻資源的知識挖掘技術與模式[J].中國中醫藥圖書情報雜志,2017,41(4):7-10.

10.3969/j.issn.2095-5707.2017.04.003

方婷,館員,研究方向為閱讀推廣、少兒親子閱讀。E-mail: whtsgft@yeah.net

猜你喜歡
圖書館資源用戶
基礎教育資源展示
一樣的資源,不一樣的收獲
資源回收
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
飛躍圖書館
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
圖書館里的是是非非
主站蜘蛛池模板: 国产欧美中文字幕| 亚洲一区二区三区国产精品 | 毛片最新网址| 国产女人爽到高潮的免费视频| 亚洲男人的天堂在线观看| 波多野结衣一区二区三区四区| 国产69精品久久久久孕妇大杂乱 | 一区二区理伦视频| 成人精品视频一区二区在线| 波多野结衣久久高清免费| 呦女精品网站| 日韩AV无码免费一二三区| 国产呦视频免费视频在线观看| 日本一区二区三区精品AⅤ| 91精品啪在线观看国产91| 国产丰满成熟女性性满足视频| 免费av一区二区三区在线| 亚洲Aⅴ无码专区在线观看q| 最新无码专区超级碰碰碰| 美女潮喷出白浆在线观看视频| 国产视频入口| 大陆国产精品视频| 91系列在线观看| 91亚洲精品第一| 国产SUV精品一区二区6| 精品91自产拍在线| 国产精品白浆在线播放| 成人国产一区二区三区| 色AV色 综合网站| 国产美女无遮挡免费视频网站 | 亚洲综合极品香蕉久久网| 日本不卡在线播放| 欧美日韩中文国产| 亚洲大学生视频在线播放| 国产性猛交XXXX免费看| 成人午夜天| 色偷偷av男人的天堂不卡| 成人毛片免费在线观看| 久久亚洲高清国产| 国产麻豆aⅴ精品无码| 亚洲视频免| 99re热精品视频中文字幕不卡| 日韩毛片基地| 久久久久青草大香线综合精品| www.亚洲一区| 成·人免费午夜无码视频在线观看| 日本高清免费一本在线观看| 国产爽妇精品| 久久特级毛片| 国产91熟女高潮一区二区| 国产精品免费露脸视频| 性69交片免费看| 亚洲狠狠婷婷综合久久久久| 亚洲高清中文字幕| 国产乱人伦AV在线A| 久久无码av三级| 久精品色妇丰满人妻| 欧美在线黄| 色亚洲激情综合精品无码视频| 国产电话自拍伊人| 亚洲人成网站色7799在线播放| 日韩a级毛片| 黄色片中文字幕| 日本不卡免费高清视频| 无码区日韩专区免费系列 | 香蕉视频在线观看www| 福利姬国产精品一区在线| 在线免费观看a视频| www亚洲精品| 2021国产精品自产拍在线观看| 91丨九色丨首页在线播放| 欧美日韩另类在线| 国产精品自在拍首页视频8| 国产美女久久久久不卡| 高清无码一本到东京热| 国产噜噜噜| 91麻豆精品视频| 久久久亚洲国产美女国产盗摄| 日韩精品一区二区三区免费| 伊人久久精品无码麻豆精品| 日韩免费中文字幕| 国产成人免费手机在线观看视频|