999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據分析技術的圖書館信息檢索系統設計與研究

2020-10-13 05:20:56吳云
現代電子技術 2020年19期
關鍵詞:數據處理

吳云

摘? 要: 針對當前圖書館信息檢索系統存在信息檢索誤差大、工作效率低等難題,為了獲得理想圖書館信息檢索結果,設計了一種基于大數據分析技術的圖書館信息檢索系統。首先對圖書館信息檢索系統的功能進行描述,建立了圖書館信息檢索系統的總體框架;然后對圖書館信息檢索的硬件子系統和軟件子系統分別進行了詳細設計,并重點描述了圖書館信息檢索算法;最后在相同實驗條件下,與其他圖書館信息檢索系統做了仿真對比測試。測試結果表明,相對于其他圖書館信息檢索系統,文中系統的圖書館信息檢索精度得到了大幅度的提升,同時加快了圖書館信息檢索速度,可以為學生快速、精確檢測到真正需要的信息,可以應用于實際的高校圖書館管理中,具有較高的實際應用價值。

關鍵詞: 大數據分析技術; 圖書館信息; 檢索系統; 組件設計; 數據處理; 仿真實驗

中圖分類號: TN919.5?34; TP311? ? ? ? ? ? ? ? ? ?文獻標識碼: A? ? ? ? ? ? ? ? ? ? 文章編號: 1004?373X(2020)19?0167?04

Abstract: The current library information retrieval system has some deficiencies, like big information retrieval error and low working efficiency. Therefore, a library information retrieval system based on big data analysis technology is proposed for ideal retrievals. The functions of the library information retrieval system is described, and the general framework is built. Then, its hardware subsystem and software subsystem are designed in detail. Moreover, the algorithm of the library information retrieval is described. Simulation test was performed to compare the proposed system and other systems under the same experimental conditions. The test results show that, in comparison with other library information retrieval systems, the retrieval accuracy of this system is greatly improved and the retrieval speed is accelerated, too. It can quickly and accurately detect the information that the students really need. Therefore, the system has a high practical application value in the practical management of university library.

Keywords: big data analysis technology; library information; retrieval system; component design; data processing; simulation experiment

0? 引? 言

隨著我國科學技術和現代通信技術不斷發展的過程中,圖書館的精準檢索對于創造數字用戶知識具有一定的作用。將傳統模式作為基礎的圖書館,信息組織方式無法呈現信息內部組織關系和邏輯關系,只是以關鍵詞層次信息檢索,無法展現信息內部語義關聯,不規范操作會導致系統結構不兼容,主要是因為圖書館檢索結果偏離用戶的實際需求,從而無法有效的檢索。因此,就要利用全新技術對圖書館傳統信息檢索方式進行創新[1]。

為了獲得理想圖書館信息檢索結果,本文設計了一種基于大數據分析技術的圖書館信息檢索系統。首先建立了圖書館信息檢索系統的總體框架,然后對圖書館信息檢索的硬件子系統和軟件子系統分別進行了詳細設計,最后與其他圖書館信息檢索系統做了仿真對比測試,結果表明,本文系統的圖書館信息檢索精度、速度得到提高,解決了共享使用中的問題。

1? 圖書館信息檢索系統的設計思想

在創建圖書館信息檢索系統過程中,要基于拓展性、實用性、可用性、開放性和持久性,針對用戶選擇檢索方式,確定大數據適用的范圍和使用范圍,通過相應算法,基于工程師和學科專家創建系統框架,從而創建大數據知識庫,實現信息檢索系統的創建[2]。圖書館信息檢索系統的結構如圖1所示。

2? 圖書館信息檢索系統具體設計

2.1? 系統的硬件設計

傳統教學信息檢索的學習行為具備多因素性與繁瑣性,并且檢索信息目的性比較模糊,大量不確定性因素會導致半結構化的問題出現。基于統計學角度分析,傳統教學多媒體信息無法創建檢索模型,基于控制學角度,無法對圖書信息精準跟蹤。因此,基于大數據的圖書館信息檢索系統硬件設計是非常有必要的[3]。

2.1.1? 數據源追溯組件設計

基于大數據分析的圖書館信息檢索硬件系統,數據源追蹤設計主要是跟蹤圖書館多媒體情況,及時收集用戶行為特征數據。此數據源都來源于多媒體服務器終端備忘錄系統,每隔3 min就會自動保存,所以數據收集誤差小,對于數據源跟蹤效果良好。

2.1.2? 數據挖掘組件設計

信息檢索系統設計的重點就是選擇知識庫,知識庫為具備規則性集合體,使用基于數據熵的數據挖掘算法,能夠對不同的有效數據進行挖掘[4]。

假設多媒體信息數據系統[N]為:

式中[a]指的是數據挖掘對象,如果:

那么,對象[p]就相當于[N]的數據挖掘信息:

式中:[H(N)]指的是[N]的信息熵;[Ha(N)]指的是數據挖掘對象[a]之后[N]的信息熵。

在數據挖掘不斷深入的過程中,知識庫會不斷地添加全新的規則對系統智能性進行制約。基于數據熵多媒體信息挖掘設計不僅能夠利用知識庫方式進行展現,還能夠對挖掘數據結果進行解析[5]。

2.1.3? 系統預警組件設計

系統預警設計主要是針對用戶在圖書館中的檢索進度,利用設計的自動推理指標系統評價用戶多媒體學習情況綜合指標,判斷用戶檢索教學多媒體信息情況。假如在某時間段中用戶進度低于標準值70%,就會出現警告信息[6]。

以上述三個組件實現檢索系統設計,得到檢索系統檢索流程,如圖2所示。

通過圖2可以看出,用戶利用圖書館檢索圖書,信息檢索系統備忘錄對用戶查看圖書情況進行記錄,并且收集數據,數據通過預處理后對數據追蹤組件進行傳遞,數據組件利用數據挖掘計算通過知識庫方式充分展現,對挖掘后數據結果進行解析,最終使數據在系統報警裝置中傳輸。如果用戶查看圖書進度落后,將警告系統啟動,完成檢索系統硬件設計[7]。

2.2? 系統軟件設計

2.2.1? 數字資源本體管理模塊

數字資源管理模塊是創建圖書館多媒體信息系統的基礎,主要的功能就是對圖書館信息資源進行組織和處理,滿足用戶使用需求。由技術工程師和專家,通過開發工具和本體語言實現知識信息概念空間的創建,從而創建領域本體。另外,通過領域本體關聯文本信息內容,利用語義模型對信息概念相似度進行計算[8]。

2.2.2? 用戶輸入和智能拓展

以用戶使用自然語言在智能檢索系統所輸入的語句和關鍵詞作為基礎,對用戶知識需求進行判斷,從而設計用戶輸入和智能拓展模塊,通過語義模型與領域概念邏輯關系提取關鍵詞,尋找相應語句和關鍵詞。通過圖書館信息資源的概念、屬性、定義類等等級體系,根據領域知識進行推理和計算,對滿足用戶需求度的主要詞匯進行選擇,代替用戶輸入自然語言,創建擴展語義邏輯表達式,提交到智能檢索模塊中進行搜索[9]。

2.2.3? 數據規范化處理

首先利用數據挖掘算法對數據進行集成處理,使數據滿足規范化處理需求。數據規范化處理流程如圖3所示。

在合成記錄中,由于圖書館中自動化系統提供不同軟件開發商,所以彼此缺少協調和溝通。實現用戶信息挖掘的前提是規范化處理各個服務供應商系統數據庫數據字段中不同的含義和格式,以處理后的數據作為唯一標識用戶數字字段,實現用戶行為數據集合。對于高校師生來說,圖書借閱證是其使用圖書館資源成為連續用戶在不同數據庫中存儲的連續標識符[10]。

數據規約中的網絡日志與數據庫信息記錄存在的記錄和標識方法不同,數據歸約功能能夠實現不同屬性,但是相同含義的數據規范化處理使數據歧義得到降低,提高分析數據的精準性[11]。

數據清理通過數據歸約和記錄模塊處理之后,相同用戶在不同數據庫記錄在同個字段集中,此字段值具備重復記錄作用,要將屬性值保留,將重復屬性值剔除。部分數據不全,針對遺漏數據信息要補充,跟蹤錯誤數據。數據清理模塊要將噪聲數據、錯誤數據、污染數據進行清除。

不同數據分析和數據算法對于數據的要求不同,數據變換模塊利用數據概化、平滑聚類等方法使數據轉變成為滿足數據挖掘算法需求的數據方式[12]。

2.2.4? 創建索引模塊

索引模塊創建的過程為:通過Oracle數據庫得到元數據,對元數據解析生成Field對象,以此創建Document對象,利用ES全文索引技術創建IndexWriter的索引。ES索引創建流程圖如圖4所示。

2.2.5? 數據存儲模塊

云存儲HDFS分布式文件系統使用4臺Linux機器構成集群,每個塊中保存3個副本。云作為基礎設備,使圖書館不需要承擔數據中心管理成本[13]。

元數據設計:針對學校自主資源,要創建自身元數據庫、實現資源分類、編目標引、創建完整數據庫。本文將DC元數據核心作為根據,以實際需求實現元素使用和擴展,構成滿足高校圖書館需求的元數據結構。在創建系統元數據過程中,不僅要將元數據字段進行擴展,還要對其保留,包括文獻被訪問次數、文獻被下載次數。

數據存儲:圖書館文獻資源存儲主要包括文獻元數據和附件的存儲。其中,文獻元數據添加filepath字段后在Oracle數據庫中保存,存儲路徑為HDFS系統;附件的修改與刪除需在HDFS系統中進行,修改附件對應元數據filepath字段,并將云存儲原附件刪除,上傳修改后的新附件[14]。

2.2.6? 信息分析模塊

此模塊通過移動信息、結構化數據和互聯網日志等對用戶群體需求進行分析。移動信息分析是利用虛擬人際關系開展信息求助,結構化數據分析模塊利用技術手段,使用戶利用咨詢內容和反饋信息記載、數據倉庫實現處理,互聯網日志能夠通過用戶使用過程中的痕跡,分析用戶網絡信息行為。

另外,通過信息推送,實現用戶群體定制信息,利用電子資源庫和借閱館藏書籍,使信息過濾[15],推送到用戶接口,用戶還能夠通過館藏資源信息服務實現相應信息的推送,以此實現基于大數據的圖書館主動推送的信息服務。

3? 圖書館信息檢索系統性能測試

本文選擇中南大學圖書館中文文獻資源作為測試數據,選擇農業、工業、醫學等方面32萬份文獻數據,測試檢索詞包括維生素、觀察、胃鏡、太空、汽車、遙控6個詞,分別在單個ES數據庫、Oracle數據庫、ES集群數據庫檢索測試,并且進行對比。

統計采用本文系統在Oracle數據庫內檢索6個關鍵詞的檢索相關準確性,為直觀展示本文系統的檢索性能,將本文系統與云計算檢索系統以及分布式檢索系統進行對比,對比結果如圖5所示。

統計采用本文系統在單個ES數據庫內檢索6個關鍵詞的檢索相關準確性,為直觀展示本文系統的檢索性能,將本文系統與云計算檢索系統以及分布式檢索系統對比,對比結果如圖6所示。

統計采用本文系統在ES集群數據庫內檢索6個關鍵詞的檢索相關準確性,為直觀展示本文系統的檢索性能,將本文系統與云計算檢索系統以及分布式檢索系統對比,對比結果如圖7所示。

通過圖5~圖7實驗結果可以看出:采用本文系統在不同數據庫內檢索維生素、觀察、胃鏡等6個檢索詞的檢索相關準確性均高于96%;而采用云計算檢索系統以及分布式檢索系統在不同數據庫內檢索維生素、觀察、胃鏡等6個檢索詞的檢索相關準確性均低于96%。檢索結果表明,本文系統在不同數據庫內檢索不同檢索詞的準確性均明顯高于云計算檢索系統以及分布式檢索系統,有效驗證了本文系統檢索關鍵詞的檢索精度。

統計采用不同系統在Oracle數據庫輸入6個不同關鍵詞的檢索時間,對比結果如表1所示。

統計采用不同系統在單個ES數據庫輸入6個不同關鍵詞的檢索時間,對比結果如表2所示。

統計采用不同系統在ES集群數據庫輸入6個不同關鍵詞的檢索時間,對比結果如表3所示。

檢索系統的實時性是評價檢索性能高低的重要指標。通過表1~表3測試結果表明:本文系統檢索不同檢索詞時間均低于20 ms,說明本文系統可符合不同數據庫的不同檢索需求,對于不同的數據庫輸入不同關鍵詞均可保持較快的檢索速度,且檢索時間變化不大,驗證了本文系統檢索的魯棒性;而云計算檢索系統以及分布式檢索系統對于不同的數據庫輸入不同關鍵詞檢索時間均高于50 ms,且檢索時間變化較大。上述結果表明,本文設計的檢索系統的檢索速度比云計算檢索系統以及分布式檢索系統的速度快,滿足實際使用需求。

4? 結? 語

網絡的逐漸普及促進了大數據分析教育的發展,使用高精準率、強靈活性的智能化教育,是目前最流行的手段。信息檢索系統設計的主要目的就是滿足教育高效率、高信息、大規模、低成本的準則。基于大數據的圖書館信息檢索系統的設計能夠實現用戶的信息跟蹤,使用檢索軟件分析用戶的檢索情況。在系統不斷完善的過程中,能夠根據用戶習慣與特點,實現精準信息資源的提供,從而能夠實時反饋智能檢索服務效果,以反饋的結果對系統的結構進行優化和調整,使檢索效能得到提高。

參考文獻

[1] 王平,李昭.高校圖書館信息公開現狀調查與思考[J].數字圖書館論壇,2020(1):35?39.

[2] 朱光,豐米寧,張薇薇.激勵機制下圖書館信息安全管理的投入意愿研究:基于演化博弈的視角[J].數據分析與知識發現,2018(6):13?24.

[3] 田華,鄢喜愛,楊金民.圖書館云存儲系統中一種自適應容錯策略[J].計算機工程與應用,2019,55(7):95?99.

[4] 王蕾.媒介融合語境下高校圖書館如何聯合開展移動信息服務:評《大數據時代高校圖書館信息服務創新研究》[J].新聞愛好者,2018(1):115?116.

[5] 孫戰彪.SOLOMO環境下圖書館信息資源協同建設研究[J].現代情報,2017,37(12):110?116.

[6] 谷參.基于分布式結構的圖書館信息檢索服務系統研究[J].現代電子技術,2017,40(1):83?85.

[7] 葉小榕,邵晴.結合物聯網和室內定位的手機圖書館推薦系統[J].科技導報,2016,34(23):127?136.

[8] 張靜端.基于GIS技術的高校圖書館座位管理系統[J].東華大學學報(自然科學版),2016,42(2):242?247.

[9] 許磊,夏翠娟.第三代圖書館服務平臺的元數據管理:以FOLIO的Codex方案為例[J].中國圖書館學報,2020,46(1):99?113.

[10] 譚龍江.基于讀者活動的個性化圖書館推薦系統[J].系統工程,2015,33(8):154?158.

[11] 張鳳霞.大數據環境下基于云計算的圖書館用戶信息挖掘技術研究[J].現代電子技術,2019,42(21):36?40.

[12] 陸韡.面向OA資源的圖書館知識發現系統應用研究[J].圖書館工作與研究,2019(10):83?88.

[13] 侯歡歡,楊志萍,侯雪婷.可行能力視角下圖書館信息素養扶貧路徑研究[J].圖書館學研究,2019(18):69?74.

[14] 王棟,袁偉,吳迪.基于WiFi物聯網的圖書館環境監測系統[J].計算機科學,2018,45(z2):532?534.

[15] 李金.基于云計算的數字圖書館智能問答系統設計[J].制造業自動化,2019,41(8):136?140.

猜你喜歡
數據處理
驗證動量守恒定律實驗數據處理初探
認知診斷缺失數據處理方法的比較:零替換、多重插補與極大似然估計法*
心理學報(2022年4期)2022-04-12 07:38:02
ILWT-EEMD數據處理的ELM滾動軸承故障診斷
水泵技術(2021年3期)2021-08-14 02:09:20
ADS-B數據處理中心的設計與實現
電子測試(2018年4期)2018-05-09 07:28:12
MATLAB在化學工程與工藝實驗數據處理中的應用
基于希爾伯特- 黃變換的去噪法在外測數據處理中的應用
大數據處理中基于熱感知的能源冷卻技術
計算機工程(2015年4期)2015-07-05 08:28:04
Matlab在密立根油滴實驗數據處理中的應用
數據處理能力在求職中起關鍵作用
我國首個“突發事件基礎數據處理標準”發布
主站蜘蛛池模板: 精品日韩亚洲欧美高清a | 久久精品人人做人人| 免费aa毛片| 亚洲中文字幕国产av| 亚洲天堂久久新| 99人体免费视频| 玖玖精品在线| 91精品国产综合久久香蕉922| 国产97区一区二区三区无码| 国内熟女少妇一线天| 亚洲成人一区在线| 国产成人乱无码视频| 欧美另类一区| 欧美精品成人一区二区视频一| 免费国产无遮挡又黄又爽| 毛片最新网址| 成年人国产视频| 狠狠综合久久久久综| 在线观看亚洲国产| 国产国语一级毛片在线视频| 成人毛片免费在线观看| 国产区人妖精品人妖精品视频| 亚洲国产精品日韩专区AV| 国产精品成人免费综合| 精品视频在线观看你懂的一区| 国产激爽爽爽大片在线观看| 欧美色99| 精品一区国产精品| 69视频国产| 亚洲午夜国产精品无卡| 2019国产在线| 在线精品亚洲一区二区古装| 欧美日韩亚洲综合在线观看| 九九久久99精品| 日韩不卡免费视频| 波多野结衣一区二区三区四区视频| 99热这里只有精品免费国产| AV无码一区二区三区四区| 亚洲成人一区二区三区| 精品综合久久久久久97| 91丝袜乱伦| www.youjizz.com久久| 色天天综合| 58av国产精品| 亚洲大尺度在线| 香蕉蕉亚亚洲aav综合| 高清视频一区| 天天综合天天综合| 99久久99视频| 欧美一区精品| 国产xxxxx免费视频| 97超爽成人免费视频在线播放| 亚洲综合日韩精品| 欧美日韩91| 国产精品毛片一区视频播| 久久动漫精品| 国产理论精品| 一级毛片免费不卡在线| 国产交换配偶在线视频| 国产精品自在自线免费观看| 国产高清国内精品福利| 少妇精品网站| 欧美成人午夜影院| 色噜噜狠狠色综合网图区| 日韩大乳视频中文字幕| av尤物免费在线观看| 久久99久久无码毛片一区二区| 正在播放久久| 米奇精品一区二区三区| 中文字幕亚洲精品2页| 国产欧美日韩va| 色精品视频| 久久午夜夜伦鲁鲁片不卡| 久久久久人妻一区精品色奶水| 国产亚洲高清在线精品99| 欧美成人精品高清在线下载| 无码免费视频| 国产国产人成免费视频77777| 日韩欧美综合在线制服| 97青草最新免费精品视频| 国产95在线 | 天天综合网色|