999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據平臺架構的智慧圖書館研究

2021-04-04 11:32:54任風賢
信息記錄材料 2021年11期
關鍵詞:可視化智慧圖書館

任風賢

(運城職業技術大學 山西 運城 044000)

1 引言

近年來,信息化技術取得了快速發展。智慧圖書館能夠合理運用信息化技術打通各自動化系統的信息壁壘,建立圖書館信息中心。并且根據圖書館業務目標,使用數據挖掘算法和工具對海量圖書館行為數據展開分析挖掘。由于我國已經正式邁入了大數據時代,近幾年很多高校都陸續提出了智慧圖書館的項目建設,但是高校智慧圖書館仍然處于初級階段。因此,想要進一步促進智慧圖書館的建立,應該清晰了解相關技術,合理構建基于大數據的智慧圖書館平臺。

2 大數據平臺架構的相關技術

2.1 Hadoop生態圈介紹

Hadoop前身是Apache的Nutch,具有數據收集和數據存儲功能。在當前階段Hadoop已經成了一個較為規范龐大的體系。體系里面包含了HDFS、MapReduce、Yarn、Hive、Zookeeper等,能夠為系統提供分布式的數據存儲、并行計算、集群管理以及數據傳輸等功能,其中較為核心的內容是HDFS、MapReduce、Yarn三者。

HDFS使用了主從架構,一個HDFS集群通常是由多個DataNode與單個NameNode組合而成。其中NameNode在這個過程中是作為管理文件系統命名空間的主服務器,并且可以調節客戶端運行過程中訪問的文件。而DataNode則是進行管理對接節點存儲,一般情況下會在一個服務器當中部署一個DataNode。將一整個文件劃分成多個數據模塊,將這些數據模塊分別存儲在不同的DataNode當中。NameNode則是被用來操作文件系統的命名空間,例如在運行過程中打開、關閉或者重命名文件。在這個過程中,呈現出數據塊與DataNode之間的映射關系。此時,DataNode會對數據的讀寫請求展開處理,同時創建數據塊,刪除來源于NameNode中的復制命令。NameNode與DataNode都是為了在普通服務器進行運行,這些服務器一般情況下都是采用了GUN/Linux操作系統。由于HDES是由JAVA語言構建而成,所以任何能夠支持JAVA語言的服務器都可以進行DataNode與NameNode兩項服務。這種運用具有一種典型的部署方式,那就是在一臺服務器中單獨運行NameNode,集群的其他每臺服務器都可以開啟DataNode。在這個過程中,集群采用了NameNode能夠有效簡化系統整體架構,成為集群仲裁者和全部HDFS元數據的信息存儲庫。MapReduce是整個Haddoop的核心計算模塊,屬于性能優越的分布式編程模式,具有一定的擴展性和一致性,并且展現出并行抽象度,在處理龐大的數據時具有明顯的優勢。在運行過程中,會將一個龐大的數據劃分成多個小規模的數據map任務,將這些任務輸送至集群中的不同節點,這些節點可以同時完成下達的任務。在完成了相應的任務后,會利用Reduce調整最后的分析結果,將其上傳至HDFS進行存儲。在使用MapReduce處理數據之前需要保證一項基本條件,那就是需要進行處理的大規模數據集能夠被劃分成不同的小數據集,并且這些小數據集能夠進行獨立并行處理。Yarn是一項新推出的Hadoop資源管理器,屬于一種較為通用的資源管理系統,能夠為上層帶來統一的資源管理和調度。合理運用Yarn能夠有效提升集群的利用率,帶來更好的服務,為資源統一管理和數據共享提供便利[1]。

2.2 大數據可視化相關技術

大數據可視化主要是利用可視化方法來分析和挖掘大數據中具有價值的潛在信息。可視分析的目標主要是針對大規模、動態、模糊、不一致數據集進行分析。在當前的數據可視化技術中,主要是運用計算機圖形學和圖像處理技術,將各類數據轉化成可以在屏幕上顯示的圖形或圖像,對其進行交叉處理的理論和技術。通俗來講,就是將看似毫無意義、沒有利用價值的數據信息轉換成一種容易被理解和利用的視覺方式展現在眼前,這樣能夠更好地進行數據的觀察和分析。大數據可視化可以在進行數據分析挖掘的過程中利用用戶界面和人機交互技術,使計算機的計算能力與人的認知能力進行融合。這樣能夠有效提升針對大規模復雜數據集的分析能力,提高數據分析的效果。大數據可視化將計算機強大的計算能力與人對事物精確的認知能力進行巧妙結合,進而有效提升了數據分析和數據觀察的整體能力[2]。

3 基于大數據平臺的智慧圖書館構建

3.1 智慧圖書館總體架構

基于Hadoop的分層架構設計,利用這項技術建立智慧圖書館大數據平臺,不僅可以將圖書館的數據囊括其中,還可以將教學數據、讀者的消費數據包含在內。由于大數據平臺中會包含眾多的數據,因此可以在大數據平臺的基礎上展開數據的存儲、分析和應用展示。為了滿足不同業務多樣化的需求,在構建平臺的過程中,需要根據邏輯分層方法進行設計。基本上分為4層架構,分別為數據采集層、數據存儲層、數據服務層以及數據應用層。

數據采集層:數據采集層會囊括數據系統以及對元數據的抽取。數據中不僅會包括圖書館當前已有的各類數據,還會包括圖書館的數字資源數據。智慧圖書館作為智慧校園中重要組成內容,所以智慧圖書館大數據平臺不是單獨存在的,還需要與學生的教學數據、學生的基礎信息和學生的消費數據保持一定的關系。數據采集就是針對學生的各種信息進行抽取、清洗、轉化和加載,將各類數據轉化成統一的格式、使其能夠為數據存儲層做準備。

數據存儲層:各類數據的存儲是大數據平臺重要的工作內容,因此數據存儲是整個智慧圖書館大數據平臺中的重要部分。平臺所有的業務和展示都需要數據存儲層給予配合。一般情況下,智慧圖書館大數據平臺中的數據存儲層會采用傳統關系型數據庫以及分布式文件系統的混搭方式。關系型數據在學校的內部主要被用來集成學校現在已有的業務系統數據,為各類數據進行清洗和轉化提供中間表,與此同時存儲數據并挖掘數據背后隱藏的信息。分布式文件系統是大數據存儲層主要的存儲方式,具有結構化數據和非結構化數據兩種,是整個數據分析挖掘中的主體。

數據服務層:服務層在整個系統平臺中承擔著數據存儲層和應用層之間的連接,可以定義相對應的接口,將平臺中不同的服務進行關聯,為上一層的應用提供良好的訪問接口。數據分析服務需要建立在Hadoop平臺上,從業務需求出發,使用大數據平臺良好的計算能力完成數據的轉換、抽取、分析挖掘等功能。

數據應用層:主要是進行數據分析、挖掘以及業務整合的展示。在這一層中具體的應用包括決策支持系統、圖書館報告、個人讀書報告、移動客戶端等。

3.2 數據標準的建立

為了保證智慧圖書館大數據平臺的順利建設,促進智慧圖書館數據分析挖掘的良好運行,需要建立統一的數據標準,對原數據進行抽取、清洗、轉化等工作。由于元數據來自不同的自動化系統,各個自動化系統數據的存儲結構都是根據相應的業務需求進行設計的,邏輯關系較為復雜。所以數據庫的類型和數據結構都存在明顯的差異,因此想要保障相關工作順利進行,在進行數據采集工作之前,應當構建統一的數據標準,為后續的數據分析和挖掘工作提供良好的基礎數據,保障工作效果[3]。

在數據存儲架構設計設置云端數據存儲模塊,主要是為了滿足大量結構化與非結構化數據的存儲需求。與此同時,又需要保證相關數據存儲的安全性以及數據訪問使用的高效性。一般情況下會選取HDFS進行存儲,主要是因為運用HDFS進行存儲具有強大的數據處理能力,能夠利用備份功能使相關數據保持較高的可用性以及系統容錯能力。HDFS作為Hadoop生態系統中重要的組成部分,大部分并行計算框架都能夠支持高效讀取存儲在HDFS上的數據。由于云端存儲會包括多個業務系統的數據,因此為了更好地進行數據分析,應當根據存儲目錄將不同的業務類型和信息維度進行劃分,保障存儲的規范性。

3.3 ETL數據采集清洗

這項技術的合理應用有利于實現校園網內部數據的集成,這個模塊可以根據不同服務需求選擇合理的抽取方法。將大數據平臺中所需的各項數據從業務系統中進行抽取,并將抽取出的元數據在中間層進行清洗、轉化、集成。在完成以上步驟之后,將其匯聚到目標數據庫當中,這項技術在數據的采集過程中具有非常關鍵的作用。

數據抽取是構建智慧圖書館大數據平臺數據采集的重要步驟,在進行這項步驟之前,需要對數據庫類型、數據類型進行充分的調查和了解。在第一次進行數據采集的過程中,由于會包含很多業務數據,所以在進行第一次數據采集過程中屬于全量抽取。在此后的數據采集工作中,需要將此作為基礎進行增量抽取。在工作中需要確定合理的抽取頻率,由于不同的業務數據類型具有不同的特點,所以需要根據實際情況設定相應的抽取頻率。例如圖書借閱產生的數據可以進行1天1次抽取或者更短時間內進行抽取,如果是針對讀者信息進行抽取,則可以將抽取頻率延長設定為半年1次或者一學期1次。在完成了數據的采集和抽取之后,需要對采集到的數據進行清洗。進行數據清洗是為了刪除不必要、不可利用的相關數據,主要是針對缺失重要字段的不完整數據或者存在明顯錯誤的數據以及具有重復信息的數據。在進行數據清洗過程中,應當建立合理的數據清洗標準,根據數據清洗標準利用SQL代碼查找相應的字段進行Delete操作。

4 結語

為了促進基礎大數據平臺智慧圖書館的順利構建,需要合理運用相關技術,革新自己的理念。在合理構建大數據技術智慧圖書館架構之后,采用相應的技術手段,保障智慧圖書館的效果和工作效率,充分了解各項關鍵技術、服務層的作用與意義,使運行系統保持穩定的運行,展現出基礎大數據平臺智慧圖書館的優勢。

猜你喜歡
可視化智慧圖書館
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
飛躍圖書館
圖書館里的是是非非
有智慧的羊
去圖書館
智慧派
智慧與創想(2013年7期)2013-11-18 08:06:04
主站蜘蛛池模板: 色婷婷啪啪| 污网站免费在线观看| 久久国产亚洲偷自| 波多野结衣国产精品| 91精品人妻一区二区| 四虎影视8848永久精品| 精品少妇人妻av无码久久| 免费全部高H视频无码无遮掩| 午夜福利无码一区二区| 久久久久国产精品嫩草影院| 日韩精品无码免费一区二区三区 | 国产成人精品2021欧美日韩| 精品国产自在在线在线观看| 青青草国产一区二区三区| 亚洲国产亚综合在线区| 成人在线综合| 极品私人尤物在线精品首页| 毛片在线区| 一区二区日韩国产精久久| 国产精品免费入口视频| 日韩A级毛片一区二区三区| 亚洲美女操| 国产成本人片免费a∨短片| 中文字幕久久亚洲一区 | 欧美午夜视频在线| 国产69精品久久| 亚洲视频在线青青| 亚洲男人的天堂在线| 国产在线无码av完整版在线观看| 18禁不卡免费网站| 欧美日韩成人在线观看| 91精品国产一区自在线拍| 中国一级毛片免费观看| 国产一区二区三区在线观看视频| 91网在线| 亚洲天堂高清| 四虎国产在线观看| 久久无码av一区二区三区| 四虎影视8848永久精品| 精品無碼一區在線觀看 | 国产精品所毛片视频| 久久鸭综合久久国产| 18黑白丝水手服自慰喷水网站| 亚洲av无码专区久久蜜芽| 黄色福利在线| 久久国语对白| 99精品视频九九精品| 草草影院国产第一页| 麻豆a级片| 伊人大杳蕉中文无码| 欧美笫一页| 日本在线视频免费| 青青草原国产av福利网站| 黄色网站不卡无码| 香蕉久久国产精品免| 狠狠色狠狠色综合久久第一次| 9966国产精品视频| 国产成人精品视频一区视频二区| 午夜丁香婷婷| 99ri国产在线| 成人免费一区二区三区| 麻豆AV网站免费进入| 亚洲综合第一区| 国内毛片视频| 国产激情无码一区二区免费 | 91国内视频在线观看| 亚洲精品在线影院| 欧美日韩国产一级| 国产一级毛片yw| 乱人伦99久久| 国产欧美精品午夜在线播放| 欧美激情一区二区三区成人| 99人体免费视频| 国产在线视频导航| 国产成人麻豆精品| 黄色免费在线网址| 丝袜亚洲综合| 国产极品美女在线播放| 激情综合激情| 亚洲网综合| 亚洲无码电影| 欧美一级特黄aaaaaa在线看片|