999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術在檔案管理系統中的應用

2020-01-02 03:53:27王仡捷
梧州學院學報 2020年3期
關鍵詞:數據挖掘檔案管理數據庫

王仡捷

(安徽廣播電視大學 信息技術與網絡管理中心,安徽 合肥 230041)

以大數據為基礎的計算機數據挖掘技術給傳統的檔案管理帶來巨大的沖擊,也在很大層面上影響和改變了傳統檔案管理的理念和方式。應用大數據挖掘技術,能提高檔案管理中的數據檢索、查詢性能,并構建自動化、數字化相結合的檔案信息管理機制。

1 基于大數據的計算機數據挖掘技術

1.1 以計算機技術為基礎的數據挖掘

數據挖掘指的是從海量的、不規則的隨機數據中提取出滿足人們信息、知識需求的數據,挖掘出來的知識往往具有潛在的、隱性特征。計算機的普及應用為數據挖掘技術提供了技術和平臺保障,基于計算機的數據挖掘將人工智能、統計學知識和技能進行有機結合,利用計算機檢索的自動化功能,對原有的海量數據進行高度分析,推理和挖掘出數據信息的潛在性能,從而為人們決策提供信息支撐。數據挖掘技術是隨著信息技術的發展而不斷改進和普及的,起初在20世紀末,數據挖掘技術主要應用在較小范圍內的研究階段,后來隨著信息技術創新和人工智能發展逐步應用到各行各業。數據挖掘技術常用方法為分類法、關聯法、序列模式法和聚類分析法等,對采集的數據進行多維度的整合分析,挖掘數據中的信息、知識和模式等,為決策者提供參考依據。

1.1.1 分類形式。該形式是數據挖掘技術的核心,更是計算機數據挖掘技術在實務應用中的重要組成部分,其核心理念是分析數據屬性,將不同的元祖數據劃分到不同類別中,分類是數據挖掘的起始部分,更關系到數據收集的整體質量[1]。在應用過程中,分類所體現的是對數據的歸納、提煉,從而確定同類事物的劃分依據即同種數據的共性。具體操作中,操作人員要挖掘數據的共同特征,利用相關程序進行最終檢測,核定數據的共同特性,從而進行具體分類。

1.1.2 關聯形式。關聯原則是數據挖掘技術中較為簡單的操作形式,是通過對相關數據的準確描述,實現對同類數據的分析、歸納和提煉。具體應用中,要對某一類數據對象進行描述和分析,將同種屬性糅合起來,然后通過總結和歸納,得出對象的共有屬性或機制。關聯形式可以直接應用到數據分析過程中,將不同事物產生的海量數據進行統一的記錄整合,減少分散數據的存儲量,實現系統的良好運行。

1.1.3 粗糙集法。粗糙集法相當于數據挖掘技術中的數學工具,能研究數據隊形中的不確定知識、規則,其運算過程相對簡單容易操作,不需要確定相應的研究信息,因而能為大多數用戶提供便利[2]。粗糙集法的應用范圍較廣,由于客觀世界規則都具有不明確性,因而都可以用粗糙集法進行研究,同時粗糙集法可以排除數據庫中的干擾信息,發現數據中的共性,并以表格的形式進行整理,形成可供決策者直觀的決策表格。

1.2 大數據背景下的檔案管理工作內涵

大數據的發展推動了檔案管理的改革和發展,信息技術和數據庫的應用促使檔案管理在統一的平臺進行數據收集、分析和處理,并以信息技術為動力推動檔案管理的效率提升。在大數據背景下,傳統的檔案管理模式顯現出滯后性,檔案的信息載體也從最原始的紙質文件向電子文件、數字文件轉變。結合大數據和云計算的共同作用,現代化檔案管理以大數據技術為支撐,對紙質文檔進行數字化存檔,并借助數據平臺的開放性、交互性,為檔案用戶提供便捷、快速、高效和人性化的檔案服務。

2 計算機挖掘技術在檔案信息系統中應用的積極意義

2.1 提高檔案信息的安全性和準確性

其一是通過對紙質檔案實現電子化,有效減少對紙質檔案的二次損壞,并能確保對紙質檔案的規范化錄入、保存和檢索,達到保護紙質檔案的目的。

其二是需要通過使用計算機技術提升電子檔案的保密性、安全性,以及實現對電子檔案的智能化管理,提高電子檔案的應用效率,充分發揮數據信息的應用價值。

其三是通過使用計算機技術,把涉密的數據處理過程嚴格控制在內部實現,從而解決涉密數據的有效管控,嚴防數據泄密,達到提升檔案安全性的目的。

2.2 提高檔案的使用效率,放大檔案的功能價值

檔案的重要性和應用價值在于存儲信息可以為決策者和信息需求者提供服務,而大部分檔案信息具有一定的保密要求,不同類別、集體的檔案是不可能向全社會進行公開的,檔案的保護、管理、查閱都有一定的權限,這就導致檔案管理工作和查閱使用之間存在一定的矛盾沖突,引發兩方的溝通難題。如一旦溝通不暢,檔案查閱的需求和檔案管理的調取結果不一定完全對等,就會增大檔案管理的工作量,增加管理和查閱兩方的溝通次數。而計算機數據挖掘技術則可以通過對檔案數據的分類、關聯幫助管理者明確查閱者的信息需求,或者構建專門的檔案信息供應渠道,減少傳統檔案查閱中的查詢、檢索環節,提高檔案利用效率,增強檔案的信息服務功能。

2.3 提高檔案管理的自動化、智能化和數字化水平

信息技術時代,檔案管理和信息技術的融合是必然趨勢,更是創新檔案管理理念、模式,提高檔案管理效率和質量的必然途徑。基于大數據的計算機數據挖掘技術的應用首先要有大量的數據信息、檔案信息為前提,繼而應用計算機數據挖掘技術對檔案進行篩選、分析和整合,從而得到想要的結果。數據挖掘技術可以在檔案管理的過程控制、信息控制、數據整合、查詢檢索、分析決策等多個方面進行具體應用,涵蓋范圍廣泛。同時,計算機數據挖掘技術是一個跨學科的信息技術,是計算機、人工智能、數據庫和統計學原理的綜合應用,并涉及到神經網絡、遺傳算法等學科[3]。數據挖掘技術的應用不僅提高了檔案管理的效率,更從某個層面為檔案管理系統的改革和創新提供技術動力,促使檔案管理系統進行全方位改革,在具體的檔案管理工作中,推動工作人員創新工作理念,樹立信息化的檔案管理意識。

2.4 提高檔案管理的服務性,增強用戶體驗

將計算機挖掘技術應用到檔案管理系統中,可以在很大程度上提高檔案管理的效率,相較于傳統的檔案管理技術,數據挖掘可以實現檔案管理的人性化、智能化,以數據挖掘為基礎設計的檔案數據挖掘體系,可以以用戶的使用體驗為出發點,強調最大限度地滿足用戶的真實需求,這種人性化設計是傳統的檔案管理技術所欠缺的。首先它可以以多元用戶的個性化需求為特點進行針對性的數據收集和處理,不僅能提高檔案數據的搜集、整合效率,還能實現檔案數據處理的針對性和個性化,增強用戶的體驗滿意度。其次,多元用戶的信息需求也是有關聯的,檔案數據挖掘技術可以以全網用戶的信息檢索數據為依據,挖掘和分析不同用戶之間的聯系、共性和工作內容,從而為檔案管理系統的再次升級、更新提供數據支撐,推進檔案管理的持續發展。而且數據挖掘系統可以將相似信息匯總起來,構架大數據倉庫,便于檔案管理技術人員對數據進行分析、歸納和整合,以加強對檔案用戶群體的了解。

3 數據挖掘技術在檔案信息化管理的應用技法

3.1 分類法在檔案管理中的應用

檔案分類是對檔案進行現代化、智能化管理的前提和基礎,數據挖掘技術中的決策樹算法以一定規則將不同特性種類的檔案進行快速區分,并將同一種類的檔案進行歸類,能快速提高檔案檢索的效率。

其應用過程主要是根據分類形式將大量的檔案分門別類。將具有相似屬性的檔案劃歸到一個類別中,增強檔案數據的規范性和標準性,讓現代化檔案管理具有更加高的效率,檔案管理人員可以按照不同的標準實現對檔案的快速檢索和查詢。

3.2 收集法在檔案收集中的應用

收集法以神經網絡、大數據庫為基礎。首先分析大數據庫中的既有數據,并以該數據為對象構建概念模型,以該模型為標準對比分析每個測試樣本,如果該模型和數據樣本的主要特征相吻合,即該數據模型通過檢測測試,能夠對數據樣本進行正確的描述和分析,那么就以該模型對未來的數據對象進行分類。如,檔案管理人員以1 000名檔案會員為樣本進行數據統計,以用戶的年齡、性別、學歷、瀏覽或借閱記錄等數據為訓練集,創建針對該檔案館用戶的借閱模型,并將該模型應用到對新用戶群體分析中。如果有新用戶的相關信息輸入到該模型中,則該模型會根據新用戶的年齡、性別、學歷推斷出符合他們愛好、需求的借閱偏好,繼而進行針對性推薦,實現檔案服務的個性化和差異化。

(三)保留法在檔案保管中的應用

保留法是保留住既有用戶,控制老客戶檔案流失的高效應用技法。尤其對企業發展而言,保留老用戶的成本要遠遠低于開發新用戶的成本,因此進行客戶保留是企業發展中必不可少的檔案信息處理環節。

企業可以根據收集到的老用戶信息進行數據挖掘,分析引起老用戶流失的主要原因,繼而采取針對性措施,保留老用戶,防止老用戶檔案流失。

4 計算機數據挖掘技術在檔案管理系統中的應用展望

4.1 實現數據來源的多樣性

數據挖掘的前提和基礎是數據,只有收集大量的數據才能確保數據挖掘結果的準確性。從當前的情況來看,檔案信息化管理中數據私密化、歷史數據積累等還有很多不足,這些都是數據挖掘技術在檔案信息化管理應用中亟待解決的問題。同時,對于數據挖掘技術而言,最基本的要求是處理好多種類型的數據庫,但是目前多樣化的數據庫包含了多元化、復雜化的數據類型,如多媒體數據、文本數據、時態數據、空間數據等,而不同的數據類型中對數據記錄的標準也不一樣,如何協調好不同來源的數據,使多元類型數據能夠實現快速轉化、對接,也是未來數據挖掘技術中要重點解決的問題[3]。從目前的數據挖掘技術來看,通過一個系統實現對所有類型的數據的挖掘、處理和分析是不現實的,因此要挖掘特定類型數據,則要創建與之相適應的數據挖掘系統。

4.2 數據挖掘算法的研究

數據挖掘算法是數據挖掘技術的核心,好的算法會直接影響數據挖掘的效率和質量。尤其是隨著數據庫的建立,不同的數據庫中包含有海量的數據屬性和數據記錄,而不同的數據表中又包含復雜的關聯,這就會導致數據挖掘過程中的搜索空間和搜索維度激增。因此為從不同的數據庫中發掘信息,應當開發更加有效的數據算法,剔除其中的不確定和病態數據。

4.3 數據可視化和人機交互的發展方向

數據挖掘的過程比較復雜,每一個環節都需要工作人員的參與。因此未來的數據挖掘技術在檔案信息化管理中的應用有可能朝向人機交互、數據可視化的方向發展。一方面,數據可視化可以將抽象的、復雜的數據轉變為人們可以直接理解的數據,進而通過簡單的方法操作系統,滿足用戶的檢索、查詢等需求。另一方面,人機交互可以通過界面將數據的生成結果直接提供給用戶,友好界面能有效提升用戶體驗,讓用戶通過可視化界面直觀地看到數據挖掘的成果。

總之,計算機數據挖掘技術涉及到較多學科,是計算機技術、云計算、神經網絡、遺傳算法、統計技能和大數據庫有機結合的科學技術。將數據挖掘應用到具體工作中,探究和創建新的工作理念和工作模式有助于實現服務的差異化、個性化,從而提高工作效率。數據挖掘技術對檔案管理的沖擊是巨大的,也從根本上創建和締造了全新的檔案管理和服務體系,為大數據背景下的檔案信息化、智能化和數字化提供了技術和平臺支撐,實現檔案服務的個性化特征,縮減檔案管理成本,提高檔案的安全性、準確性。當然在數據挖掘技術的應用過程中,由于所涉及的數據巨大,任何一點細微誤差都可能造成重大漏洞,因此需要技術人員對數據挖掘技術進行深入研究,掌握相關技術知識,提高技術服務和管理能力,從而提高檔案信息的自動化管理水平。

猜你喜歡
數據挖掘檔案管理數據庫
探討人工智能與數據挖掘發展趨勢
檔案管理中的電子檔案管理
檔案管理與企業內部控制關系的思考
消費導刊(2017年24期)2018-01-31 01:29:20
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
一種基于Hadoop的大數據挖掘云服務及應用
健康檔案管理的“云”前景
中國衛生(2014年11期)2014-11-12 13:11:34
主站蜘蛛池模板: 浮力影院国产第一页| 熟女成人国产精品视频| 国产精品精品视频| 久久综合结合久久狠狠狠97色| 精品自窥自偷在线看| 日本一区二区三区精品国产| 亚洲欧洲日本在线| 成人在线不卡视频| 在线无码九区| 国产在线欧美| 嫩草国产在线| 一级毛片中文字幕| 欧美中日韩在线| 丝袜亚洲综合| 无码内射中文字幕岛国片| AV无码一区二区三区四区| 国产精品嫩草影院av| 日韩高清一区 | 一级全黄毛片| 婷婷在线网站| 71pao成人国产永久免费视频| 91破解版在线亚洲| 成年看免费观看视频拍拍| 激情六月丁香婷婷四房播| 亚洲av成人无码网站在线观看| 久久 午夜福利 张柏芝| 欧美一区二区三区不卡免费| 91无码人妻精品一区二区蜜桃| 亚洲人成高清| 免费观看欧美性一级| 久久中文无码精品| 在线精品亚洲国产| 有专无码视频| 国产成人a毛片在线| 午夜福利免费视频| 欧美一级片在线| 久无码久无码av无码| 青青草国产精品久久久久| 亚洲天堂区| 欧美日韩第三页| 色欲国产一区二区日韩欧美| 黄色网站在线观看无码| 国产精品自拍合集| 97se综合| 亚洲精品色AV无码看| 99久久精品无码专区免费| 亚洲va精品中文字幕| 国产成人高清精品免费软件| 欧美自慰一级看片免费| 99re热精品视频国产免费| 亚洲IV视频免费在线光看| 久久婷婷六月| 亚洲色图综合在线| 亚洲日韩每日更新| 日本成人在线不卡视频| 日本免费福利视频| h视频在线观看网站| 久久亚洲AⅤ无码精品午夜麻豆| 在线亚洲精品自拍| 女同久久精品国产99国| 最近最新中文字幕免费的一页| 欧洲一区二区三区无码| 日本在线免费网站| 亚洲成aⅴ人在线观看| 五月婷婷综合在线视频| 成人在线不卡视频| 91久久国产综合精品| 日韩一区二区在线电影| 无码在线激情片| 亚洲伊人久久精品影院| 91精品福利自产拍在线观看| 欧美天堂久久| 9丨情侣偷在线精品国产| 国产精品永久在线| www.日韩三级| 九九热视频精品在线| 毛片在线看网站| 国产在线小视频| 亚洲国产成人麻豆精品| 国产新AV天堂| 91在线视频福利| 中文字幕在线永久在线视频2020|