999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

信息分析方法在檔案領域的應用現狀綜述

2015-05-30 10:48:04馬廣惠朝樂門
北京檔案 2015年6期
關鍵詞:數據挖掘語義分析

馬廣惠 朝樂門

摘要:本文主要針對信息分析方法在檔案領域的應用現狀進行文獻調研,重點討論了統計分析方法、計算機輔助信息分析方法及新興信息分析方法在檔案領域的具體應用。

關鍵詞:信息分析檔案信息資源管理

Abstract:The application of Informa? tion Analysis Disciplines logic method and specific method, including statistical, computer-aided and emerging analyzing measures,to Archival Science is dis? cussed based upon a literature review of relevant studies.

Keywords:Information Analysis; Ar? chives; Information Resources Manage? ment

目前,檔案學科正向基于信息資源的管理階段邁進,在此階段,為推動經濟社會發展,對檔案信息資源實行科學、有效的開發利用與管理成為首要任務。[1]在此歷史背景下,為實現對檔案信息資源的深度加工尋找方法指導與工具支持尤為重要。

信息分析是一項內容廣泛的信息深加工處理和情報提煉活動,它以大量相關的原生信息為處理對象,通過對原生信息內容的分析、綜合或評價,以提煉出對管理、決策等活動有支持作用的情報,為管理、決策等活動服務。[2]作為一門綜合性學科,信息分析吸收、借鑒了其他學科的分析方法,其方法體系如圖1所示,主要包括:哲學方法、一般分析方法與具體分析方法(統計分析方法、計算機輔助信息分析方法及新興信息分析方法)。[3]

信息分析方法的應用性及檔案信息資源開發的必要性,為針對二者的結合研究提供了思路。本文從信息分析方法與檔案結合的視角,采用文獻調查方法,針對信息分析中層和底層方法在檔案領域的應用現狀進行文獻綜述。通過預調研和專家討論,最終確定的文獻調研方法如下:

*檢索詞:“檔案(archiv*)”+“分析(analys*)”;“檔案(archiv*)”+“方法(method*)”;“檔案(archiv*)”+具體方法名稱,如數據挖掘;

*檢索數據庫:中國期刊全文數據庫、中文科技期刊數據庫、萬方數據資源系統、中國重要會議全文數據庫、中國博士學位論文全文數據庫、中國優秀碩士學位論文全文數據庫、Web of Science三大引文庫、ProQuest系列數據庫、Engineering Village(EI)、ACM(美國計算機協會)電子期刊數據庫;

*檢索策略:標題檢索+關鍵詞檢索,并對檢索結果進行了相關性分析和有效文獻過濾。

調查結果發現,信息分析與檔案學科領域內尚無針對信息分析方法在檔案領域應用的專題研究,相關研究分散在信息分析方法分析的具體技術在檔案領域的應用研究之中。

一、一般分析方法及其應用

一般分析方法,即科學整體層次的方法,在信息分析中具有普遍適用意義的科學方法,主要包括:比較、分析與綜合、推理。一般分析方法作為一種邏輯方法,貫穿人類思維過程的始終,其應用范圍廣泛,并對具體方法的應用形成指導,但其方法本身決定分析結果僅是定性的描述,缺乏定量分析。本文不對一般分析方法在檔案領域的具體應用作深入探討。

二、統計分析方法及其應用

相對于一般分析方法,統計分析方法主要基于定量分析,主要包括描述性分析、回歸分析、聚類分析、時間序列分析和主成分分析。作為一種分析工具,統計分析方法為檔案領域信息分析提供了一套信息收集、處理、分析、解釋的方法。統計分析方法具體應用如下:

(一)描述性分析

信息的分析始于描述,通過描述發現信息的基本特征是進一步分析的基礎,描述性分析包括用圖表展示信息和用統計量描述信息。在我國檔案管理領域,描述性分析應用如下:

1.檔案或電子文件分析。檔案的描述性統計主要針對檔案的現存狀況進行分析,旨在了解檔案的數量、種類、保存狀況等,通過對調查所得信息進行匯總計算,得出檔案數量總計結果、比例、增長率等結果,進而為檔案管理提供依據。例如,歐盟Moreq2010標準、[4]美國DOD5015.2、[5]國際檔案協會ICA標準[6]以及我國GB/T 29194-2012《電子文件管理系統通用功能要求》[7]對ERMS系統電子文件的統計分析和報表報告要求給出了具體規定。

2.檔案工作分析。描述性分析主要在檔案管理工作和檔案教育工作中得到應用。第一,檔案管理工作分析,在檔案管理工作中,描述性統計方法主要應用于檔案利用環節分析:統計數據或來源于統計年鑒、年報等二手信息,或由相關調查人員通過問卷調查直接獲得;統計指標主要圍繞檔案資源、開放主體及利用者形成;分析結果主要通過頻數分布表、列聯表和條形圖、餅圖、曲線圖呈現,涉及的統計量包括頻數、比例等。第二,檔案教育工作分析主要集中于對檔案高等教育的描述性分析,所得信息大多來自相關問卷調查結果;主要針對檔案教育工作中的檔案學專業、教師、課程、招生就業、人才培養情況進行分析;通過頻數、比例統計量對結果進行描述;以頻數分布表、列聯表、條形圖、餅狀圖的形式呈現統計結果。

3.檔案學理論分析。針對檔案學理論,大多學者通過選擇信息源、進行檢索、提取信息、確定有效信息的過程開展檔案學研究,其主要研究對象確立為:作者、期刊論文、核心期刊、國家社科基金立項及研究現狀。描述性統計分析方法主要應用于對研究結果的處理和呈現,如通過頻數分布表、列聯表、餅圖、折線圖展示信息分布,通過頻數、比例統計量呈現信息分析結果。

綜合考察描述性統計方法在檔案領域的應用情況,該方法在檔案、檔案工作、檔案學不同方面的應用有不同的側重點,應用于不同方面的分析有不同的信息收集與信息處理方法。自20世紀80年代,檔案領域引入描述性統計方法至今,檔案領域對于此類方法的應用主要限于信息展示,且應用模式和方式單一,缺乏突破性研究;注重總量的計算,忽視所得信息整體及變量之間的結構和關系;限于用簡單的圖表展示研究結果,缺乏對信息的概括性度量。因此,描述性統計方法在檔案領域應用仍處于初級探索階段。

(二)回歸分析

回歸分析是處理兩個或兩個以上變量之間依賴關系的一種統計分析方法。我國對回歸方法在檔案領域應用的研究現處于起步階段,國外則主要應用回歸分析方法開展檔案信息資源開發利用工作,其應用特點可歸納如下:國外檔案領域較早引進了回歸分析方法,主要應用于檔案信息內容開發,其方法的應用是一個由關系確定、回歸分析、模型檢驗到趨勢預測的完備過程。

(三)聚類分析

聚類分析是對個體或對象分類,以揭示客觀事物內在本質的分類規律。國內對聚類分析在檔案領域應用的研究較少,其關注點在于對聚類分析方法應用到檔案領域本身的探討,以尋求適合檔案領域的特定聚類分析方法。[8]國外是將其視為一種輔助研究的工具,作為分析檔案信息的一個過程、一種手段,其最終目的為解決實際問題。

(四)時間序列分析

時間序列分析是通過對歷史數據變化的分析,來評價事物的現狀和估計事物的未來變化。有學者提出基于時間序列分析進行檔案危機管理的理念,將危機生命周期理論與時間序列分析相結合。[9]嚴格來說,該理念并非統計學意義上的時間序列分析,而只是按時間管理事件的一種思想。該方法在國外檔案領域的應用主要集中于科技檔案信息分析,包括醫療檔案、考古檔案、測繪檔案和環境檔案,應用時間序列分析有不同的目的:對于過去長期積累數據,一種是揭示過去事物或現象的原貌與規律,一種是探究事物或現象的時間發展規律,以預測未來;對于短期積累數據,主要用于探究事物之間的相關關系。

(五)主成分分析

主成分分析是利用降維的思想,在損失部分信息的基礎上把多個指標轉化為幾個綜合指標的多元統計方法。目前,我國針對主成分分析方法在檔案領域應用的研究較少,有學者曾用主成分分析方法對電子檔案工作人員離職行為影響因素進行分析。[10]國外檔案領域對主成分分析方法的關注集中于檔案信息內容開發,一種是以檔案信息內容為分析對象,運用主成分分析法分析檔案內容信息,以檢驗已有經驗、模型的正確性,并在此基礎上作動態分析;另一種是探究針對特定檔案類型的主成分分析方法,通過比較,為特定檔案類型選擇適宜的分析方法,在此過程中,檔案內容信息僅為方法選擇提供數據支持,而非特定分析對象。

三、計算機輔助信息分析方法應用

數字化、網絡化時代的到來提升了信息分析的難度,與此同時,人們對高質量信息分析成果的需求有所增加,在此背景下,計算機輔助信息分析成為發展趨勢。為實現對檔案領域數字化、網絡化信息的分析,檔案界將計算機輔助信息分析方法引入檔案領域,其具體應用如下:

(一)數據挖掘

在技術領域,數據挖掘被定義為運用相關技術從數據集挖掘知識的過程。數據挖掘在檔案領域應用主要包括以下幾個方面:

1.數據挖掘應用于檔案管理業務環節。在檔案管理領域,相關學者開展了數據挖掘在檔案編研選題和檔案提供利用環節的研究,通過對檔案信息管理系統中保存的檔案管理業務信息的挖掘,揭示其中隱含的規律,進而推進館藏資源建設、提升檔案信息服務的水平。

2.數據挖掘應用于網絡信息資源開發。網絡信息資源通過網絡信息記載了社會的發展變化,是檔案不可或缺的重要組成部分,應用數據挖掘分析網絡信息資源成為大勢所趨,其具體應用包括:采用數據挖掘技術對Web檔案所保存的海量信息進行深層次分析和研究,使網絡信息資源分析從簡單的數據統計分析過渡到信息分析、從數據的處理過渡到知識發現,[11]并將分析結果以可視化的方式呈現;[12]為從用戶角度推進網絡檔案信息資源個性化服務,基于Web的數據挖掘技術得以提出,該方法從Web文檔與Web活動中,發現并獲取用戶的潛在需求,探索建設以用戶為中心的智能化服務平臺,應用Web數據挖掘技術建設數據庫。[13]

3.數據挖掘在數字檔案館中的應用,為實現有效管理和利用檔案信息資源,需采用數據挖掘技術轉變信息資源管理模式,基于數字化檔案信息的內容特征挖掘出隱含的、有效的數據模式,實現方便、快捷提供數字化信息資源的目的。[14]

在檔案領域,數據挖掘的對象由檔案管理數據,尤其是用戶信息,擴展至檔案內容信息;數據挖掘的范圍由檔案管理系統中的信息擴展至網絡信息資源;在檔案管理機構的應用由傳統實體檔案館到數字檔案館,其應用逐步擴展,數據挖掘的層次、深度逐步提升。由于檔案領域傳統的信息組織方式無法滿足數據挖掘對高質量信息的需求及數據挖掘技術應用面臨的諸多問題,使得這些不足制約著數據挖掘在檔案領域的應用。

(二)聯機分析處理

聯機分析處理(OLAP)即共享多維信息的快速分析,主要用于驗證性信息分析,以支持決策。檔案領域應用OLAP的理論探討如下:OLAP應用于檔案管理系統構建和分析,為實現對數據的深入分析奠定基礎;隨著萬維網的普及和網頁歸檔日益得到認可,全面記錄網絡發展,不僅需要實現網頁檔案信息的收集,更需要實現對于積累的網頁內容和附加信息的分析處理,在此基礎上OLAP逐漸轉向對網頁檔案信息的分析和處理。[15]國外對于檔案領域應用聯機分析處理的研究主要集中于商業范圍檔案信息開發,屬于實際應用范疇。

(三)社會網絡分析

社會網絡分析對社會關系結構及其屬性進行分析,以觀測整體網絡結構及特定變量位置和變量間關系。在檔案領域社會網絡分析應用如下:對作者合作網絡、引文網絡及研究主題關聯網絡進行分析,通過構建針對特定問題的關聯網絡,以探究網絡整體結構及內部關系,揭示檔案領域內部規律及趨勢;此外,檔案領域開展了對社會網絡分析具體技術及工具的探討。社會網絡分析在我國檔案領域主要用于檔案學研究,且對于研究現狀的分析多于面向未來的預測。國外,社會網絡分析主要是作為一種檔案信息分析的模型、機制、工具,側重于應用,通過對檔案信息的分析實現輔助決策的目的。

四、新興信息分析方法應用

面對信息數量的增長及數據類型的增加,傳統的信息分析方法無法應對新形勢的挑戰,在信息分析的數量、質量及難度方面遇到了障礙,因此,研究、發展新興信息分析方法成為客觀必然。在此背景下,檔案領域開展了新興信息分析方法應用的探討。

(一)大數據分析

隨著網上數字檔案資源的增加以及國內外檔案網站知識服務的開展,網上數字檔案大數據分析成為新興研究的熱點,相關研究主要集中于技術探討:相關學者在分析檔案大數據知識挖掘需求與挑戰的基礎上,對檔案大數據知識挖掘的關鍵技術進行總結;針對大數據分析技術進行研究以構建檔案用戶行為大數據分析系統。[16]目前,國外主要應用大數據分析方法開展電子健康檔案內容分析,預測疾病的相關影響因素,以進行針對性防御。

大數據分析主要針對數字化環境中產生的數字檔案的分析。大數據分析在檔案領域應用問題屬于檔案學前沿研究,現仍處于理論探討階段,其最終實現需要一系列工具與技術的支持,雖目前應用范圍不是很廣泛,但為檔案領域信息分析提供了新的分析視角,為未來數字檔案館建設、知識服務、個性化服務提供了方向。

(二)語義分析

語義分析旨在分析詞義及詞間語義關系。語義分析在檔案領域應用包括:第一,數字檔案資源語義檢索。傳統檔案信息檢索基于語法結構進行檢索,無法識別與處理語義關系,信息檢索結果與用戶需要信息之間存在較大差異。在此背景下,構建語義關聯數據網絡、語義檢索研究日益興起。第二,數字檔案資源體系建設。當前,數字檔案資源體系的語義異構問題,阻礙了數字檔案的利用和共享,建立檔案領域本體、實現語義組織,在此基礎上推進數字檔案資源體系語義互操作,將實現數字檔案資源的開放互聯和有效整合。第三,檢索語言語義網絡化。為實現檔案檢索工具在語義網絡環境中的應用,需將傳統的檢索語言遷移至語義網,基于RDF的SKOS為檢索語言語義網絡化提供了可行路徑。此外,國外檔案界較早關注了語義分析,對于語義分析的研究主要集中于醫療檔案信息語義分析的實現過程,通過語義分析工具和結構化詞表構建語義網絡。

語義分析是一個集成語義組織語言、資源建設與語義檢索的綜合方法,各過程相互關聯、相互影響,但目前語義分析在檔案領域的研究傾向于分散化,強調各方面界限的同時忽略各階段的連接,針對某一環節的探討易于忽略前后相繼的環節。

(三)智能分析

智能分析是將智能算法嵌入到數字信號處理中,通過分析和提煉移動目標的各種行為模式,形成核心算法。例如,智能分析技術已應用于電子文件管理系統的自動化測試工作,進而提高測試效率和測試結果的客觀性。[17]智能分析處于發展狀態,其在安防及圖像分析方面的優勢,將為檔案保管及檢索提供新的思路。

通過以上對信息分析方法在檔案領域應用現狀的分析,可得出以下結論:第一,相對于其他信息分析方法,一般分析方法在檔案學領域的應用范圍最為廣泛,且對具體方法的應用形成指導;第二,統計分析方法中描述性分析應用較多,適用范圍廣,其他統計分析方法應用較少;第三,計算機輔助信息分析方法在檔案領域均有所應用,其應用范圍由傳統環境向網絡環境擴展,分析對象由檔案管理信息轉向檔案內容信息;第四,新興信息方法得到了檔案領域的關注,探索新興信息分析方法在檔案領域的應用成為趨勢;第五,計算機輔助信息分析方法應用集中于對檔案工作進行分析,尤其是檔案管理工作的開發利用環節;第六,國外注重應用研究,方法應用系統完善;國內注重理論研究,方法應用較為零散??傊?,我國檔案領域在信息分析方法的應用方面已積累了一定的研究與實踐,但處于探索階段,需要系統地引進領域信息分析的理論與經驗,進而推動檔案學科向信息資源管理階段發展。

注釋及參考文獻:

[1]馮惠玲.從文獻管理到基于信息資源的管理——圖書情報與檔案管理學科的創新發展之路[J].情報資料工作,2013,(03):6-10.

[2]查先進.信息分析[M].武漢:武漢大學出版社, 2011.

[3]盧小賓.信息分析概論[M].北京:電子工業出版社,2014.

[4]DLM Forum Foundation.MoReq2010 Specification[R/ OL].[2014-2-1].http://www.dlmforum.eu/index.php?option= com_jotloader&view=categories&cid=e078fd469dd9933&Itemid= 129?=en.

[5]Department of Defense Chief Information Officer. DoD5015.02-STD Electronic Records Management Soft? ware Applications Design Criteria Standard[S],2007.

[6]The International Council on Archives. Principles and functional requirements for records in electronic office environments[R/OL].[2014-2-1]. http://www.wien2004. ica.org/en/2008/02/26/principles- and- functional- re? quirements- records- electronic- office- environmentscall-com.

[7]中華人民共和國國家標準. GB/T 29194- 2012,電子文件管理系統通用功能要求[S], 2012.

[8]王寅同.居民健康檔案數據聚類分析的研究[D].長春工業大學,2012.

[9]袁素娟,申志永,袁穎,郭丹云.基于時間序列分析的檔案危機管理探究[J].湖北檔案,2013(12):19-21.

[10]張仙茹.主成分分析法的電子檔案工作人員離職行為影響因素研究[J].技術與市場,2011(4):147.

[11]吳振新,張智雄,孫志茹.基于數據挖掘的Web Archive資源應用分析[J].現代圖書情報技術,2009,(1): 28-33.

[12]Li W J, Hershkop S, Stolfo S J. Email archive anal? ysis through graphical visualization[C]//Proceedings of the 2004 ACM workshop on Visualization and data mining for computer security. ACM, 2004: 128-132.

[13]張倩.應用Web數據挖掘技術捕獲網絡檔案信息資源的個性化服務研究[J].檔案與建設,2008,(7):15-18.

[14]丁瑾.多媒體數據挖掘技術在數字檔案中的應用[J].蘭臺世界,2006(22):11-12.

[15]Maristella Agosti,Costantino Thanos.Research and Advanced Technology for Digital Libraries,Rome, Italy, September,2002[C].Springer.

[16]張倩.高校檔案用戶行為大數據分析技術應用研究[J].檔案與建設,2014(8):16- 21.

[17]朝樂門.電子文件管理系統的測試方法研究[J].檔案學通訊,2014(6):57-60.

猜你喜歡
數據挖掘語義分析
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
語言與語義
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統及其自動化發展趨勢分析
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
一種基于Hadoop的大數據挖掘云服務及應用
認知范疇模糊與語義模糊
基于GPGPU的離散數據挖掘研究
主站蜘蛛池模板: 一本大道无码日韩精品影视| 无码中文字幕精品推荐| 久青草免费在线视频| 91在线免费公开视频| 亚洲午夜福利在线| 日韩免费毛片| 国产本道久久一区二区三区| 71pao成人国产永久免费视频| 亚洲69视频| 秋霞午夜国产精品成人片| 国产精品丝袜视频| 一级福利视频| 免费国产高清视频| 日韩一级二级三级| 欧美日韩北条麻妃一区二区| 欧美区在线播放| 无码高清专区| a网站在线观看| 久操中文在线| a网站在线观看| 五月天综合网亚洲综合天堂网| a欧美在线| 亚洲乱强伦| 亚洲女同欧美在线| m男亚洲一区中文字幕| 国产国产人在线成免费视频狼人色| 国产爽爽视频| AV片亚洲国产男人的天堂| 四虎国产精品永久一区| 国产成人你懂的在线观看| 亚洲人成网址| 午夜精品久久久久久久无码软件 | 一级毛片免费观看久| 欧美精品v欧洲精品| 在线免费看片a| 亚洲区欧美区| 日韩无码一二三区| 又黄又爽视频好爽视频| 99re精彩视频| 亚洲成人福利网站| 伊人婷婷色香五月综合缴缴情 | 欧美日韩中文国产va另类| 久久人人爽人人爽人人片aV东京热| 亚洲国产成人久久精品软件 | 精品无码日韩国产不卡av| 亚洲乱伦视频| 精品国产美女福到在线直播| 一级毛片免费不卡在线视频| 免费在线a视频| 欧美国产菊爆免费观看 | 激情综合五月网| 看国产毛片| 极品私人尤物在线精品首页 | 国产欧美在线观看精品一区污| 97国产在线观看| 69视频国产| 欧美高清视频一区二区三区| 中文字幕在线观| 波多野结衣在线se| 在线国产欧美| 激情六月丁香婷婷| 精品国产毛片| 亚洲码一区二区三区| 99在线视频精品| 亚洲欧美综合另类图片小说区| 真实国产乱子伦高清| 国产精品青青| 波多野结衣一区二区三区88| 亚洲国产亚洲综合在线尤物| 日韩高清一区 | 欧美综合区自拍亚洲综合绿色 | 秋霞午夜国产精品成人片| 国产成人精品男人的天堂下载| 精品无码国产自产野外拍在线| 国产福利在线观看精品| 精品国产自在在线在线观看| 亚洲三级色| 国内精品免费| 亚洲综合中文字幕国产精品欧美 | 亚洲欧美人成电影在线观看| 欧美日韩精品一区二区在线线| 日本高清有码人妻|