薛美芳
[摘 要]隨著網絡技術與應用的不斷發展,計算機網絡在圖書館建設中已經變得越來越普遍。網絡圖書館建設嚴重依賴于計算機網絡,因此網絡運行的穩定性、可靠性就顯得至關重要,于是網絡管理就應運而生。本文是通過數據挖掘網絡診斷法應用在高校網絡圖書館建設中。它對大規模網絡圖書館的故障診斷具有理論指導意義和實際應用價值。
[關鍵詞]網絡圖書館;數據挖掘;故障診斷
一、引言
在信息社會里,網絡圖書館具有巨大的發展潛力和優勢。但在我國高校目前的客觀條件中,建設網絡圖書館還存在諸多問題,網絡的可靠性是推行網絡圖書館的發展與建設過程中的一個難點。圖書館網絡的通訊線路和站點都會由于某種原因出現故障,甚至有可能造成整個圖書館網絡不能正常工作。因此對網絡圖書館的可靠性研究已成為當今急需解決的課題之一。近幾年來,網絡的可靠性研究已經有很多成果。本文是通過數據挖掘網絡診斷法應用在高校網絡圖書館建設中。它對大規模網絡圖書館的故障診斷具有理論指導意義和實際應用價值。
二、數據挖掘網絡診斷法
應用數據挖掘方法,網絡故障診斷系統可以通過分析已有的異常信息的正確處理方法以及各種異常之間的前后關系的記錄,得到其間的關聯規則,這些有價值的信息可用于網絡故障的定位檢測和嚴重故障的預測等任務。并能根據當前的診斷信息,就可以得到其后續發生各種情況的可能性,對危險事件可以起到預防的作用,從而使通信網絡得以安全運轉。
數據挖掘的任務是從大量的數據中的找到模式或知識。根據它們的作用方式可分為兩類:一類稱為描述性模式,它是使存在于數據描述的規律。如泛化模式,聚類分析模型,及時問的關聯模式序列模式。另一種是預測模型,它是基于知識從現有的數據挖掘某些數據得到預測未知的性質。包括分類模型和回歸模型。其中,分類模型是一個重要的預測模型。
抽象分析,挖掘分類模型步驟如下:首先,我們必須把挖掘數據庫進行預處理:把數據庫中的記錄進行排序,包括取消一些不完整的記錄和獨立的性質,主要是為了確定一個類別的屬性,并確保每一個記錄類別屬性已經給出。然后,從待挖數據中提取形成訓練樣本集。把訓練樣本集運用一種或多種分類挖掘方式進行挖掘,最后輸出某種方式的分類模式。分類模式的方式有決策樹,數學公式,分類規則等。
所謂數據挖掘是從大量的不完整的,嘈雜的,模糊的和隨機提取隱含在其中的實際應用數據,人們先前不知道,但又是潛在的有用的信息和知識。這個定義包括幾層意思:數據源必須是真實的,有很多嘈雜的,發現是用戶感興趣的知識,知識發現是可以接受的,可以理解,可以應用,不要求發現放之四海皆準的知識,僅支持特定的發現問題。數據挖掘可以看作是KDD的一個小步驟,如圖所示。
三、數據挖掘網絡診斷法在高校網絡圖書館智能服務中的應用
目前,在網絡中的高校圖書館智能服務網絡診斷數據挖掘應用還比較少,和智能網絡服務的許多方面,該庫已經應用:如分類,編目,索引,流通管理,信息檢索等。在建設一個圖書館以及圖書館和信息管理過程的可靠性分析,智能書籍改進信息技術,從而完成傳統圖書館向數字圖書館發展的數據挖掘過程中使用的網絡診斷方法是智能圖書館的飛躍,是一個重要的研究圖書館的發展和建設。
1、數據挖掘網絡診斷法在網絡圖書館文獻分類中的應用
文檔分類是根據相似性和文學之間的差異的內容和形式定義的,按照一定的體系,有系統地組織和分化的文獻。工作人員在圖書館分類是基于文獻揭示和整理文件,所反映的主題內容和功能的外在形式。文學的主要目的是基于對組織文化的不同類別的學科知識的系統分類,使文學的同一學科性質在一起,形成學科體系,使用文獻檢索,以滿足讀者的需求。
網絡圖書館收集了大量的書籍和文件,也有幾十萬,上百萬,甚至千萬。每個在這些文獻中引用的文件分類給予DOI。每個CLC對準對應于一個固定的位置。如此大量的文檔可以按照分類系統排列有序。然而,這樣一個龐大的網絡圖書館系統,有效和快速的分類管理,極大地測試計算機系統網絡的可靠性。當嚴重的網絡故障發生在網絡圖書館系統,以及它如何能夠有效排除故障?當在網絡圖書館文獻分類數據挖掘的網絡故障診斷,可以發揮自己的優勢,迅速而準確地排除網絡故障,網絡圖書館文獻分類數據挖掘的網絡診斷具有非常廣闊的應用前景。
2、數據挖掘網絡診斷法在網絡圖書館的檢索工作環節的應用
現有的網絡庫的檢索方面是利用人工智能技術來模擬人腦的收集,存儲,檢索和匹配,推理(感性)和管理。和信息的收集,存儲,檢索和匹配,推理(感性)和管理的檢索過程中其他方面的工作,難免會遇到諸如故障情況。數據挖掘的網絡診斷,以排除網絡庫中檢索故障的各個方面都有非常快速和準確的優點,將解決這個問題不能得到解決在圖書館遇到的檢索網絡鏈路上,導致網絡庫檢索革命。“
檢索網絡圖書館是一個綜合的人機系統由一個由幾個子網絡,由全球性組織實現圖書數據檢索和共享,提供分析,規劃,預測和信息綜合控制系統的一部分。經常會發生在這樣一個大的檢索系統的故障的問題,因此操作系統到網絡所需的系統維護在固定的時間間隔,例如沒有解決的問題。并解決了數據挖掘的核心是研究網絡診斷方法的一個網絡問題。如果在先進的數據挖掘庫網絡診斷網絡可靠性分析技術使用時,將被綁定到一個網絡庫的變化。
3、數據挖掘網絡診斷法在圖書館自動化網絡中的應用
計算機網絡連接,并控制了大量的庫現代化圖書館的網絡,也稱為庫計算機網絡的形成。由于書目數據庫的出發點和它的北美建筑的基礎上,也被稱為書目機構。
圖書館自動化網絡具有多種功能:
①連續出版物管理,建立連續劇會員庫,開展自動化業務的聯合目錄。
②權限控制,通過網絡集線器規范文檔書目數據庫,編目成員館,以控制名稱規格(人名,地名,書籍名稱,組織機構名等)和主題規范,以達到規范化和標準化。
③在網絡共享計算機硬件和軟件資源。一般情況下,各個業務庫可以使用所有圖書館自動化網絡的全部或部分,但更側重于聯合編目,館際互借和權限控制等。每個特定的網絡具有不同的功能。
④聯合目錄查詢,使用終端來檢查網絡是否藏在一個特定的文件,隱藏在庫中。
⑤電子郵件,利用計算機網絡進行通信大廳的電子郵箱服務的成員。
⑥聯合編目成員館使用的網絡為中心的大型書目數據庫,并取得產品目錄在線目錄,同時生成的工會大廳的中心的所有成員的目錄(請參閱合作編目)。
⑦館際互借,與聯合目錄,網絡通過終端大廳的每個成員可以在網上館際互借。
⑧采購協調,聯合目錄,以了解情況和西藏博物館收藏功能協調采購政策及其成員圖書館和決定是否特定于采購文件。
圖書館自動化網絡如此強大的功能,在其運行的過程中勢必出現無法解決的可靠性分析問題,數據挖掘網絡診斷法應用于自動化網絡故障診斷技術中,勢必又會促使圖書館自動化網絡技術產生進一步提升。
四、結語
總體而言,與傳統圖書館相比,圖書館的網絡化具有巨大的發展潛力和優勢。在大型網絡庫的可靠性分析各個環節的中,數據挖掘的網絡診斷方法應用到解決這些問題的理論意義的可靠性和實用價值。但是,數據挖掘的網絡診斷和組合應用到網絡圖書館的建設的各個方面還需要長期艱苦的努力。因此,在聯合過程中應由易到難,一步一步,最終建設勢必成為高校發展過程中一顆燦爛的明珠。
參考文獻:
[1]李康.數據挖掘技術在網絡故障診斷中的應用研究[J].計算機軟件與理論2004.12
[2]郭淑蘭.交叉撕裂網絡診斷法在高校網絡圖書館建設中的應用[J].大江周刊2013.1
[3]李峰,趙海興,徐宗本.構建一類新網絡簇的可靠性控制集[J].計算機學報,2013.6
[4]郭軍.人工智能技術在圖書館中的應用[J].現代情報.2002.8
[5]楊曉玉.淺談圖書館文獻分類工作[J].投資與合作.2011.12
[6]郭淑蘭.論高校網絡圖書館的建設[J].都市家教2010.11