劉璐璐
(中州大學國資處,鄭州450044)
近年來,隨著我校北校區的大力建設和硬件設施的不斷完善及師生人數的不斷增加,固定資產和低值易耗品的購入數量與使用頻率隨之增多,設備檔案資料的種類也在不斷增多,例如:固定資產種類和數目的不斷增長和調整,使得資產賬目信息需要大量錄入與輸出,后期相關數據的保存難度和工作量都會隨之加大。要想進一步提高檔案管理的工作效率,就得從原有的純手工檔案資料管理方式上有所突破,這就要求設備的管理模式不能局限于手工管理模式,要與現代化網絡數據庫管理模式相結合。
與傳統的檔案管理方式不同,高校設備檔案具有使用范圍廣、次數多、使用者要求高的特點。隨著近些年學校設備的不斷引進及設備資料的不斷增多,包括收集、整理、歸納等。傳統檔案管理是手工管理模式,管理方式已經無法滿足現行工作需求,我們目前需要一個確實可行的技術方法——數據挖掘技術。
數據挖掘技術從定義上講就是從大量的不完整的模糊的數據中提取信息的一種方法。基本的方法有:①關聯分析法。它是從統計學的角度出發,指在從給定的數據集或者數據庫中發現頻繁出現的那部分項或者集合,從而分析這部分數據集合的特征和性質。例如,某電子市場通過關聯分析,找出了若干個用戶在購買所需電子產品時,所需或者偏好購買的品牌電子產品,進而反映出這部分用戶的購買習慣。②序列模式分析法。它比關聯分析法能更進一步解釋數據集合的特征。它是指在一組有序的集合中,頻繁出現的那部分集合按一定順序重新組合構成的模式。例如:計算超市購物中被共同購買的商品,它把每個顧客的一次交易視作一個Transaction,計算在不同Transaction中不同Item組合的規律性。而如果我們考慮一個用戶多次在超市購物的情況,那么這些不同時間點的交易記錄就構成了一個購買序列,N個用戶的購買序列就組成一個規模為N的序列數據集。③分類分析法。將有關數據信息通過一定方式進行分類的方法。例如:學校可以根據學生的學習基礎、掌握知識情況和分數情況,對其進行層次分劃。④聚類分析法。從表面意義上講就是從分析過的數據信息中再次進行細致的加工分析方法。在學校里,可以通過學生的基礎信息數據將所有學生信息分組,并對所有學生的學習模式進行描述,找出他們的特征,進而幫助教師制定有計劃和針對性的授課方案。⑤孤立點分析法。孤立點是所有數據信息中出現故障或排斥的信息點或信息段。孤立點分析法廣泛應用于銀行、金融業、電信部門和企業的經營管理等。例如:銀行可以利用孤立點分析發現銀行卡信息詐騙、銀行卡或信用卡丟失等。
當今的高校設備檔案管理模式既是對設備檔案的管理,也是對其數據信息的數字化統計過程。它不僅從表面上實現了檔案的靜態模式管理,更實現了其數字信息不斷更新的動態管理,從而對檔案管理員的效率也是個提高。設備檔案管理系統模式的建立使檔案的錄入和查閱工作變得更加方便和快捷。以傳統手工整理模式進而轉變為高、準、快的數字化錄入模式,使資產管理人員及時了解學校設備的信息,真正實現了錄入、編輯、修改等功能,達到了方便高效的管理目標。
1.設備檔案的分類
設備檔案分類是將單位所有固定資產和低值易耗品所建立的檔案分成不同的種類,從橫向來說每一類里的檔案具有相似的屬性,從縱向來說不同類別里的檔案的屬性是不同的。數據挖掘可以幫助從事設備檔案管理的人員細致而準確地將所屬檔案進行分類。例如:數據挖掘可將檔案按照屬性類別進行排序,從而提高檔案管理員的檢索效率。
2.設備檔案的收集工作
首先對各設備數據的基本信息進行分析,建立一個已知的數據集模型,對每一個要測試的樣本,用已知的與預測的類別進行比較,若一個模型的準確率經測試被認可,則就可以用這個模型對未知對象進行具體的分類。例如,設備檔案管理員對全校在編教師筆記本的領用情況進行書面統計,并將統計結果錄入數據庫中。這些信息包括姓名、年齡、性別、職稱、職務、學歷層次、所屬學院(部門)、領用時間、筆記本型號等。當一個教師的信息被輸入到數據庫中時,該教師與其他新進教師的檔案屬性相匹配后,其他所有新進教職工的信息屬性隨之自然分類。
3.設備檔案的保管工作
設備檔案的保管核心工作,是保管好新設備檔案的同時防止舊設備檔案流失的過程。對學校這樣一個特殊群體,其設備檔案在保管過程中,除了正常的手工保管紙質文件要在通風干燥的環境下保存,還要在檔案數據庫中建立一個完整的備份系統,在這個系統里要建立好相關的網絡保護措施,防止外界的病毒侵入,造成整個設備檔案軟件系統癱瘓。
4.協助配合資產使用部門搞好服務工作
設備檔案信息是為檔案利用人員服務的,不同單位不同部門的利用人員對檔案的需求和利用程度不同,數據挖掘技術針對不同人員對設備檔案的不同需求,設定不同的屬性值和分類情況,為他們提供最優的檢索結果,為國有資產管理部門的主動服務提供可靠保證。例如:兩個不同的部門查找同一設備的不同檢索信息,分別輸入設備的兩個不同屬性,結果顯示出的結果是兩個部門所需的不同檢索結果。
數據挖掘技術的工作過程分為:數據的抽取、數據的存儲和管理、數據的展現等關鍵技術。
1.數據的抽取
數據的抽取是數據進入倉庫的入口。由于數據倉庫是一個獨立的數據環境,它需要通過抽取過程將數據從聯機事務處理系統、外部數據源、脫機的數據存儲介質中導入數據倉庫。數據抽取在技術上主要涉及互連、復制、增量、轉換、調度和監控等幾個方面的處理。在數據抽取方面,未來的技術發展將集中在系統功能集成化方面,以適應數據倉庫本身或數據源的變化,使系統更便于管理和維護。
2.數據的存儲和管理
數據倉庫的組織管理方式決定了它有別于傳統數據庫的特性,也決定了其對外部數據的表現形式。數據倉庫管理所涉及的數據量比傳統事務處理大得多,且隨時間的推移而快速累積。在數據倉庫的數據存儲和管理中需要解決的是如何管理大量的數據、如何并行處理大量的數據、如何優化查詢等。目前,許多數據庫廠家提供的技術解決方案是擴展關系型數據庫的功能,將普通關系數據庫改造成適合擔當數據倉庫的服務器。
3.數據的展現
數據展現主要有以下方式:
⑴查詢:實現預定義查詢、動態查詢、OLAP查詢與決策支持智能查詢;
⑵報表:產生關系數據表格、復雜表格、OLAP表格、報告以及各種綜合報表;
⑶可視化:用易于理解的點線圖、直方圖、餅圖、網狀圖、交互式可視化等技術表現復雜數據及其相互關系;
⑷統計:進行平均值、最大值、最小值、期望、方差、匯總、排序等各種統計分析;
⑸挖掘:利用數據挖掘等方法,從數據中得到關于數據關系和模式信息。
通過數據挖掘技術在資產檔案中的應用,大大提高了我校國有資產管理員的檔案管理效率,對于檔案利用者來說也更加及時與方便,通過使用這項技術,我校設備檔案的管理也顯得更加規范和有秩序。總之,數據挖掘技術在我校國有資產檔案管理中起著至關重要的作用。
[1]萬睿,祁風義.淺談高校儀器設備檔案現代化管理[J].2007(2):154-155.
[2]劉瑾.高校設備檔案的計算機化管理[J].檔案管理,2002(1):28-29.
[3]Jiawei Han,Micheline Kamber.數據挖掘概念與技術[M].范明,孟小鋒,等譯.北京:機械工業出版社,2001.