鄭海霞
摘 ? 要:由于網絡中信息的愈加豐富以及拓撲結構的復雜性,使得信息存在著信息數量過載和資源導向迷向的問題,面對當今網絡中浩如煙海的信息,如何實現在其中進行有效數據的挖掘使其更好地應用到實驗室信息管理系統中成為當今實驗室管理人員所要面臨的重要考驗。基于此,本篇文章中筆者針對于實驗室信息管理系統中數據挖掘的應用進行分析和論述。
關鍵詞:數據挖掘 ?實驗室 ?信息管理 ?系統
中圖分類號:TP311.1 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2019)09(b)-0179-02
隨著時代的不斷發展,各國都開始愈發重視數據挖掘在實驗室信息管理系統中的重要性。在我國也不例外,雖然很多數據得以被應用,但是在數據之后內涵的大量信息未被應用,故此,重視數據挖掘在實驗室信息管理系統中的應用對于社會各行業等都有著較為深遠的影響,從中可以獲得和提取無法預料的模式,并且可以透過不同的數據庫推斷出其中的知識。
1 ?數據挖掘相關概念的闡述
數據挖掘是隨著時代發展而新興的熱門學科,其理論基礎來源于統計學科和數據庫系統相關知識,再通過機器獲得相關算法來發現模式,從而實現將大量數據庫中的信息進行整合使其變換成相對容易被理解的知識再被進一步供相關人員進行使用的目的。數據挖掘可以對相關數據進行自動或者半自動分析,從而在其中獲得數據的模型或者相關的知識,故此,認為數據挖掘僅僅是發現知識或者僅僅是為了獲得數據的想法是不正確的。當前在我國,數據挖掘可以被應用于人工智能和電子商務等領域。
2 ?實驗室管理系統的發展歷程
在20世紀90年代末至本世紀初,LIMS網絡系統技術才逐漸引入我國,并開始被相關研究人員所了解。此后,我國實驗室管理信息系統學術相關研討與展示會的成功創辦和我國相關實驗室管理系統的建設以及相關軟件系統的開發都對LIMS網絡系統技術在我國的推廣起到了推波助瀾的作用。2001年12月,隨著我國不斷打開國門加入了世界貿易組織(即WTO)使得許多國外的實驗室管理理念和LIMS網絡系統技術的相關產品進入我國,以及我國國內相關行業與國外同行業的競爭加劇,雖然很多國外的LIMS網絡系統技術相關產品具有較為成熟的技術水平,但是很多LIMS網絡系統技術相關產品不能實現很好的中國化,實施的成功率較低,對此形勢,迫使我國國內相關行業必須要不斷提高自身的管理水平,研究出適合我國本土使用的LIMS網絡技術系統來增強其競爭力,從而推進實驗室管理系統的不斷發展,生產處更具靈活性的LIMS網絡技術系統相關產品。
3 ?在實驗室信息管理系統中應用數據挖掘的重要性
數據挖掘的任務就是將大量的、模糊的數據集中在一起進行識別,從中挖掘出其背后所蘊含的信息,進而將其轉化為可供人們方便理解使用的模式的過程。但是由于互聯網自身存在的復雜性和更新速度快等特性,使得數據挖掘成為一門涉及統計學、數據庫、模糊數學等諸多知識的交叉學科。因此,其技術的復雜性使得數據挖掘成為了一門社會各界認為任重而道遠的研究熱點。
4 ?數據挖掘在實驗室信息管理系統應用中的現狀
就近年來看,數據挖掘在各個領域都有了長足的進步,例如,在醫學對疾病的治療和新藥物的開發,乃至基因方面的研究都取得了出色的成果。但是,仍舊存在著只對數據進行采取和對數據結果的看重的現象,并未深入對數據本身進行分析,且數據挖掘相關的算法頗多,僅依賴于LIMS網絡系統技術是遠遠不夠的,同時,面對著不斷快速發展的時代,如果不對數據進行科學的處理就無法迅速從其中獲得有效的信息,從而產生資源大量浪費的現象,對此,重視數據挖掘能夠高效地應用于實驗室信息管理系統中是當前實驗室信息管理人員所需要重視的研究方向。
5 ?數據挖掘在實驗室信息管理系統應用中存在的問題
5.1 數據挖掘方法方面
數據挖掘技術越來越應用于更多的發展領域,不斷出現新的數據挖掘的相關任務,使得數據挖掘技術成為更加充滿美好發展前景的領域。當前,數據挖掘技術包含了數據表征和相關分析、數據回歸等涉及廣泛的數據分析和數據知識,但是這些任務不能實現在同一個范式下使用同樣的數據庫,并且其中還需要大量的數據挖掘的相關算法。除此之外,還可以在數據庫搜索知識時實現多維空間對數據的探索,同時通過將多學科開放的數據進行集中可以提高數據挖掘技術的能力。大部分的數據還是停留在互聯網的大環境之中,且有些可能出存在著殘缺甚至模糊,為此,提升互聯網大環境下對數據的發現和處理能力能夠促進數據挖掘技術的不斷發展。
5.2 數據挖掘算法方面
數據挖掘要求能夠及時有效地從多個數據庫中挖掘出相關的數據并提取出有關的信息,對此數據挖掘的算法必須具有有效性和一定的伸縮性。由于數據庫中數據分布具有廣泛性和流動性快的特征,為此所挖掘的數據很有可能呈片段式,并且要將這些片段的數據進行處理,最終將其合并起來。
5.3 數據挖掘類型方面
數據挖掘技術由于涉及諸多領域,對此,其數據挖掘的類型也呈多樣化的特點,既包括動態數據也包括靜態數據,既包括時間數據又包括空間數據,但是要想讓系統進行所有數據類型的挖掘是無法實現的。
6 ?數據挖掘技術在實驗室信息管理系統中的應用
6.1 數據挖掘和預處理階段
可以采用開源log4日志引擎系統來實現在不影響系統性能的前提下方便獲取實驗室信息管理系統的使用以及用戶的訪問情況的目的,數據挖掘來自于系統中的日志數據系統,為減少因數據數量過多而加重的負擔,可以只保留所認為最有用的數據,使一些沒有字段的信息被刪除掉。同時要建立索引來保證在檢索頻繁的情況下依舊能保證數據存儲性能的良好,從而達到提高實驗室信息管理數據庫效率的目的。
6.2 數據挖掘技術的應用
由于各個用戶都有著自己獨特的需求,對此實驗室信息管理系統要根據數據記錄對其進行聚類分析,從而找到訪問頻率較高的板塊來為用戶提供更加優質的服務。首先要進行數據源的前期清洗工作,要將系統中之前是數據紀錄進行刪除同時也要刪除掉已經離職的用戶的訪問數據記錄,并主要針對系統總的訪問次數和當年的訪問次數進行記錄從而使得數據更加能夠貼近用戶的實際訪問情況。其次,要對所挖掘的數據進行聚類分析,將其分類為活躍、一般和懶惰三個系統模塊,從而可以了解到用戶對每個板塊的使用情況,進而為用戶提供更為方便的服務。
7 ?結語
綜上所述,數據挖掘技術是一門涉及諸多學科的技術,雖然目前我國對于其相關的研究已經獲得了一定的成果,但是數據挖掘技術仍舊缺乏較為完善的理論系統,對此社會各學者都積極對此展開相關研究,從而出現了百花齊放的特征。而將數據挖掘應用于實驗室信息管理系統之中,從中找到其內在知識和聯系,揭示其內在規律對科研項目、人員及其成果的評價方面都能起到重要的作用,同時對進一步提高數據挖掘技術在實驗室信息管理系統之中的應用也具有積極的促進作用。
參考文獻
[1] 李海林,楊麗彬.信息管理專業數據挖掘人才培養模式研究[J].計算機時代,2017(11):92-94.
[2] 李玥,吳麗麗,魏霖靜.高等農業院校信息管理與信息系統專業培養模式與專業改革探索[J].河北農業大學學報:農林教育版,2017,19(5):34-38.
[3] 張美華,王文濤.數據挖掘技術在機房信息管理中的應用[J].電腦知識與技術,2017,13(12):5-6,30.