李怡
摘 要:隨著時代科技的不斷進步,互聯網信息技術已經滲透到社會中的各個層面。數據庫的運用使得企業信息、國民生態、社會狀態等方面都有了可靠的參考依據。目前數據庫的功能都是存儲、查詢、統計等,通過這些數據獲得的信息量只占整個數據庫信息量的一小部分。怎樣才能對數據庫中真正具有價值的信息進行使用,從而提高有效信息的利用程度,這就需要新的技術來進行這方面的工作。數據挖掘技術從被開發以來便被廣泛利用,它能夠有效的實現對有價值信息的自動、智能和快速的分析與提出。數據挖掘技術在分析大量數據時具有明顯優勢,在電力、金融、保險等行業得到廣泛的運用。
關鍵詞:數據挖掘 應用范圍 科學研究
中圖分類號:TP311 文獻標識碼:A 文章編號:1672-3791(2017)08(c)-0021-02
21世紀被稱為互聯網時代,信息技術已經成為國民發展的重要組成部分。信息網絡技術在各行各業都得到廣泛的利用,有效提高的企業發展的經濟水平與管理水平。但是,計劃經濟轉向市場經濟的速度逐漸加快,競爭也是逐漸激烈,這就導致各行業的信息系統積累了大量的數據信息,并且由于沒有專業的信息技術對數據進行分類處理,使得信息數據愈加增多,造成存儲混亂,使用不便。數據挖掘技術的出現使得這些問題得到了有效的解決。目前在我國的信息化管理、科學研究、電力企業、金融行業、醫學醫藥業等方面,對數據挖掘技術的使用非常頻繁。在大數據背景下的企業發展受到市場經濟的阻礙,數據挖掘技術能有效的對大數據進行處理,并且實現自動化、智能化,加強海量數據的有效利用,進而促進互聯網時代的發展。
1 數據挖掘技術的概述
數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。人們把原始數據看作是形成知識的源泉,就像從礦石中采礦一樣。巖石數據可以是結構化的,如廣西數據庫中的數據,也可以是半結構化的,如文本、圖形、圖像數據,甚至是分布在網絡上的異構型數據。發現知識的方法可以是數學的,也可以是非數學的;可以是演繹的。也可以是歸納的。發現了的知識可以被用于信息管理、查詢優化、決策支持、過程控制等,還可以用于數據自身的維護。所以,數據挖掘是一門很廣義的交叉學科,它匯聚了不同領域的研究者,尤其是數據庫、人工智能、數理統計、可視化、并行計算等方面的學者和工程技術人員。
2 數據挖掘的過程
數據挖掘的整個過程是需要對既有的數據進行挖掘計算并建立數據模型,以及圍繞數據挖掘所進行的預處理和結果表達等一系列的步驟,這個過程需要反復進行,反復處理,保證數據結果的實用性。數據挖掘是知識發現的重要組成部分,其主要步驟為以下幾點。
2.1 目標定義
數據挖掘需要確定明確的目標。挖掘目標的定義是需要具有數據挖掘經驗的技術人員,以及在該領域具有權威的專家和最終用戶之間相互配合、相互協作,目標定義是否適度對數據挖掘的成功概率有較大的影響。數據挖掘的目標定義既是對實際工作中對過程的要求,也是通過對各種學習算法的對比進而確定可用的算法。
2.2 數據準備
數據準備是數據挖掘的重要組成部分,所占比例基本都在一半以上。從數據的選擇、預處理以及變化三個方面進行有序的準備。數據選擇是從既有的數據信息庫中提取有關數據,作為目標。數據預處理是隊數據目標進行相應的處理,反復處理,直到數據目標符合數據挖掘的要求。數據變化的作用就是精減數據維數,也就是在進行數據挖掘前,對目標數據的特征進行處理篩選,選出具有價值的特征,以免在進行數據挖掘時進行不必要的特征分析以及考慮刪減個數。
2.3 數據挖掘
這個階段便是數據挖掘中的實際操作階段。首先要確定采用哪種類型的方法進行數據挖掘,其次,是對開始選擇的挖掘方法選取一種計算算法。最后,在保證上述的準備階段不出現任何問題后,就能進行具體的數據挖掘,也就是運行數據挖掘算法模塊。這個階段才是數據挖掘的主要階段,也是數據挖掘分析者和相關領域專家最為重視的階段。
2.4 成果和評估
最終用戶影響著提取信息的分析成果,所以要根據最終于用戶的決策目的進行數據分析,并提取其中最具價值的信息。數據挖掘過程中的模式要在完成數據提取后進行機器或用戶的評估,對去其中與數據挖掘無關的模式要進行刪除,以免對下次運算形成干擾。有的模式是無法滿足用戶需求的,對于這種模式不能刪除,而是要將其退回到上一階段。本文所提出的最終用戶基本就是以人為主體的單位,所以要對方向的模式進行可視化,或是把提取的數據信息運用其他用戶易懂的模式展現出來。
3 數據挖掘的應用領域
數據挖掘技術對于目前的企業發展有著重要的作用,從以前的挖掘算法研究到如今的實際運用,都表明了數據挖掘技術的廣泛性和實用性。目前在已知的領域中,基本都開發除了許多專業的數據挖掘工具,包括電力、金融、醫學、天文、交通等方面的數據挖掘工具。
3.1 科學研究
科學研究需要時刻記錄數據,并且需要大量的實際信息數據進行實驗分析,一般的數據分析工具對于大數據計算速度緩慢且無法提取有價值的信息,所以數據挖掘技術就被應用進科學領域,并且起到了重要的作用。在天文圖形分析、衛星遙感器和DNA分子技術等方面均取得了不錯的成果。有了數據挖掘技術的支持,科學研究中的數據不再被壓縮以及混亂堆放,有效提高了科研工作的效率。其中科學研究中應用數據挖掘技術的還有醫藥研究、生物研究、地質研究、考古研究、星體運作規律研究、化工研究等。
3.2 市場營銷
市場營銷作為企業發展的根本保障,幾乎每天都要積累相當多的數據,而市場營銷也是第一個應用數據挖掘技術的領域。數據挖掘技術在市場營銷中的作用主要客戶資源、客戶市場、客戶流失分析和客戶穩定等。其中,在客戶細分與流失模型等方面數據挖掘的應用較為成熟。在市場營銷中還包括電力行業、保險行業、信用卡業等方面的應用,使得企業對客戶的了解程度加深,能夠有效判斷客戶的購買模式,從而針對有價值的客戶進行長期合作。
3.3 醫學醫藥
醫學行業的制藥方面可以采用數據挖掘技術針對分子制藥到醫療診斷等方面提高效益。藥物的合成需要對藥物分子的化學結構有全面的了解,在藥物分子分析的過程中確定藥物中原子或原子基因所針對哪種病情具有治療作用,可以作為之后的新藥合成時的依據。
3.4 金融行業
金融行業的數據量可以用海量來形容,數據挖掘技術的應用有效改善了金融行業數據多卻不能科學處理的現象。銀行、證券公司等幾乎每天都會產生非常大的數據,并且流量速度快,其中包括很多不確定的風險因素,可以利用數據挖掘技術對此進行深入分析,比較典型的就是股票的市場預測以及金融詐騙等。
本文只是列出了典型的幾個數據挖掘技術應用的領域,當然數據挖掘技術的應用領域不止這些,隨著社會的不斷發展,數據挖掘技術也將會在各個領域發揮重要的作用。
4 結語
就目前已知的所有領域中,基本都有著數據挖掘技術的存在,這不但體現了數據挖掘技術的實用性,也體現了我國各行業的發展正在不斷加快。數據挖掘技術的影響力越來越大,社會關注度也越來越高,相信隨著時代科技的不斷發展,對未知領域的不斷探索,數據挖掘技術的應用范圍必將更加廣泛。
參考文獻
[1] 苗宇.計算機數據挖掘技術的開發及其應用探究[J].城市建設理論研究:電子版,2016(22):155-156.
[2] 陳建偉,李麗坤.數據挖掘技術研究[J].數字技術與應用,2016(1):91.endprint