摘 要:隨著計算機的普及,我們的生活逐漸進入大數據時代,可通過數據搜索質量較高的餐館、飯店,也可通過數據使商家更加清晰的了解用戶的想法,以滿足用戶的需求,更好的為用戶提供服務。這也使得在大數據分析和決策制定等方面的作用至關重要,而本次實驗主要研究計算機數據挖掘技術的開發和應用進行深入的分析。
關鍵詞:計算機;數據挖掘;開發與應用
數據挖掘技術是一門利用某種算法對數據庫中數據進行處理以提取隱含重要信息的交叉性學科,而由于在進行數據挖掘的過程中需要進行大量的數據分析、搜集和計算等工作,因此需要伴隨著計算機的使用,這也使得數據挖掘技術的發展和計算機科學的進行相輔相成[1]。數據挖掘技術是與20實際70年代開始得到迅猛的發展,并且被各界學者和企事業極大的關注。現階段,數據挖掘技術已經被廣泛使用到社會生活中的各個方面,比如用戶需求挖掘、產品數據分析、市場分析分析等[2]。
一、計算機挖掘技術的過程簡介
(一)確定數據庫和數據挖掘的目的
在數據挖掘過程中,首先需要確定數據庫和數據挖掘的目的。其由于是數據挖掘中存在的方法較多,不同的方法造成的影響也是不僅相同,因此只有確定數據挖掘的目的,才可選擇合適正確的數據挖掘方法,這也是確定數據庫和數據挖掘的目的的關鍵所在。
(二)數據選擇和預處理
數據選擇和預處理是計算機挖掘技術過程中的第二步,其中數據選擇是指根據數據挖掘的目的從數據庫中選擇合適的目標數據,預處理則是對選擇的目標數據進一步搜索。而進行預處理的原因為:數據庫中的數據的數量過于龐大,存在大量冗余數據以及存在錯誤的信息,而預處理就是將這些冗余信息和錯誤信息進行篩選剔除,保證數據分析的正確性[3]。
(三)數據挖掘
數據挖掘是整個過程中的核心,其主要包括三步:首先根據數據挖掘的不低確定數據挖掘技術的類型和采用的算法,其次是根據數據挖掘的算法結構建立數學模型;最后是在計算機上利用算法進行數據挖掘并得到相應的結果[4]。其中首先確定朱解決挖掘技術的類型和采用的算法,原因是算法是數據挖掘的精髓,只有確定合適的算法,才可保證數據結果的準確性,是數據挖掘才更具有意義。
(四)評估結果
在利用計算機進行數據挖掘得到結果后,需要對得到的結果進行評估。如果檢測的記過比較合理,便可使用,而如果檢測的結果和現實存在一定的差異,則需要重新選取數據挖掘的算法和模型。
二、計算機數據挖掘技術的開發
(一)基于傳統統計方法的數據挖掘技術
隨著技術的普遍發展,出現了新型的統計方法,但是某些傳統統計放在在數據挖掘中仍然使用,比如抽樣、多遠統計、統計預測三種方法。其中抽樣是應用較為廣泛的一種方法,其主要針對數據庫內的數據較大的情況,通過隨機選取某些樣本進行檢測;多遠統計是指針對含有多個統計量的數據庫;統計預測則通常用來利用先驗信息和其他知識對數據發展的趨勢進行預測。
(二)基于可視化技術的數據挖掘技術
可視化技術也是常見的方式。一般來說可視化技術的應用可以更加清晰的表明數據之間存在的關系以及數據特征,其常用的方式為:圖示、表格等。而在實際應用中,一元數據的可視化已經達到一定的水平,并且被廣泛的使用,但是對于多元數據的可視化技術的應用方面,仍然存在這一定的缺陷,需要進一步研究。
(三)基于聯機分析處理的數據挖掘技術
聯機分析處理主要針對于聯機中的用戶組,其主要進行多遠數據的數據挖掘。在聯機中,如果某一用戶提出數據分析的需求,可以通過選擇相應的數據挖掘算法,對相應的數據庫實行數據挖掘。并且在實際應用中,可以針對數據挖掘內數據特征的不同,選擇對聯系分析處理和可視化技術進行選擇,從而進行使用。
(四)基于決策樹的數據挖掘技術
決策數是利用大量的數據歸納出一系列因果關系,基于其中的邏輯和規律關系,構成關系圖,而關系圖主要以樹狀圖為主。其主要的作用是分析內部結構,因此在分類、分析與預測中有著廣泛應用。
(五)基于神經網絡的數據挖掘技術
神經網絡方法是模擬人的神經進行數據處理的方法,其結果包括輸入層、隱藏層和輸出層[5]。而在神經網絡使用之前需要進行測試,即將大量的數據輸入神經網絡中,并根據相關的結果調整神經網絡的參數,從而保證數據的可靠性。
(六)基于遺傳算法的數據挖掘技術
遺傳算法,主要基于進化論的“優勝劣汰”的自然規則,對數據中“優”的一方進行保存,對“劣”的一方進行剔除或者改造,從而保證算法達到最優水平,得到最優的結果[6]。
三、計算機數據挖掘技術的應用
(一)數據挖掘技術在市場營銷上的應用
我國作為人口大國,同樣也是消費者的大國。每個消費者的信息都對市場營銷起著重要的作用,有助于市場了解消費者的需求,更好的為消費者服務。同時也可以擴大企業的效益,推動消費者的消費行為。而數據挖掘技術在市場營銷的應用中,是基于市場營銷學的市場細分原理并利用計算機數據挖掘技術對不同商品消費者的年齡、購買數量、購買頻率、性別、購物習慣以及購物金額等相關信息進行分析,從而提到數據分析的效率,而常用的方式便是通過對信用卡的使用情況進行分析,不同促銷形式下消費者的購買情況進行分析。
(二)數據挖掘技術在指導投資上的應用
商品或者股票的價格并不是保持不變的,也不是變化的毫無規律的,因此可以通過對價格的變化趨勢進行分析,從而預測未來的變化,以保證具有較高的投資收益。而計算機數據挖掘在知道投資上的應用便是是指利用數據挖掘分析某種商品或骨片在一定時期的數據對價格的趨勢進行預測,降低投資的風險。
(三)數據挖掘技術在其他領域的領用
數據挖掘技術除了可應用到市場營銷和指導投資等方面,在社會生活的其他方面也是比較常見的,比如在文化建設方面,相關部門或者圖書館可以利用數據挖掘技術對消費者的數據進行分析,了解其常看的數目類型,從而進行文化建設等。此外,其在企業利潤的最大化、行業生產指標設計、資金鏈管理設計與風險控制等方面也得到較為廣泛的應用。
總結:數據挖掘技術在現在社會生活中具有至關重要的作用,因此需要深入的了解數據挖掘技術,熟練的掌握計算機數據挖掘技術。
參考文獻:
[1]郝園園. 計算機數據挖掘技術的開發及其應用探究[J]. 信息化建設,2015(10):105.
[2]李春安. 基于WebGIS的土壤作物動態信息智能系統的開發與應用[D].吉林農業大學,2013.
[3]徐欣航. 基于電廠運行參數最優值確定的評測系統的開發與應用[D].河北科技大學,2012.
[4]梁瑩. 基于數據挖掘技術的客戶消費行為分析系統的開發與應用[D].廣西大學,2011.
[5]陳桂香. 大數據對我國高校教育管理的影響及對策研究[D].武漢大學,2017.
[6]李鋼. 大數據時代文本挖掘的版權例外[J]. 圖書館工作與研究,2016(03):28-31+46.
作者簡介:
姓名:陳新昕(1999.02--);性別:男,籍貫:湖北省武漢人,學歷:本科,畢業于武漢東湖學院;現有職稱:web前端工程師;研究方向:前端開發.
(武漢東湖學院 ? 湖北 ?武漢 ? 430212)