王洪飛
摘 要:隨著信息技術的快速發展,計算機功能也逐漸融入了一些統計學理論,計算機數據挖掘技術應運而生,并且該技術也隨著云計算、云存儲技術的發展而發展,為人們解決了很多問題?;诖耍疚膹挠嬎銠C數據挖掘技術的過程入手,對計算機數據挖掘技術的開發和應用進行了探討,旨在促進計算機數據挖掘技術的進一步發展。
關鍵詞:計算機;數據挖掘技術;開發;應用
中圖分類號: G2 文獻標識碼: A 文章編號: 1673-1069(2016)27-147-2
0 引言
所謂數據挖掘技術,就是幫助人們在眾多信息中查找出所需要信息的一種技術,該技術在我國出現的時間比較晚,但卻以其特殊的功能得到了快速發展。該技術不僅具備計算機技術的特性,同時還兼具了統計學功能。在信息數量不斷增加的今天,想要從中搜索到需要的信息不是一件簡單的事,計算機數據挖掘技術成功地為人們解決了這個困擾,受到了越來越多人的歡迎。
1 計算機數據挖掘技術的過程簡介
1.1 確定數據庫和數據挖掘的目的
數據挖掘技術功能比較多,而想要充分的利用該技術,首先必須確定本次數據挖掘的目的,進而根據目的選擇相應的數據庫。因為計算機數據挖掘技術中包含多種數據挖掘方法,不同的數據挖掘目的應該采用不同的數據挖掘方法,否則會直接影響數據挖掘結果的準確性,可見確定數據挖掘的目的和相應的數據庫是利用數據挖掘技術的關鍵點。
1.2 數據選擇和預處理
確定了數據挖掘的目的和相應的數據庫之后,接下來就需要在該數據庫中提取一部分目標數據,需要注意的是,必須要確保目標數據中包含需要的信息,并將該目標數據作為數據挖掘的一個主要范圍,這個過程叫作數據選擇。確定了目標數據之后,需要對目標數據進一步處理,將大部分的無用信息和錯誤信息進行刪除,保留有用信息,這個過程叫作預處理,其實際作用就是精簡目標數據。
1.3 數據挖掘
首先,根據數據挖掘的目的確定數據挖掘技術的類型和采用的算法,算法是數據挖掘的精髓所在,合適的算法能夠使數據挖掘結果可靠性提高,更有實際借鑒意義。其次,由于數據挖掘的算法針對的是一個數學模型,應根據數據挖掘的算法構建數學模型,以便實現數據挖掘算法對目標數據的處理。最后,在計算機上利用算法進行數據挖掘并得到相應結果。
1.4 評估結果
該階段的主要目的就是對數據挖掘的結果進行科學分析、合理評估。盡管我們利用數據挖掘技術得到了結果,但是結果正確與否還需要進一步驗證,如果結果不符合本次數據挖掘的目的,則需要對數據挖掘算法和數學模型進行重新選擇;如果結果符合本次要求,就可以將這些數據結果應用到實踐過程中,進而達到指導工作或者提高工作效率的目的。
2 計算機數據挖掘技術的開發及工具
2.1 傳統統計方法
傳統的統計方法比較多,例如抽樣技術、多元統計分析、統計預測等都屬于傳統統計方法。其中,抽樣技術就是在眾多數據中提取部分信息作為樣本數據,目的就是減少數據分析量;多元統計分析主要針對對象是結構復雜并且維數較高的數據或因子;而統計預測主要分為序列分析和回歸分析兩種預測分析方法。
2.2 可視化技術
利用數據挖掘技術可以得到想要的數據結果,但是通常情況下,想要發現這些數據結果中隱含的某些特征,就需要借助一些圖表、散點圖等方式,將其直觀地表現出來。當前可視化技術的難點主要集中在對高維數據的可視化方面。
2.3 聯機分析處理
聯機分析處理主要用于分析多維數據,在該分析過程中,需要多個用戶的積極配合,同時,用戶主動對分析算法進行分析篩選,也有助于對數據的深入探索。
2.4 決策樹
決策樹的建立基礎是具有一定規則的,主要用來對數據進行各種分類和預測。決策樹包含的算法也比較多,例如SLIQ、SPRINT、CHAID、CART、ID3、C4.5等等。其中,前兩種算法還可以處理分類屬性和連續性屬性,并由極大的訓練集對決策樹進行歸納。
2.5 計算機神經網絡
將醫學界對人體神經元的研究成果作為參考,我們也對計算機進行了深入研究,并形成了計算機神經網絡。計算機神經網絡可以大致分為輸入、輸出和處理單元三個層面。利用計算機神經網絡技術,可以實現對數據的調整、計算和整理。
2.6 遺傳算法
在自然界中,基因可以通過突變、聯合或者選擇等不同的過程進行自我優化,以這種進化論為基礎,可以將現代群體按照一定規則進行重新組合,進而得出新的群體。按照這種思想,我們可以對數據模型進行重新組合,得到更加適合并且得到優化的一種新的數據算法。
3 計算機數據挖掘技術的應用
3.1 市場營銷方面的應用
現代消費者在購物的時候,利用POS機刷卡結賬的行為非常普遍,而在這個過程中,關于這些消費者的一些信息就可以被銷售商所采集,并且消費者越多,銷售商所采集到的有用信息就越多,這些信息對于市場營銷具有非常重要的作用。不同的銷售商或者生產商,可以根據所采集到的有用信息,分析消費者的各種不同需求、購物習慣,從而進一步分析消費者的消費心理,最終對消費者的下一步消費行為進行推斷。例如,企業可以利用消費者使用信用卡的情況分析商品的銷售情況,也可以通過某些促銷活動,確認消費者的消費意向等等。以上種種分析結果,都離不開計算機數據挖掘技術,由此可見,計算機數據挖掘技術不僅能夠幫助相關企業了解顧客需求,而且還能夠為企業進行重大商業決策提供準確數據信息,大大增強了企業的市場競爭力。
3.2 金融投資方面的應用
數據挖掘技術在金融投資方面的應用,主要利用模型預測法和統計回歸技術,集中在對投資進行評估以及對股票交易市場的預測。眾所周知,金融投資的風險性較大,因此在投資之前,有必要對各種數據進行分析、統計、總結,規避可能存在的各種風險,確保投資方向的準確性。由于一切事物的發展都具有趨向性,我們可以根據這種趨向對其進行預測。也就是說,我們可以通過對現有數據進行深度分析,挖掘其中可能存在的一些數據關系,然后根據這些關系實現對投資評估、股票市場等的預測,幫助投資者做出科學合理的選擇。
3.3 其他領域的應用
在半導體領域,利用數據挖掘技術可以發現有問題的半導體元件,極大提高了產品的生產質量;而在電子商務領域,數據挖掘技術也加快了用戶查找數據的速率,并能夠根據用戶的瀏覽記錄對用戶的需求和喜好進行深入分析,適時為用戶推薦需要的產品,實現了獨特的個性化服務。此外,數據挖掘技術還被廣泛地應用到了一些生產型企業,幫助企業實現企業利潤最大化,為企業提供風險參考依據等等,總之,數據挖掘技術在各種領域都得到了普遍應用。
4 結束語
作為一種重要的分析方法和有效工具,計算機數據挖掘技術在各個領域都得到了快速發展,并且廣受歡迎。利用計算機數據挖掘技術,用戶可以得到自己想要的數據結果,并通過對這些結果的進一步分析,為用戶制定決策提供參考依據。未來,我們相信,隨著計算機技術的快速發展,計算機數據挖掘技術能夠為用戶解決更加棘手的問題,該技術的應用范圍將會越來越廣。
參 考 文 獻
[1] 夏天維.計算機數據挖掘技術的開發及其應用探究[A].決策與信息雜志社,北京大學經濟管理學院.“決策論壇——管理科學與工程研究學術研討會”論文集(下)[C].決策與信息雜志社,北京大學經濟管理學院,2016:1.
[2] 宋金城.計算機數據挖掘技術的開發及其應用探究[J].計算機光盤軟件與應用,2013,23:130+132.
[3] 沈文淵,丁穎.計算機數據挖掘技術的開發及其應用探究[J].信息系統工程,2014,06:87.
[4] 郝園園.計算機數據挖掘技術的開發及其應用探究[J].信息化建設,2015,10:105.