周凌
【摘 要】隨著計算機、互聯網、移動終端產業的飛速發展,各行各業對數據的采集、傳輸、積累,數據逐漸成為最有價值的非物質產物,標志著大數據時代的到來。然而,雖然大數據之中存在極有價值的數據,但也擁有大量無價值或者冗余數據,讓數據的價值大打折扣,這就衍生出了數據挖掘這一突破性的技術手段。數據挖掘技術一經問世就受到各行業的廣泛關注,成為軟件行業時下最熱門的關鍵詞和發展方向,其意義之重大可想而知。論文淺略分析和介紹了大數據的含義、數據挖掘技術的基本原理,并著重分析數據挖掘技術在各企業中的應用和價值。
【Abstract】With the rapid development of computer, Internet and mobile terminal industry, and the collection, transmission and accumulation of data in various industries, the data has gradually become the most valuable nonmaterial product, which marks the arrival of the big data era. However, although there is very valuable data among big data, there is a lot of worthless or redundant data that greatly reduces the value of the data. This leads to the breakthrough technique of data mining. As soon as data mining technology comes out, it has attracted wide attention from various industries, and has become the hottest keyword and developing direction in the software industry, the significance of which can be imagined. This paper briefly analyzes and introduces the meaning of big data, the basic principle of data mining technology, and emphatically analyzes the application and value of data mining technology in various enterprises.
【關鍵詞】大數據;數據挖掘;應用
【Keywords】big data; data mining; application
【中圖分類號】TP311 【文獻標志碼】A 【文章編號】1673-1069(2018)05-0189-02
1 引言
大數據是數據集優化、分配和管理發展的背景和平臺。在操作過程中,數據的潛在信息不易準確搜索,需要進一步挖掘和優化數據挖掘技術。可見,數據挖掘技術在大數據時代占有重要地位。它的技術發展和應用表明,數據信息的編輯和處理功能影響重大,具有重要的發展意義和作用。
隨著我國各行業市場化進程的推動,以及互聯網、數據分析技術對傳統產業的顛覆,“大數據分析”遲早會成為中國企業界突破藩籬的關鍵手段,依靠單一信息進行分析的系統已經無法滿足市場需求,建立以多種信息采集、分析、識別、研判、歸檔、展現的綜合性平臺成為發展趨勢。
2 數據挖掘技術的分析方法
2.1 聚類
聚類分析是將數據集劃分為多個類似的組,其目的是最大限度地提高識別相同的數據類型之間的關聯性。通過不同數據之間的關聯性,找到有用的數據集。這種分析方法可以應用在客戶群體、客戶分類、背景分析,以此事先分析客戶需求并提前進行準備,聚類分析廣泛存在于心理學、醫學、銷售等領域中的數據識別分析。
2.2 分類及事先推測
分類是對相同的數據庫里面的數據根據形式、特點進行對應分類,并針對不同的目的進行統計和劃分。這種方式的好處是可以通過數據的某一特點,反映該數據項的目的需求。該方式可用于客戶分類、客戶特征、滿意度、購買趨勢的分析,該方式對于單一行業來說數據積累越多價值越高,是一種連續積累的價值功能模型。
2.3 關聯分析
在自然界中,各事物之間存在一定的聯系。關聯分析利用這一特性,查找存在于本數據集合與對象集合之間的關聯、相關性或因果結構。該方式能發現交易數據中不同商品的關聯性,防止在交易過程中可能出現的問題,或者尋找市場的影響因素以不斷改良自身產品,使利益達到最大化。
2.4 特征分析方法
特征分析方法的特點是在數據庫內部的一組數據中提取關于該組的數據,從而顯示整個數據的特征,作為營銷人員對客戶流失數據的提取,了解如何利用這些數據找到原因,有助于留住客戶。
3 數據挖掘技術的應用
3.1 數據挖掘的基本過程
挖掘技術是一個集數據集成、數據挖掘過程于一體的綜合分析系統,其需要依賴一個固定的工作流程來完成信息資源的整合和挖掘工作,一般分為三個步驟:一是數據的準備,從一開始就進行數據挖掘,必須明確需要挖掘的“目標數據”,也就是說進行數據挖掘時首先需要有數據基礎及挖掘目的,不能盲目進行分析工作。在數據準備過程中,系統將根據特定的操作和指令,檢索滿足需求和目標的信息資源,并進行分類、清理、編輯甚至預處理。二是數據挖掘。經過處理后,需要對目標數據信息進行挖掘處理,使其能夠正確、高效地引入管理機制。因此,操作環節是整個程序的關鍵環節。例如在數據挖掘中,我們可以結合數據挖掘目標要求,針對性地選取科學而又合適的計算和分析方法,對數據信息特征與應用價值等進行尋找和歸納;當然,也可以結合程序應用的需要,對數據區域進行固定,并在固定的數據區域內分類挖掘數據,從而得到更具深度和內涵以及價值的數據信息資源,并就挖掘到的數據結果進行分析和解釋,從結果中將具有使用價值和意義的規律進行提取,并還原成便于理解的數據語言。最后是切實加強管理和計算等專業知識的應用,將數據挖掘技術實施中進行的總結和提取所獲得的數據信息與評估結果在現實之中應用,從而對某個思想、決策是否正確和科學進行判斷,最終體現出數據挖掘及時的應用價值。
3.2 技術應用的延展方向
在大數據時代,未來的幾年中,數據挖掘技術的應用領域將進一步擴大,現已廣泛應用于市場營銷、科研、生產、制造、電信、教育,將逐步擴展到其他行業如航空航天、生物醫藥、刑偵、技術應用的發展,數據挖掘的功能要求必須變得更加豐富,以滿足高新技術產業的發展[1]。
3.2.1 挖掘后數據信息資源的職能范圍和表現形式
依靠單一的轉型背景和環境促進數據挖掘技術是不科學不合理的,因此,在網絡信息環境下,我們將不得不考慮社會經濟的變化,科學技術,文化和環境的發展趨勢等因素,這樣才能更好地促進數據挖掘技術職能的轉變,以最大化地發揮其應用成效。這主要是因為數據信息資源在挖掘后,其自身的職能作用將變得更加豐富,所以在信息技術環節下的數據挖掘技術將會隨著限定條件變化,而將數據挖掘信息應用于技術管理和決策管理之中,能夠更好地彰顯企業在經濟活動中的物質性質與價值變化趨勢,并結合數據變化特點和具體的表現規律,將數據信息的基本要素、質量特點、管理要求等展示出來,所以其表現形式十分豐富。數據挖掘之后的信息在職能范圍和表現形式方面均得到了豐富和拓展,而這也在一定程度上體現了網絡擬定目標服務具有較強的完整性,且屬于特殊的個體物品,同時也是對傳統數據挖掘技術的創新和發展,從而更好地滿足當前大數據時代對信息進行數據化的處理,并對不同種類業務進行整合和優化,從而提高數據挖掘技術服務的一體化水平。
3.2.2 充分利用大數據背景,防止數據挖掘技術信息失真
數據挖掘技術源于社會信息,因此,在各行各業對數據挖掘技術有需要的人應該對社會、網絡等自身需要的信息資源進行總體規劃,使其成為具有公共屬性的產品,促進其個性化職能的發揮,主導、控制管理數據挖掘技術管理的各項工作 [2]。首先,大數據背景下的數據挖掘技術,信息技術程度要高,能被記錄,挖掘、管理,因此,要促進數據挖掘技術和信息資源應用的轉變,必須充分利用大數據背景,在業務和技術程序實現一體化。業務和技術程序的一體化也意味著數據挖掘技術可以把帶來的資源消耗、變化及管理等進行科學有效的記憶,只要技術經營者愿意,能夠獲得發生在資源消耗源頭的信息,這對評價數據信息資源消耗的效益是非常有意義的,有助于作業價值的評估,優化業務流程。在大數據背景下,重新定義了數據挖掘技術職能,數據挖掘技術的信息有內部和外部服務之間的差異,因此合理控制企業內部各階段,各種類型的數據挖掘技術信息,以及輔助管理機制,提高了數據挖掘技術的相關功能。
4 結語
大數據時代給現在的社會發展帶來很大的幫助,各種挖掘技術不斷涌現,給數據的存儲、分析、解決帶來很大幫助,同時可以快速地將數據轉換成財富,成為企業發展的工具,應該理解數據挖掘和應用的基本方法,這是企業轉型發展的一個重要機遇,它可以幫助企業快速發展和生存,能最大限度對客戶需求進行深度分析以制定合理的發展規劃及產品定型,減少資金投入。
總之,大數據與深度挖掘技術不僅是一種新型技術形態,也是時代發展的必然趨勢,具備極大的研究價值以及市場前景,正等待著我們的發掘和應用。
【參考文獻】
【1】田志民,梁品超,任艷紅,等.大數據時代下數據挖掘技術與應用[J].當代教育實踐與教學研究,2017(10):4.
【2】李文艷.大數據時代下數據挖掘技術的應用[J].數字技術與應用,2016(05):74.