摘要:不同產業在發展過程中需要對相關的數據進行分析,從而將其作為產業規劃以及發展的重要參考,互聯網技術的發展推動了大數據時代的到來,同時對于數據挖掘有了新的要求,本文主要就大數據時代數據挖掘及其在產業發展中的作用進行分析。
關鍵詞:大數據時代;數據挖掘;產業發展;作用分析
數據信息在不同產業發展中具有重要的參考價值,隨著大數據時代的來臨,在互聯網中充斥著各類數據,通過對大量數據的挖掘,可以從其中尋找出具有重要價值的數據,并將其作為產業發展的支撐。本文結合相關文獻資料,對大數據時代數據挖掘及其在產業發展中的作用問題進行分析。
一、大數據概述
1、大數據的定義
所謂的大數據,主要是充斥在互聯網中的各類數據信息,數據信息容量極大,這些數據信息以多種形式存在,比如:社交網絡、電子商務網站、顧客來訪紀錄等等,這些數據與公司顧客關系管理數據庫中的常態數據組存在著明顯的差異,大數據作為一種重要的信息資源,只有在數據挖掘的基礎上才能夠找出其中具有應用價值的數據,并將其用于不同行業中的決策、流程優化等。
2、大數據特點
大數據具有以下特點:(1)數據來源的多樣性:從上述大數據定義中可知,大數據中的數據來源具有多樣性,比如:社交網絡、電子商務網站、顧客來訪紀錄等;(2)數據量龐大:大數據相對于常規數據,單位從TB已經發展到PB;(3)數據價值密度低:盡管大數據中有各種各樣的數據,但是能夠真正對產業發展有價值的數據需要挖掘,而不能直接拿來應用;(4)數據類型的復雜性:數據類型除了最直接的數據外,在視頻資料、圖片資料、音頻資料等相關資料中也有數據的存在;(5)數據增長速度快:大數據時代下的數據增長幾乎符合于指數增長規律;(6)對于數據挖掘技術要求較高:在大量的數據中要找到具有應用價值的數據信息,需要有高效的數據挖掘技術作為支持[1]。
二、大數據時代數據挖掘分析
1、數據挖掘定義
大數據時代中對于數據的處理至關重要,其中基礎性的是數據產生和收集,關鍵性的則是數據挖掘,所謂的數據挖掘就是從大量的、隨機性的、有噪聲的、模糊的數據中通過應用一定技術方法,從中提取出能夠直接用于產業發展規劃或者是具有潛在應用價值的相關數據,這個過程就是數據挖掘,當然實際的數據挖掘操作較為復雜。
2、大數據挖掘特點
大數據在挖掘過程中同樣也具有以下特點:(1)應用性特點:數據挖掘后獲得的數據資料主要用于指導不同產業發展或者決策,具有明顯的應用性特點;(2)集合性特點:數據挖掘過程中集合了多種功能,并非單一功能的應用,比如在挖掘功能方面包含了異常檢測、關聯規則挖掘、數據可視化、聚類分析等,當然不同功能在實現中所需要的理論支持以及技術要求也存在差異;(3)交叉性特點:數據挖掘中需要有多種學科的介入,有明顯的交叉性特點,如:人工智能、機器學習、統計分析、數據庫技術等;(4)工程性特點:數據挖掘過程屬于一個工程化過程,除了最基礎的算法分析外,還需要有數據準備、數據管理、數據處理、數據轉換等相關過程的參與[2]。
三、大數據時代數據挖掘在產業發展中的作用
在大數據時代背景下,不管是現實生活中還是在互聯網生活中都存在著各類數據信息,而我國眾多產業的發展過程中都需要有數據信息的支撐,比如電信業、銀行業、醫療產業等,通過數據挖掘技術能夠根據不同行業需求,從中找尋出具有應用價值的數據以及不同數據之間隱藏的規律,根據已經掌握的數據信息建立相應的模型,通過模型分析和預測,能夠指導并用于不同企業以及不同行業的日常經營,也就是說需要具備大量數據信息的行業在實際發展過程中,大數據挖掘都能夠在其中發揮重要作用。
四、實例分析
1、大數據挖掘在銀行中的應用
大數據挖掘在銀行中具有重要的應用價值,比如通過構建FICO評估模型、貝葉斯分析模型等,可作為銀行信用評級的重要模型,從而以此為依據對貸款方進行信用風險評估,降低銀行在借貸方面的風險。通過數據挖掘還能夠進行客戶管理,一方面維持老客戶,另一方面則能夠及時發現以及開拓新客戶。在銀行客戶流失方面,大數據挖掘同樣具有重要的應用價值,通過數據挖掘能夠發現部分客戶表現出的流失特點,此時需要及時采取措施避免大量客戶的流失。
2、大數據挖掘在電力行業中的應用
電力行業在發展中也存在著大量數據信息,尤其是在智能電網發展、電力企業信息系統構建、電力企業客戶管理等方面都具有重要的應用價值。比如在電力信息系統建立過程中,傳統的管理模式正在不斷的進行轉變,基本實現了網上業務咨詢、網上業務辦理等,這些都會產生大量的數據,通過對數據的分析以及利用,可以掌握不同地區網上業務辦理的比例、主要繳費方式、用電量情況以及主要用電區間等,這些信息都有助于電力企業更好地為廣大用戶服務。
結束語
大數據時代下,看似雜亂無章的數據,通過數據挖掘可以發現其中具有重要應用價值的數據,這些數據在不同產業發展中均屬于重要的數據資料,能夠為不同產業的發展規劃奠定基礎。
參考文獻:
[1]李濤,曾春秋,周武柏,等.大數據時代的數據挖掘——從應用的角度看大數據挖掘[J].大數據,2015,1(04):57-80.
[2]吳漢華.大數據時代中如何進行醫療數據挖掘與利用[J].硅谷,2014,7(05):12-13.
[3]盧建昌,樊圍國.大數據時代下數據挖掘技術在電力企業中的應用[J].廣東電力,2014,27(09):88-94.
作者簡介:付世豪(2000.02.02—)男,漢族,遼寧省丹東市人,高中學歷,研究方向:計算機(大數據方向)。endprint