黃鳳
伴隨著科研技術(shù)的不斷發(fā)展以及社會的不斷創(chuàng)新,網(wǎng)絡(luò)信息技術(shù)強化了社會信息交流的流暢性和拓展性。隨著信息的不斷增多,如何快速、準確的提取有使用價值的信息,成為 分析可視化數(shù)據(jù)挖掘技術(shù)。
【關(guān)鍵詞】可視化 數(shù)據(jù)挖掘 技術(shù)分析
傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)在應(yīng)用過程中,應(yīng)用者是無法觀察到數(shù)據(jù)挖掘的過程,只能夠獲得結(jié)果,在數(shù)據(jù)分析與挖掘的過程中使用者并不能直觀的觀察過程,其往往會導(dǎo)致使用者更與單一性的分析數(shù)據(jù)挖掘結(jié)果,失去數(shù)據(jù)挖掘的意義。可視化數(shù)據(jù)挖掘技術(shù)結(jié)合了計算機與用戶的視覺感受,是一種能夠直觀觀察的數(shù)據(jù)挖掘方式,在數(shù)據(jù)挖掘過程為用戶提供直觀性的信息數(shù)據(jù),便于用戶交互流量數(shù)據(jù),從而極大程度提升數(shù)據(jù)挖掘的效率、準確性、有效性,獲得更有使用價值意義的數(shù)據(jù)結(jié)果。
1 可視化及數(shù)據(jù)挖掘的含義
所謂的可視化,也就是指人借助視覺觀察并在思維中形成客觀事物影像的過程,這是一種心智處理的過程。可視化能夠提升人們對事物的觀察準確性并形成一個完整的整體概念。可視化結(jié)果能夠便于人們理解和記憶,并且對于信息的表達方式、處理方式是其他方式無法替代的。可視化技術(shù)普遍是以人所習(xí)慣的圖形、圖像為工具融入到信息處理技術(shù)當中,主要是將信息化數(shù)據(jù)以更加直觀的方式讓人所接受和理解。通過仿真化、形象化、模擬化等全新技術(shù)方式重現(xiàn)出來。可視化不僅可以以客觀的現(xiàn)實展現(xiàn)數(shù)據(jù)內(nèi)容,還可以為使用者提供富有規(guī)律、客觀、真實的數(shù)據(jù)信息。數(shù)據(jù)挖掘主要是指借助檢測和分析數(shù)據(jù),獲得更多潛在的有使用價值的信息。數(shù)據(jù)挖掘的定義主要分為狹義與廣義。狹義的數(shù)據(jù)挖掘主要是按照已經(jīng)處理過或分析過的數(shù)據(jù),從當中提煉出有使用意義的信息數(shù)據(jù),從廣義上分析,主要是在數(shù)據(jù)庫當中分析出富有應(yīng)用價值的數(shù)據(jù)信息。可視化數(shù)據(jù)挖掘?qū)τ诋斍霸S多企業(yè)而言均有著顯著的應(yīng)用意義,尤其是在大數(shù)據(jù)時代下,數(shù)據(jù)局逐漸成為現(xiàn)代化企業(yè)分析市場需求、掌握企業(yè)客戶群體的主要手段。
2 可視化數(shù)據(jù)挖掘的提出
由上述分析可以發(fā)現(xiàn),可視化技術(shù)與數(shù)據(jù)挖掘技術(shù)本質(zhì)上是兩個不同的領(lǐng)域,但是都與計算機技術(shù)有一定程度的關(guān)聯(lián)性。數(shù)據(jù)挖掘的過程需要可視化技術(shù)的支持,可視化分析本身也是數(shù)據(jù)挖掘的一個過程。其中,可視化主要是指將某一些無法看見的或抽象的事物通過能夠看見的圖像或圖形可視化出來;可視化主要是采用計算機創(chuàng)建相應(yīng)的圖形,從而理解哪些大量、復(fù)雜、無需的數(shù)據(jù)信息。可視化數(shù)據(jù)挖掘主要有三個階段,數(shù)據(jù)準備、模型生成、知識使用以及流程可視化。
數(shù)據(jù)準備:數(shù)據(jù)的準備階段主要是借助可視化數(shù)據(jù)挖掘技術(shù)將數(shù)據(jù)預(yù)處理的過程展現(xiàn)出來,簡單而言,就是將復(fù)雜、大量的原始數(shù)據(jù)通過某種規(guī)律進行展現(xiàn)和規(guī)劃,這里所致的可視化技術(shù)主要是包括數(shù)據(jù)的轉(zhuǎn)換、丟失值得處理、數(shù)據(jù)的裁剪以及數(shù)據(jù)的采樣等;生成模型:生成模型這一過程中主要是將目標數(shù)據(jù)庫通過數(shù)據(jù)挖掘操作技術(shù)細化數(shù)據(jù)挖掘每一個細節(jié)、過程,并將其展現(xiàn)出來。其中主要包括模型的選擇、參數(shù)的設(shè)計、數(shù)據(jù)的訓(xùn)練集、數(shù)據(jù)的挖掘細節(jié)以及結(jié)果的儲存等過程;數(shù)據(jù)使用。在數(shù)據(jù)使用這一階段中,可視化數(shù)據(jù)挖掘技術(shù)的操作目的主要是把數(shù)據(jù)挖掘的結(jié)果通過某種可視化方式展現(xiàn)出來,例如將結(jié)果通過樹形圖形展現(xiàn)出來,從而為數(shù)據(jù)使用者提供更加真實、可靠、完整的數(shù)據(jù)分析結(jié)果。普遍狀況下,數(shù)據(jù)挖掘的結(jié)果抓喲分為分類與關(guān)聯(lián)兩種,其都是以人類視覺能容易接受的方式展現(xiàn);流程的可視化。數(shù)據(jù)挖掘的流程可視化最終目的是將數(shù)據(jù)挖掘的整個過程以某種可視化方式顯示出來,讓用戶看懂,這也是為知識分析師、企業(yè)管理者提供更多依據(jù)進行決策和分析。
3 可視化數(shù)據(jù)挖掘的主要技術(shù)分析
可視化數(shù)據(jù)挖掘的主要技術(shù)主要是以下四種:1、標準2D與3D技術(shù)。這一技術(shù)主要是用于統(tǒng)計應(yīng)用,但是不是能應(yīng)用于多維數(shù)據(jù)。主要是借助條形圖、柱形圖和餅圖等常用的標準2D、3D技術(shù),這也是可視化的主要方式和結(jié)果;2、分層技術(shù)。分層技術(shù)的基本意義就是按照層次的特征,將多維數(shù)據(jù)空間劃分為多個子空間,并按照各個層之間的關(guān)聯(lián)性,將子空間以層次的結(jié)構(gòu)形式重新進行組建,并以圖形的形式顯示。分層技術(shù)主要依據(jù)層次軸、雙曲線、錐形圖等時機方式進行描述;3、幾何變換技術(shù)。幾何變換技術(shù)主要是對數(shù)據(jù)集進行降維處理。其基本意思就是借助投影、映射將多維數(shù)據(jù)轉(zhuǎn)變?yōu)?D、2D的形式,準便成為人視覺所能夠理解的投影。幾何變換技術(shù)適用于多維數(shù)、低數(shù)據(jù)量的數(shù)據(jù)庫。其實施方式主要有平行坐標法與投影追蹤等;4、面向像素技術(shù)。面向像素技術(shù)主要是分析像素點在屏幕當中的分布狀況,其能對于一些數(shù)據(jù)量龐大的數(shù)據(jù)庫進行細致的分析,進而獲得數(shù)據(jù)的整體結(jié)構(gòu)和分布狀況。因為面向像素技術(shù)分析的是像素點,所以其能夠按照分析目標的不同,選擇不同的排列方式,其應(yīng)用方式主要是遞歸技術(shù)與數(shù)據(jù)管道技術(shù)。
例如,在信貸方面的應(yīng)用中,信貸數(shù)據(jù)的挖掘和普通數(shù)據(jù)挖掘不相同,主要是統(tǒng)計和挖掘一些信用度較高的用戶。金融行業(yè)的信貸欺騙行為不斷增多,這也為可視化數(shù)據(jù)挖掘技術(shù)的應(yīng)用提供了更多的空間,借助挖掘技術(shù)防止信貸欺騙的發(fā)生,從而提高信貸企業(yè)的經(jīng)濟利益。借助可視化數(shù)據(jù)挖掘技術(shù),應(yīng)用異常檢測與人工神經(jīng)網(wǎng)絡(luò)的方式檢測信貸申請的過程,并借助Clementine軟件對所獲得的數(shù)據(jù)庫進行統(tǒng)一性分析和記錄,對具備信貸欠款和拖欠的信貸人統(tǒng)計到一起,并在信用貸款的申請中計算其可能存在的信用欺騙度,首先,是多次申請信貸的記錄;其次,個人或企業(yè)的經(jīng)濟狀況以及信貸類型是否符合企業(yè)的記錄。對于一些偏離長條的行為進行記錄并標記,借助可視化的數(shù)據(jù)挖掘過程,決策者能夠更加準確的掌握是否能夠放貸于該個人或企業(yè)。
4 總結(jié)
綜上所述,在大數(shù)據(jù)時代環(huán)境下,做好數(shù)據(jù)挖掘工作有著非常明顯的作用和意義,假設(shè)如果無法完成良好的數(shù)據(jù)挖掘技術(shù)工作,便無法展現(xiàn)大數(shù)據(jù)的優(yōu)勢,導(dǎo)致缺乏針對性的數(shù)據(jù)信息,從而逐漸降低企業(yè)的競爭力。此外,伴隨著信息技術(shù)與計算機技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)必然會隨之創(chuàng)新,對此,就必須相關(guān)工作者及時掌握社會上全新的數(shù)據(jù)挖掘技術(shù),并將其合理應(yīng)用。
參考文獻
[1]耿學(xué)華,傅德勝.可視化數(shù)據(jù)挖掘技術(shù)研究[J].計算機應(yīng)用與軟件,2006(02):85-87.
[2]段曉君,杜小勇,易東云.可視化數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[J].計算機應(yīng)用,2000(01):54-56.
[3]張俊.可視化數(shù)據(jù)挖掘技術(shù)的研究與實現(xiàn)[J].重慶工商大學(xué)學(xué)報(自然科學(xué)版),2013(03):58-61+92.
作者單位
江蘇省泰興中等專業(yè)學(xué)校 江蘇省泰興市 225400