張凌燕
(常州工程職業技術學院 圖文信息中心,江蘇 常州 213164)
數據挖掘技術是依托于大數據技術所誕生和發展的新技術,它隸屬于人工智能技術,主要應用于商業領域。數據挖掘技術的誕生源自原始數據具有不規則性、復雜性、多樣性等特點,運用數據挖掘技術可以將原始數據中具有價值的信息提取出來,使其發揮出更多的作用。從商業層面上看,原始數據雖然數量龐大,但通過數據挖掘技術對其抽取、轉換、分析后,就可以為商業決策提供參考依據,從而促進相關行業及企業的健康發展。
聚類分析分為硬聚類和模糊聚類兩種主要類型。硬聚類是在指向距離最短的聚類中劃撥事物,且該項事物只屬于某一類。模糊聚類則不歸屬于某一類,極有可能存在多種類型。總體來說,聚類分析是對數據庫或對象庫進行抽選后,在每一組類當中放置一個相同或者相類似的數據,由此生成多個組類,這一過程就是聚類分析過程。聚類分析過程無須知識基礎,也無須監督管控,只需要找到數據中有價值的部分并對其進行相應的分類即可。聚類分析與“分類”之間既存在著一定的相似之處又存在著差異性,比如聚類分析無法知道相應的屬性,但可以分析出相間類聚的某些規律。因此,聚類分析技術在心理學領域、醫學領域具有較為廣泛的應用。
預測過程主要包括分類和預測兩種類型。分類指的是預估分類標號,也可以將分類視為數據挖掘技術中的一個基礎性步驟,在訓練數據可以預計的情況下,分類可以很好地呈現出其相應的特性,只要完成一個類別描述,便可以進行下一步的分類構建。在分類的過程中,不僅存在著監督的必要,還需要來源于訓練數據的確定性描述。目前的分類存在多種方法,決策樹和神經網絡是其中比較常用的兩種方法。在神經網絡系統當中存在著眾多具有分布式存儲信息、可大規模并行處理、自組織自學習能力良好的神經單元。也可以將神經網絡視為多個神經單元的集合,從而使軸突連接的生物神經元大群集問題得以有效解決。但事實上,每個神經單元還可以同時連接多個其它神經單元,特別是將相應的數值輸入以后,神經單元之間便可以重新進行數值組合,也可以對其進行求和。預測是指通過連續值函數模型的構建再借助分類、回歸、回歸分析法、局勢外推法等方法對數據規律進行預估。以回歸分析法為例,它可以根據數據庫當中某一數據的函數關系體現出數據之間的聯系與區別,最終分析出數據信息特質的依賴程度。
從理論的角度上分析,世界上所有事物都不是獨立存在的,一旦其中某一方發生變化,就會導致另外一方或者多方受到不同程度的影響,從而衍生出更多的變化。數據挖掘技術中的關聯分析就是依據這一項理論,以大數據技術作為支撐分析出事物之間的數據規律,再依據該規律開展預估工作。例如某電商企業針對購物籃進行分析時,需要先通過數據挖掘技術找到購物籃中各商品的排列規律及其內在聯系,進而分析出消費者的消費層次、消費心理、消費行為特征,最終推出具有較強針對性的營銷策略,推動銷量的提升。在現實世界當中并不存在信息“非黑即白”的情況,所以灰色關聯分析是所有關聯分析當中最為常見的方法之一。該方法主要以各因素的發展趨勢、相互之間的差異性或者相似度作為分析的依據,對各項數據進行歸納與評價,最終分析出各因素間的關聯性。當通過灰色關聯分析來描述數據信息之間的過渡階段時,包含已知和未知兩部分信息。由于未知信息的存在,導致分析結果存在較強的不確定性,而灰色分析則可以對解決方案進行優化,最終得出最佳解決方案,使數據分析中的各項問題得到妥善解決。
在目前所有的數據挖掘技術應用領域中,應用得最廣泛、效果最顯著的當屬市場營銷領域。企業在開展市場營銷的過程中通過應用數據挖掘技術,可以更加全面細致地分析出消費者的消費行為習慣。這樣一來,市場營銷人員便可以制定出極具針對性的營銷方案,促進銷售量的顯著提升。伴隨著數據挖掘技術的不斷發展,它在保險行業、電子商務行業中的應用價值也大幅提升。通過聚類分析方法可針對消費者無意識的、不規律的消費行為進行分析,從中識別出消費習慣和消費動機,賦予原本無效的數據信息新的應用價值,從而幫助企業制定出更加精準的營銷策略,促進企業的健康發展。
數據挖掘技術應用于制造業領域與應用于其他社會領域相比有所不同。數據挖掘技術在制造業的應用價值主要體現在檢查產品質量,如通過對產品數據進行研究分析找出其中的規律,或者通過對生產流程進行分析找出影響生產效率及產品質量的主要因素。分析后再有針對性地提出解決方案,使生產流程更加科學合理,使產品的生產成本得到有效控制。在制造業企業決策中,數據挖掘技術同樣可以發揮非常重要的作用,利用相關技術能夠獲取具備使用價值的數據信息,再通過決策樹算法確保決策的準確性與科學性。
近年來,我國的電信行業實現了快速發展,用戶規模也在不斷擴大。在這種情況下,電信企業必須采取有效措施提高自身的技術水平及服務質量,以此來保證客戶滿意度與忠誠度。但是,對于整個電信行業來說,技術服務屬于非常龐大的混合載體,唯有通過應用數據挖掘技術方可對各種復雜數據進行全面、深入的分析,找到其中的規律,進一步幫助電信企業對以往的技術服務體系作出優化調整,為用戶提供更優質的服務。
隨著我國教育體制的全面改革,數據挖掘技術在教育領域內也得到了很好的應用。教育管理者可利用數據挖掘技術對學生心理、行為習慣進行系統化的分析,并依據分析結果對學校的教育管理方式進行優化改革,幫助教師找到更加科學有效的管理方法,從而促進教學成效的提升。數據挖掘技術還可以針對學生的成績進行分析,找到大多數學生在學習中的薄弱之處,使教師為其提供有針對性的教學指導,促進教學質量的顯著提升。
伴隨著我國數據挖掘技術的整體發展,該項技術在科研領域、生物制藥領域、航空航天領域中也得到了大范圍的應用,并且取得了較為理想的應用成效。數據挖掘技術使大數據信息變得更加實用,使大數據技術的優勢在各行各業都得到了有效發揮。