楊慧慧 梁艷
摘要:基于社會海量的數據分析的需求、人工智能與機器學習、統計學等理論的應用等數據挖掘誕生發展的理論挑戰,數據挖掘技術應用而生。該文結合數據挖掘的相關理論知識,通過數據挖掘在實際中的應用,分析探討了數據挖掘中存在的問題及研究方向。本文基于Clementine的數據挖掘技術對住房意向影響因素進行分析,主要利用Modeler的基本分析對住房狀況調查應用分析研究,從而對房地產行業進行數據挖掘提供一定的借鑒和指導意義。
關鍵詞: 住房狀況;數據挖掘;Clementine;Modeler的基本分析
引言
數據挖掘是一個新興的研究方向,它融合了多種學科進行研究探索。它的基本目標就是海量無序的數據中提取出不可見的卻有用的知識和信息。目前從數據挖掘研究和開發應用表明:數據挖掘的需要涉及到多種不同的應用任務,從數據的預處理到相關性分組或關聯規則、聚類分析、數據分類、偏差檢查、序列模式、描述和可視化等等特定的模式。因此, 這一技術應用是一個極富挑戰性的任務。數據挖掘技術在實際的研究過程中綜合了金融、醫療、保健、零售、和政務等各個領域,取得了良好的社會經濟效益,以此可以看出數據挖掘技術在現實中有著較為廣泛的應用和開發前景。
1、數據挖掘技術及應用
1.1 數據挖掘技術
數據挖掘技術面對的主要對象為龐大的數據庫,以此便能夠進行有效的信息搜索和查詢。一般而言,一般情況下,大數據挖掘系統包括七個方面的內容:用戶圖形界面接口、模式評估、數據挖掘引擎、數據庫或數據倉庫服務器、數據基地、數據倉庫以及知識儲備庫。……