數據挖掘和數據分析的區別是什么?數據挖掘挖掘出來的是人類未知的東西。數據分析的是我們已知的,天氣不好的時候交通可能會堵,這是分析出來的,不是數據挖掘的,因為我們知道天氣不好和交通不好有關系,這個知識我一開始就有了。數據挖掘是挖掘未知知識。
大數據的挑戰是什么?一個是實時的海量數據分析,數據量太大,但又要實時分析,時效性要求特別高。第二是高度可擴展的數據倉庫。數據倉庫是數據挖掘的基礎技術,數據倉庫和現在的大數據概念也有一定的沖突,因為數據倉庫要求所有數據之間的關聯都被保留,不被切斷。我們希望數據倉庫能夠一天比一天分析更多的數據,這是一個挑戰。解決這個問題,對于未來的數據挖掘,未來的高速聯機分析都有很大幫助。
數據是資產。當你擁有了大量的歷史數據,便可以在歷史數據上去做數據挖掘,做數據發現。如果有機會讓數據資產化,將是很大的價值。