□李明敏 李玉壯 鐘佰霖 任利峰
信息技術隨著時代的發展而快速發展,數據庫作為計算機領域的重要環節也不斷復雜多樣,其結果就造成了大量的數據成為所需數據的“絆腳石”,因為巨額的垃圾數據增多,傳統模式下的查詢、報表工具已經無法對數據進行挖掘。因此,能夠處理巨額的數據并從中取得所需要的數據的數據挖掘技術應運而生。
大數據,又叫做巨量資料,它指的是相關數據量的規模宏大到通過人腦以及主流的軟件工具處理仍然十分吃力,以在規定的時間內管理、處理、并整合成為有用的信息為目的。簡單說大數據就是其內存儲的數據數量十分巨大并且存儲的數據十分混雜,使用常規的處理方法沒有辦法歸類的宏大數據團。如何理解大數據,大數據是一個集合,這個集合是指在規定的范圍內常規工具沒有起到發現、整治和修改數據集合的作用,對于這種擁有的數據非常多并且表現出多種復雜關系的數據,并且能夠使擁有的信息快速增長,這種操作方法就需求新的處理方法,使用這種方法能夠使決策的能力、洞察的能力和工作流程更加簡便并且節省時間。文章《大數據時代》中的作者維克托·邁爾-舍恩伯格和肯尼斯·庫克耶們表明了對大數據的定義,大數據擁有五個非常明顯的特點:數量巨大、數據傳播的速度較快、其中的信息具有多樣化、數據真實性高和密度的低價值。
當然隨著大數據時代的發展,大數據的作用也逐步體現出來,例如的大數據的商用,大數據的商用徹底改變了現有的商業模式。例如以前是高層覺得不對或不合適決定讓你作整改,現在是大數據的分析結構體現出決策失誤的地方再作出整改,這種模式也更加明確地指出公司當前決策的失誤更加令人信服,也起到了企業對內部人才的定義,當讓這種模式的推動也起到另一種變動“垃圾進,垃圾出”數據的不合格進入騷擾,自動排除也使數據的使用率進一步提高。世界上一流的連鎖超市沃爾瑪的成功也離不開“大數據”,沃爾瑪的經典案例“啤酒和尿布”相信大家都有一定的了解,走進超市你會發現超市內的啤酒和尿布是擺放在一起的,這是經過數據的調查與當地的生活習慣分析出的決策,它發現大多數人購買尿布是看到啤酒,大多數都會想到家里面的儲備是否足夠,在不夠的情況下大多數人都會進行購買,這也是“大數據”成功的案例之一。
對于計算機挖掘技術的研究工作,為了進一步了解挖掘技術的功能,在保證挖掘技術質量的前提下,可以把挖掘技術運用到社會的不同行業,促進計算機挖掘技術的進步,并得到深入的開發和利用。在傳統意義上的統計方法主要包括統計預測、抽樣調查和多元化統計。在這三種方法中,抽樣屬于以大量數據為前提的抽樣調查技術,多變量屬于結構復雜的數據分析方法,回歸和對數分析都稱為統計預測。大多數計算機其中的數據沒有非常顯著的特征。在這個階段,可以使用圖表等方式來實時顯示數據,并直觀地顯示數據的特征。散點圖等可視化技術層出不窮,而現在可視化技術在高維數據領域還有很多技術難點亟待解決。這種處理方法是一種通過計算機聯機分析數據的處理方法。在線分析過程中,客戶之間應積極配合,積極提出相關的數據分析要求。決策樹主要用于對數據和預測數據這兩個領域進行分類。在大多數情況下,神經網絡分為三層:第一層是輸入,第二層是隱藏,第三層是輸出。通過這種方式,對數據進行調整和計算,并對數據進行分類和總結。
從中國市場營銷領域的整個發展期間來看,收集到客戶的數據逐漸增多,已經超出人為所能掌控的范圍。在這種狀況下,通過計算機的一項技術對數據進行挖掘,對用戶購物的這一實際行為以及客戶日常購物的習慣進行分析,對這些數據所具有的屬性特征進行歸納總結,這樣能夠最高化地加強所有企業具備的影像實力來提升這些企業所具備的綜合競爭力。而且,通過使用對數據挖掘研究的這一項計算機當中的技術,可以使數據分析的工作效率很大程度上得到提高,更能準確地采集到客戶購物時的取向以及對購物的習慣和興趣點進行一個歸納了解,這樣便能幫助商家來定制一些更高效率切實可行的商業策略。而這項技術在金融行業展開的分析工作大部分集中于兩個領域:股票交易、金融投資。
一般來說,通過建立模型來分析未來的發展趨勢。對于金融投資來說,存在巨大的風險。在進行這部分投資工作之前,必須對數據進行分析,針對可能出現的風險問題,采取有效的防范措施,選擇正確的投資方向。根據金融業發展的地區進行有效的預測。從評價的開始到預測的全過程,可以對整個金融市場的發展進行預測。根據現有數據,進一步挖掘現有數據的內部關聯,在制定良好的發展模型中,實現數據的科學預測。并且能夠識別金融業中存在的欺詐問題,從而防止金融犯罪類型的發生。半導體在中國大型制造行業中得到了廣泛的應用。在制造產品的過程中,不斷出現大量的數據。在計算機技術中挖掘出數據后,對上述生產過程中的數據進行分析,可以有效地揭示生產過程中的一些隱患。在此前提下,產品的質量得到深入保證。此外,數據挖掘這一技術已經廣泛地應用于由計算機進行的電子商務領域,通過不同類型的商業數據、各類用戶的信息以及消費的實際情況,實時分析和掌握,加強了購物網站提供的服務在自身的個性化。除上述利用的幾個應用方面之外,數據挖掘技術也已經應用于稅務行業,可以通過數據挖掘技術,對一些單位的偷稅漏稅的問題第一時間展開針對性的追蹤活動。通過深入分析和進一步研究納稅人在不同領域的經營行為,找出他們共同的規律,為我國稅收工作提供一種有效的運作模式。為確保稅收的順利實施,應從單位的偷稅和漏稅兩個方面展開有效的防范工作。
在21世紀的當代,信息化快速占領了人們的生活,科技也隨著時代的發展而發展,人們生活和工作中不可或缺的一部分從人的交流變成了計算機的交流。當然數據挖掘也成為了計算機信息領域的重要組成,數據挖掘是屬于計算機技術當中的一個十分重要環節組成,并且它獲得人們的關注以及使用已經起到了大面積的推廣。之前的敘述已經表明了,數據庫在計算機具備了數據挖掘這項技術時對人們起到了高效利用時間的作用,所以對計算機的數據挖掘技術的使用,應該展開進一步的研發工作,找出其中現有的技術缺陷,進一步開發數據挖掘,希望能對計算級領域做出進一步的貢獻。