阿不都艾尼·阿不都肉素力
摘要:現代信息技術發展過程中,與現代統計學知識高度融合,從而衍生出計算機數據挖掘技術。計算機數據挖掘技術,和大數據技術、云存儲技術共同發展,為社會生產與生活提供較多便利。該文注重開發計算機數據挖掘技術,同時提出科學化處理對策,僅供參考。
關鍵詞:計算機數據挖掘技術;開發;應用
中圖分類號:TP391? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)03-0027-03
開放科學(資源服務)標識碼(OSID):
在大數據時代下,數據信息量非常大,但由于數據完整性不足,所以既存在價值數據,也存在垃圾數據。海量數據具備特殊意義,且數據背后隱藏重要知識信息,因此具備不完整性、隨機性、模糊性特點。在噪聲數據中,注重挖掘價值信息。數據挖掘,通過分析海量數據,可以實現自動化分析,做好歸納整理,提取價值信息。利用上述信息,能夠為應用對象提供便利性。企業、個體用戶可以有效評估市場,明確實施方案,按照市場政策變化,降低投資風險,效益顯著。同時,幫助行業應對政策變化,提供最佳營銷手段與策略。當企業面臨資金、管理危機事件時,可以貢獻較多力量。
1 計算機數據挖掘技術過程概述
1.1明確數據庫與數據挖掘目的
數據挖掘技術功能較多,需要合理應用技術措施,明確數據挖掘目的,按照目的選擇數據庫。由于計算機數據挖掘技術,涉及多種數據挖掘方法,且不同數據挖掘目的、挖掘方法不同,所以選擇適宜挖掘方法,能夠保障數據挖掘結果準確性。此外,明確數據挖掘目的、數據庫,可以發揮出數據挖掘技術優勢。
1.2數據選擇與預處理
明確數據挖掘目的與數據庫后,需要在數據庫內提取目標數據。值得一提的是,維護目標數據內信息,同時將目標數據作為數據挖掘范圍,即數據選擇。明確目標數據后,科學處理目標數據,刪除錯誤信息、無用信息,留下有用信息。上述過程為預處理流程,能夠精簡目標數據。
1.3數據挖掘
第一,按照數據挖掘目的,明確數據挖掘技術類型、應用算法。算法屬于數據挖掘精髓,通過科學算法,能夠提升數據挖掘結果可靠性,借鑒價值強。第二,數據挖掘算法是一種數學模型,按照數據挖掘算法,建立標準化數學模型。利用數據挖掘算法,準確處理目標數據。第三,在計算機系統中,通過算法挖掘數據信息,能夠獲得相關結果。
1.4評估結果
評估結果環節,主要分析數據挖掘結果,做好科學化評估。通過數據挖掘技術獲取結果,但是要驗證結果正確性。當結果不滿足數據信息要求時,則重新選擇數據挖掘算法、數學模型。當結果滿足應用要求時,將數據結果應用到實踐操作中,指導后續工作,全面提升工作效率。
2 計算機數據挖掘技術開發
2.1傳統統計方法
在日常生活中,頻繁使用統計方法,將統計學知識落實到各領域。對于傳統統計學方法涉及內容比較多,包含多元統計技術、統計預測技術、抽樣技術。其中,抽樣技術為重要統計方法,可以應用到生活實踐中。在海量數據中,提取價值數據,將其作為樣本信息。科學分析樣本信息,展示數據信息,合理應用抽樣技術,減少統計量、數據分析量。統計預測技術,包括序列分析、回歸分析等。多元統計分析,需要復雜數據結構,例如因子統計、數據統計等。
2.2可視化技術
在統計數據時,借助數據挖掘技術可以提升數據統計效率,同時確保數據統計結果滿足要求。但是,數據統計結果通常包含隱晦特征,為了掌握相關特征,需要利用圖表、散點圖方式,表達數據統計結果特征,使人們正確理解數據統計結果。基于實用角度分析,可視化技術無法實現高維數據可視化,高維數據在圖表中呈現難度大,但是能夠指導可視化技術發展,技術創新性強。
2.3決策樹
通過決策樹,能夠分類預測海量數據,是一種新型數據挖掘技術。遵循標準化規則,建設科學的數據體系。決策樹計算方法較多,例如SPRINT、SLIQ等。通過上述算法,可以將訓練集歸納為決策樹,對分類屬性、連續屬性予以處理。
2.4遺傳算法
基于生物科學角度分析,計算機所具備的智能學習能力,必須注重數據結合、數據突變過程整合。處理數據信息時,淘汰不合理數據,留存優質數據信息,使其成為新數據組合。數據優化處理后,能夠提升數據信息適應度。遺傳算法理論,可以支持數據挖掘技術開發,屬于標準化處理方法。準確定位數據挖掘技術,以決策數據為核心技術,擴大技術開發應用范圍,對決策者知識儲備要求低,既可以展示出數據挖掘優勢,還可以研發全新的技術措施。
2.5聯機分析處理
基于本質分析可知,聯機分析處理可以通過多計算機系統,對某個具體問題進行分析。計算機連接性,采用多數據節點方式分析數據信息。針對應用對象,注重聯機分析處理,即多維數據。聯機分析處理程序,可以劃分為主計算機任務、其他聯機計算機任務,圍繞主計算機提出科學分配方案,準確計算數據并進行統計分析。
2.6計算機神經網絡
基于計算機神經網絡,獲取計算機網絡研究成果,模擬人體神經網絡,生成輸入單元、處理單元、輸出單元。在數據處理中應用計算機網絡,能夠調整計算數據信息,歸納整理計算結果。
2.7粗糙集
當缺少數據知識時,粗糙集能夠對數據分類能力進行考察,分析和處理不確定數據、模糊數據。在數據庫體系中,合理應用粗糙集,能夠發現分類規則,同時將數據庫屬性劃分為條件屬性、結論屬性。針對數據庫內部元組,按照不同屬性值劃分為對應子集,合理劃分條件屬性、結論屬性,從而生成判定規則。因此,具備相似對象集合,可以稱為初等集合,將其作為知識組成成分。對于初等集合并集,可以納入精確集合,同時整理為粗糙集。不同粗糙集擁有不同邊界元素,但是不能劃分為集合元素,也不能作為集合元素的補充元素。在數據挖掘分類中,可以應用粗糙集理論,能夠及時發現噪聲數據、異常數據內部結構。
2.8支持向量機
隨著統計學習理論的發展,逐漸出現支持向量機,屬于新型機器學習方法。基于結構風險最小化原則,加強學習泛化能力,推廣性能、分類精確性能顯著,可以處理學習問題,形成訓練多層感知器、多項式神經元網絡、RBF神經網絡等。同時,支持向量法屬于凸優化問題,局部最優解為全局最優解,上述特點為神經元網絡算法無法企及的優勢。在數據挖掘分類、回歸、未知事物探索中,合理應用支持向量機。
2.9關聯規則
關聯規則屬于實用性分析規則,可以描述事物屬性、模式與規律,屬于數據挖掘中的成熟技術。在數據挖掘領域,應用關聯規則的價值顯著,能夠掌握數據規律,不會受到單一因變量限制。大部分關聯規則挖掘算法,可以發現隱藏挖掘數據的關聯性,但并非所有關聯屬性都具備應用價值,必須做好科學化評價,篩選高價值關聯規則。
3 計算機數據挖掘技術的應用實踐
3.1市場營銷中的應用
在現代生活發展中,多數消費者購物都傾向于刷卡操作,在此操作中,銷售商可以采集到消費者信息。消費者數量持續增加,銷售商可以采集到價值信息,便于開展市場營銷活動。不同銷售商、生產廠家,根據價值信息采集,對消費者實際需求、購物習慣進行分析,掌握消費者消費時間,對消費者下步消費行為進行推斷。例如,企業收集消費者信用卡使用數據,掌握商品銷售情況,同時,通過促銷活動掌握消費意向。開展上述工作,比較依賴數據挖掘技術。企業通過數據挖掘技術,可以掌握消費群體需求,同時為企業決策制定提供數據依據,加強企業市場競爭力。基于總體分析可知,將數據挖掘技術應用到市場營銷中,可以應用數據庫營銷、貨籃分析方式。數據庫營銷,通過模型預測、交互式查詢方式,篩選企業潛在客戶,同時針對性推銷產品。
3.2金融投資中的應用
在金融分析中,股票教育預測、投資評估,屬于重要內容。通過模型預測法、統計回歸技術法開展。與其他行業相比,金融投資風險大,投資前必須做好數據分析,既可以規避投資風險,還可以明確投資方向。事物發展過程中,會呈現出增長趨勢,所以要做好科學預測,將其與交易市場預測、投資評估放在同等重要地位。在研究分析時,通過計算機數據分析推理相關內容。在現有數據處理中,按照存在關系,挖掘深層次數據,并根據數據模型進行預測。同時,在商業銀行機構中,也開始廣泛應用數據挖掘技術。銀行經營管理時常出現詐騙、惡意投資行為,增加經濟損失,所以必須準確預測和鑒別欺詐行為。按照筆者研究可知,銀行機構在鑒別詐騙行為時,主要采用對比正常行為、詐騙行為方式,以此獲取詐騙行為特征。審核人員預警特征人員,加大審查力度,拒絕提供服務。在商業銀行體系中,合理應用計算機數據挖掘技術,借助銀行業系統調取客戶信息,例如流水、資金、存款與信貸等。深入分析相關數據信息,可以掌握抵押物、償債能力,評估交易風險,推理詐騙行為。將審查結果提交至技術人員審核,通過此種方式,可以降低商業銀行詐騙行為。
3.3電子商務網站中的應用
隨著互聯網技術快速發展,電子商務網站成為企業、商家必爭方式,電子商務網站在線交易會產生海量登記表、記錄文件。將計算機數據挖掘技術應用到電子商務中,可以深度分析數據信息,確保商家掌握消費者購買喜好、模式等,滿足不同層次消費需求,也可以為企業、商家提供擴大市場份額的機會。合理應用計算機數據挖掘技術,深度挖掘消費者背景信息、瀏覽者點擊量。客戶登記表為去背景信息,點擊量則是考察客戶行為的重要方式。然而,客戶不會在登記表中填寫所有信息,致使數據挖掘與分析難度比較大。基于瀏覽者多項表現數據,可以準確推測和應用背景信息。
3.4在半導體領域中的應用
在半導體領域中,合理應用計算機數據挖掘技術,可以有效作用到軟件檢測中。在生產半導體元件時,利用元件信息采集,可以準確分析和檢測元件信息,確保元件性能質量達標后,
再應用到半導體中。因此,借助計算機數據挖掘技術,能夠判斷元件合格準確率,以免應用到不合格商品。此外,在金融投資中,合理應用計算機數據挖掘技術,可以為金融投資提供參考。將計算機數據挖掘技術應用到電子商業中,既可以推斷消費者喜好,還可以為消費者提供目標產品,減少消費時間浪費,實現快速銷售目的。例如,京東、淘寶等購物網站,都應用了計算機數據挖掘技術。
4 結束語
綜上所述,現代經濟快速發展背景下,各行業對數據信息的依賴度加強,有助于提升數據挖掘技術開發與應用價值。大數據挖掘技術,可以影響多行業領域發展,比如市場營銷、金融投資、電子商務網站、半導體領域等,在不同領域中的應用,均可以掌握行業發展規律,提出科學化發展策略與建議,以此展示出計算機數據挖掘技術的應用價值。
參考文獻:
[1] 段冬,張嫻.大數據背景下人工智能在計算機網絡技術中的應用研究[J].電腦知識與技術,2021,17(9):179-180,190.
[2] 徐夢馨,高德立,柳景.大數據背景下數據挖掘技術在檔案管理系統中的運用[J].信息與電腦(理論版),2021,33(2):28-30.
[3] 趙云.基于大數據的計算機數據挖掘技術在檔案管理系統中的應用[J].中國新通信,2020,22(22):113-114.
[4] 黃毅能,吳旭東,多曉偉.數據挖掘技術在電商平臺中的應用——以陶瓷餐具的電商營銷為例[J].現代營銷(經營版),2020(10):112-113.
[5] 范海峰.數據挖掘技術在計算機網絡病毒防御系統開發中的應用[J].電子技術與軟件工程,2020(17):236-237.
[6] 車全偉,雷成,李玉如,等.基于神經網絡的數據挖掘模型在吸能裝置上的應用[J].西南交通大學學報,2021,56(5):995-1001.
[7] 徐承俊,朱國賓.數據挖掘在全國計算機等級考試(NCRE)成績分析中的研究及應用[J].計算機應用與軟件,2020,37(8):64-67,73.
[8] 劉各巧.數據挖掘技術研究以及在檔案計算機管理系統中的應用[J].太原城市職業技術學院學報,2020(7):199-201.
[9] 姜齊艷,王魯平.基于數據挖掘與神經網絡的財務異常數據監測分析算法[J].電子設計工程,2020,28(11):14-17,22.
[10] 夏天維. 計算機數據挖掘技術的開發及其應用探究[C]//“決策論壇——管理科學與工程研究學術研討會”論文集(下).《決策與信息》雜志社、北京大學經濟管理學院:《科技與企業》編輯部,2016:241.
【通聯編輯:唐一東】