王志俊
摘? 要:近年來,互聯網的不斷發展,使人們對數據的需求不斷擴大,這也使數據挖掘技術成為互聯網領域中至關重要的技術,通過數據挖掘技術,可使人們從海量信息中篩選出自身所需的有效信息,隨著數據挖掘技術的發展,其在Web技術中正發揮著越來越重要的應用價值,尤其是在Web預取方面,通過數據挖掘技術的運用,可使數據查詢變得更加準確,從而實現Web資源的多方共享。鑒于此,該文便對數據挖掘技術在Web預取中的應用進行深入的研究。
關鍵詞:數據挖掘? Web預取? 搜索引擎
中圖分類號:TP391 ? ?文獻標識碼:A 文章編號:1672-3791(2019)07(c)-0019-02
隨著網絡的普及與應用,在Web預取中運用數據挖掘技術已經成為互聯網領域中的一種新型運用手段,數據挖掘技術可幫助人們對用戶的訪問模型進行查詢,同時還可通過聚類分析以及信息監聽等手段來生成與用戶有關的相關信息檔案,從而了解用戶在不同頁面中所產生的行為規律,進而為用戶提供更加高效優質的信息服務。不過,就目前來看,如何將數挖掘技術更加合理地運用于Web預取中,以此最大限度地發揮數據挖掘技術的作用,仍舊需要進一步加以研究與探討。
1? 數據挖掘技術在Web預取中的發展歷程
現階段,越來越多的搜索引擎企業都迎來了高速發展階段,這也使搜索引擎在人們的日常生活中發揮著越來越重要的作用。據相關調查表明,搜索引擎已經成人們在使用互聯網的重要工具,大部都會作為應用工具檢索用戶所需的數據。由于搜索引擎企業眾多,這也使不同的檢索機制有著很大的區別,從而造成數據查詢結果多種多樣,因此在使用搜索引擎時,需要結合信息數據的類別及用戶的行為習慣與實際需求來確定。在搜索引擎應用初期,人們需要解決檢索數據結果的排序問題,部分搜索引擎還要收費,費用投入越大的企業,在網站上的排名就越靠前,這很難達到用戶的數據檢索要求,因此需要對數據運用相關性進行徹底改變,使與關鍵詞相近的檢索結果能夠排在首位,因此對于許多大型網站,相同數據通常都會在前端顯示。當用戶訪問某個網頁時,往往會點擊鏈接來訪問其他頁面,這時便要預測用戶的訪問信息,然后根據預測結果來對這些頁面進行預先下載,以此提高用戶對頁面的訪問速度。由此可以看出,在預取Web中的鏈接時,減少頁面鏈接或采用不同Web服務器,可使頁面具備更佳的運行效果。不過,事實上許多用戶都不會訪問全部頁面,因為這會對用戶的使用造成一定的影響,并且因用戶是利用流量來進行上網的,如果全部訪問,反而會產生大量支出,這勢必會給Interent系統的流量平衡帶來不利影響。而Web預取則能夠按照特定的排序方式來排序頁面連接,并根據用戶的訪問概率來預取對應頁面,同時需要考量系統運行情況,通過興趣關聯數據庫來進行相應的考量。
2? 數據挖掘技術在Web預取中的應用
2.1 可提高Web預取數據的準確性
由于在互聯網中分布著海量的信息,因此在海量信息中查找自身所需的有效信息時,即使采用最為高效的搜索引擎,仍舊會在數據篩選中出現各種問題,并且,互聯網所具有的開放性、共享性特點,使人們能夠在不同地點、不同時間進行隨時隨地的信息傳輸,這也使信息數據每時每刻都在海量增長著,而利用搜索引擎,只能對這些海量數據中的一部分進行篩選,否則反而會對搜索引擎的實際應用效果造成影響。不過,如果在搜索引擎中運用數據挖掘技術,則可很好地解決該問題。通常來說,數據挖掘技術主要包括3種,分別是內容挖掘、結構挖掘以及具有使用記錄的數據挖掘,其中尤以內容挖掘最為常用。在檢索這些內容數據時,需要對相應的條件進行設置,而且用戶需要對所需數據有一定的了解。相比于以往的搜索引擎技術,數據挖掘技術雖然在挖掘速度上不占據優勢,但其卻可以更加全面而準確地對信息進行檢索,并且,通過添加人工智能模塊,還可對這些檢索數據實施相應的處理,從而使技術的智能化水平更高。反之,如果采用以往的搜索引擎技術對數據進行檢索,則檢索到的數據還要經過相應的篩選才能使用,但對于數據挖掘技術來說則不同,其可直接利用檢索數據。
2.2 可應用于電子商務領域
在Web預取中,由于用戶所需的數據不同,因此在運用數據挖掘技術時應考慮到不同用戶對數據的實際需求。當用戶所需數據是用于藝術設計的,則需要添加和篩選新穎而獨特的流行元素;如果用戶所需數據是用于商業活動的,則數據挖掘技術的運用目為篩選有效的客戶資源。近些年來,互聯網技術的快速發展,使網絡購物已成為一種新型的購物模式,這也使電子商務迎來了高速發展階段,相應的,越來越多的企業開始投入到電子商務領域中,這也使電子商務所面臨的市場競爭環境變得愈發激烈。在此背景下,企業要想在電子商務領域中占據一席之地,就必須要盡最大努力來對現有的客戶資源進行擴大,而通過調查可以了解到,許多用戶在進行網絡購物時,都會利用搜索引擎來查看與搜集自己所需的商品信息。因此,將數據挖掘技術應用于電子商務網站中,可使網站中的商品信息得到有效的優化與處理,進而使網站能夠滿足不同用戶的購物需求,同時還能根據這些用戶的需求來對更多潛在的用戶進行挖掘。在運用數據挖掘時,所需數據主要來自于兩個方面,一是客戶的歷史購物或瀏覽記錄、客戶基本信息等,二是用戶點擊量。通過以上數據可幫助企業考察用戶的行為,這些數據都可從服務器中獲得。在利用數據挖掘技術時,不需要直接挖掘原始數據,而是需要先處理這些數據,例如對數據進行合并,使不同數據庫或文件中的數據能夠合并起來,然后從中選擇合適的數據進行提取與集合,并對這些提取與集合的數據進行相應的清洗與過濾,使數據中的不必要信息能夠得以清除,然后利用文件、多媒體等格式來轉換這些數據,以此確保數據挖掘格式變得便捷而安全。通過與不同目標進行結合,采用多種查詢方式,最后可獲得有價值的數據,這時便可通過技術手段的運用,對整合數據進行分析,從而確保數據的價值得到可靠保證。數據挖掘技術除了能夠在電子商務領域中應用以外,還可運用于其他所有與Web有關的領域,例如企業日常運營,通常需要設置一個局域網來便捷內部辦公,使企業網絡能夠和互聯網進行連接,從而保障企業和外部的信息暢通,使企業在發展中能夠獲得更多有價值的數據來提供參考。
3? 結語
總而言之,隨著互聯網的高速發展,數據增長量不斷擴大,這也給人們對信息的檢索帶來很大難度。搜索引擎憑借其準確、高速的應用優勢,已經成為人們在互聯網中進行數據挖掘的重要工具,不過因互聯網的信息更新速度非常快,這會給搜索引擎的運用帶來很大影響,因此,將數據挖掘技術運用于搜索引擎中,已經成為搜索引擎不斷發展的未來趨勢,通過數據挖掘技術的運用,能夠使人們在應用搜索引擎時,能夠實現對檢索數據的直接處理,進而使數據挖掘效率得到顯著提高。相信在不久的將來,現代化信息技術的不斷發展,必將使數據挖掘技術變得更加完善,從而使其在實際運用中發揮更大的應用價值。
參考文獻
[1] 謝怡文.試分析數據挖掘技術在Web預取中的應用[J]. 電腦編程技巧與維護,2017(7):66-67,74.
[2] 白亮.基于Agent技術的Web個性化數據挖掘研究[J].長春師范大學學報,2015,34(12):43-46.
[3] 邢國春,李紫薇.基于J2EE技術的Web預取中個性化信息智能挖掘模型研究[J].情報科學,2014,32(9):104-107.