孟穎
摘? 要:隨處可見的云儲存和計算功能,加快了大數據的產生速度,因此,在進行網絡管理的過程中,需要做好大數據信息內容的收集,幫助人們便利地進行數據信息檢索,結合實際調查結果顯示,大數據中超過半數都是非結構化數據內容,大多數非結構化的數據形式是以文件進行儲存。大數據整體被分割成不同的內容,分別儲存在不同的服務器中,在主服務器上也會產生相應的儲存元數據,該文主要探討了基于云計算的大數據信息檢索技術,對其未來發展進行了整體預測,希望能夠促進我國科學技術的發展。
關鍵詞:云計算? 大數據網絡? 信息檢索技術
中圖分類號:TP18 ? ?文獻標識碼:A 文章編號:1672-3791(2019)09(c)-0011-02
隨著信息技術的不斷發展,云計算得到了廣泛應用,我們正處于信息爆炸時代下,云服務在各個領域的不斷應用,越來越多的個人和企業將辦公業務遷移到了網絡平臺上,這些網絡平臺無疑不產出大量的數據內容。除此之外,自動傳感系統、移動設備應用以及科學儀器使用,都會源源不斷地提供數據內容,增長速度最為明顯的就是社交網絡和電子商務數據,數據內容主要是通過音頻、視頻、圖片、文字等多種形式進行傳播,要想對這些數據內容進行描述,就需要采用GB、PB甚至ZB,因此我們需要做好云計算中大數據的信息檢索工作。
1? 大數據網絡信息檢索技術
(1)大數據網絡信息儲存。我國在進行網絡信息資源儲存過程中,存在著數據分散的問題,網絡用戶要想通過信息系統進行教學資源的查詢,就需要分別輸入不同的檢索條件,這種信息查詢形式降低了查詢效率。通過混合云計算模式的有效應用,能夠改變傳統的分布式數據庫儲存格局,將網絡用戶所進行的檢索與數據庫進行結合,全面提高查詢過程的整體性。網絡用戶在進行數據信息查詢的過程中,可以直接通過云端進行檢索,云客戶端能夠直接將檢索條件發送到系統服務器中,經過短暫的分析為市場提供合理的信息資源,滿足網絡用戶的信息查詢要求。混合云計算模式的有效應用,能夠減少信息基礎設施建設的資金投入,借助大數據技術建立私有云,負責儲存重要信息和資源,從而結合網絡的發展情況,對云數據進行統一管理,為用戶提供更好的信息化服務。
(2)元數據的應用。大數據的產生本身就是隨著云計算的超級計算發展而形成的,大數據主要指的是通過結構化和半結構化的數據分析模式,進行數據的儲存和收集,結合其數據量,大數據具有種類多、價值高、處理速度快等應用優勢,能夠更好地進行數據內容的檢索,如果我們依然采用傳統的關系數據庫進行數據儲存,不僅耗費儲存時間,還需要大量的資金投入,在進行數據查詢時也具有一定的困難性。大多數的數據內容都是以文件形式進行儲存的,因此云計算的集群文件系統,逐漸成為大數據數據傳輸的重點內容,集群文件系統主要指的是將一個大數據文件劃分為不同模塊,分別儲存在服務器中,每個模塊都帶有元數據,元數據被儲存到主服務器中。主服務器儲存的內容主要有文件和塊的命名,空間塊的映射文件以及數據備份的主要位置,我們在進行數據查詢的過程中,可以直接通過命名空間查詢指定文件,找出文件所處的目錄和基本路徑,原數據所記錄的內容有文件儲存的具體位置,通過信息查詢就能夠了解數據的位置移動情況,實現動態化檢索。
2? 網絡信息的收集與檢索
信息儲存量與信息的價值成反比,隨著信息技術的不斷發展,用戶在進行網頁瀏覽的過程中,會從成千上億個網頁中結合自己的需求,查詢相關數據內容,例如:在觀看1h左右的視頻后獲得的有用信息只有幾秒鐘,同理,云計算之所以成為信息技術發展的基礎,就是因為云計算具有超強的信息計算能力,能夠通過云數據,在短時間內獲得信息處理結果。云計算的有效應用能夠快速地挖掘數據所蘊含的價值,是解決查詢問題的重要手段,在進行信息檢索的過程中,中國常用的百度、美國常用的谷歌都是檢索行業的領先企業,我們正處在云計算的大數據發展時代,其發展的核心思想借鑒了搜索引擎所帶有的便利形式,讓用戶在進行大數據信息檢索的過程中,將信息檢索過程分為網頁收錄和檢索兩部分。
(1)網頁收錄。在進行數據檢索的過程中,主要是檢索云中的數據服務器,分別對不同節點上的服務器數據信息進行排序和分析,通過分布式檢索的方式,將檢索到的結果直接收錄到Index Repository中,通過網頁將搜索引擎中的內容收錄在案,制定出搜索索引。用戶在結合自身的發展需求提出搜索請求時,實際上是在Index Repository中進行搜索,通過運用云計算的計算方式,通過倒敘索引列表的制訂,將其儲存到儲存器中,設計好頁面的主要標題和連接內容,為數據制作索引,并且將網頁的主要內容另存為其他索引中。用戶在進行數據內容查詢的過程中,所得到的數據結果大多數都經歷了較長時間的完善和記錄,并且在搜索引擎的緩存區排序,整個過程搜索引擎并不會提前預知用戶查詢的主要關鍵詞,但是要想全面提高搜索的整體效率,就需要建立關鍵詞詞庫,在用戶提出查詢請求時,自動匹配關鍵詞。
(2)數據檢索。當用戶結合自身需求提出查詢請求時,需要像檢索程序提供關鍵詞,借助索引儲存器將實際內容進行排序,直接通過用戶檢索界面兒呈現在用戶面前,全面提高了信息檢索能力,加快檢索的速度。對于中文用戶講,在完成用戶請求時,主要是通過中文分詞實現的。中文分詞主要是通過字符串匹配、理解分詞、統計分詞這3種形式進行的,在收到搜索請求時,需要仔細地分析關鍵詞所蘊含的實際內容,要想保證匹配內容呈現的有序性,就是要通過搜索引擎按照相關的匹配程度進行排序,將分詞信息和文件中的連接內容相結合,滿足排序的客觀性暴漲,檢索出的結果與實際用戶需求相一致,如果同一網頁被其他網頁多次指向,說明網頁的含金量較高,判斷網頁自身所處的質量級別,分析網絡連接的權重,
3? 云計算在大數據網絡信息檢索技術中的應用
通過云計算技術的有效應用,能夠更好地實現資源共享,直接將已經儲存的資源內容與軟硬件設備相結合,提高計算機數據處理的便利性,云計算技術的應用不僅能夠為用戶提供安全的網絡環境,還能夠建立高效的數據儲存體系,解決傳統計算機使用過程中數據處理傳輸問題,云計算技術應用能夠讓人們的網絡資源收集,打破時間、空間的限制。要想做好計算機數據處理工作,就需要以云計算技術為核心,助力信息技術在我國社會發展過程中的有效應用,通過云計算技術,能夠加快服務器的研發速度,建立優秀的操作系統,讓人們能夠在最短的時間內收集到想要的數據內容,云計算技術的應用還為數據的儲存、分享提供安全保障,減少數據流失所帶來的經濟影響。
(1)網絡環境中的云計算。在進行信息化環境的構建過程中,需要以云計算為主要依據,為當前信息系統中的網絡用戶,實現網絡資源的動態化分配,分配的主要內容有硬件、服務器、軟件等。通過云計算定期地對網站上的資源進行更新和維護,同時在網絡建設的過程中,可以讓網絡用戶通過服務的動態化申請,爭取得到網絡硬件和信息資源的使用權和訪問權。網絡中所采用的云計算,大多數都是私有云計算,針對于當前的內部用戶信息開展服務,不為群眾提供網絡服務。在當前我國的網絡建設開展的過程中,大多數都會采用私有云技術,探討網中所存在的信息資源和數據所具有的集中性特點,結合當前的網絡硬軟件資源構建私有云,從而全面降低服務的成本。私有云計算的廣泛應用,能夠為用戶提供良好的服務,私有云計算的網絡服務器要搭建在單位網絡中,通過防火墻進行隔離和保護,讓內部用戶能夠享有穩定的數據信息。要想全面實現信息化管理,就需要建立屬于自身的云,在當前的網絡中心,建立數據儲存云端,相關人員能夠通過云計算進行數據查驗請求,實現數據應答,從而全面提高管理制度,減少資源管理的成本。
(2)私有云的有效應用。在進行信息化建設的過程中,通過私有云技術的有效應用,能夠更好地實現網絡數據的儲存和整理,同時大數據技術的應用還能夠對當前所采用的信息、硬件和軟件提供及時的升級服務,在網絡終端使用的過程中,網絡用戶們并不需要對數據進行保護,只要結合自身的信息需求向云空間提出相應的申請。私有云技術的有效應用,能夠減少網絡資源的投入成本,避免出現資源浪費,結合時代的發展步伐,網絡所涵蓋的范圍也在不斷擴大,為網絡用戶便利地訪問網絡提供支持,網絡的很多數據在進行處理過程中都通過私有云技術實現,用戶客戶端也可以減少應用軟件的安裝,只需要有一定的系統作為支撐。整個服務過程都是通過所具有的云端服務器進行承擔的,用戶只要通過簡單的網絡終端登錄就可以直接連接到的服務網點,對服務器中所含有的海量數據進行訪問,云計算的應用優勢就在于能夠在網絡的內部進行設立,做好相關部門的維護和管理工作,保障數據庫內部資源不會出現丟失和遭到破壞。同時,云計算技術在網絡機房中的應用,還能夠全面降低相關用戶的查詢強度,優化當前的計算機終端環境,在保證網絡機房正常運轉的情況下,對計算機進行定期的維護和管理,云端服務器還可以通過網絡服務中心對各部門的工作進行管理,借助網絡中的服務端口,網絡用戶們能夠對感興趣的資源內容進行查詢。為了滿足網絡用戶們的閱覽需求,還可以成立以云計算為基礎的數字化圖書館,將海量圖書資源直接儲存到云端服務器中,實現資源共享。
4? 結語
要想從眾多信息內容中提取日常生活中必要的有力數據,促進人類社會的發展,就需要充分發揮出大數據所具有的信息檢索價值,以云計算為基礎所開展的大數據檢索技術,仍然面臨著許多困難和挑戰需要解決。例如,多媒體類型的圖形、視頻、聲音等大數據文件,這些文件的檢索十分困難,隨著智能終端的普及,需要將多媒體類型文件與智能終端進行有機結合,從而通過智能終端的應用進行文件搜索,獲取相關信息,工作人員需要以此為基礎,充分利用大數據檢索技術,找出有價值的信息,通過不同的收集與檢索方式,促進我國社會產業變革。
參考文獻
[1] 劉亞雄.基于云計算的大數據網絡信息檢索技術及擴展[J].電子世界,2019(10):201.
[2] 劉昺侯.基于安全云的私有信息檢索關鍵技術研究與實現[D].電子科技大學,2014.
[3] 劉月.探究云計算下大數據的信息檢索技術應用[J].數字技術與應用,2015(7):95.