馮燕青
(南京市水利規劃設計院股份有限公司,南京 210000)
當前,隨著我國進入了新型社會發展階段,人們可以通過網絡進行檢索,獲得自己需要的信息。盡管與傳統的紙質信息檢索方式相比,網絡信息檢索有著巨大的優越性,但仍然存在著信息分類缺陷、部分信息無效、信息量巨大、真假難辨等問題。在此基礎上,利用人工智能進行信息分類,可以根據使用者的習慣提供真實、準確的信息,從而促進信息的檢索。
網絡信息檢索,其實就是以網絡為平臺,讓用戶利用網絡搜索引擎搜尋有關資訊。通過分配存儲技術,可以將海量的數據信息分散到相應的服務器上。而對于使用者來說,可以利用終端來查詢和查看事先存儲的資料。因此,所有的信息都可以在互聯網上被檢索和利用,而為網絡使用者提供資訊搜尋的方式或手段,就可以稱之為網絡信息檢索。
人工智能是一種可以通過機械來模擬和感知人在做事情的過程中的感覺,然后做出正確的決定,從而讓機器人擁有一種專門的技術來解決問題。因此,人工智能的實質也是圍繞人類的頭腦進行的。其最大的特征就是基于對問題的正確理解,以一個相對完善的邏輯體系來進行知識的重構和應用。目前的人工智能可以分成以下流派:分布學派、認知學派、連接學派、邏輯學派和知識工程學派。雖然各個流派的研究不同,但在人工智能的構造和作用上,目標都是相同的,那就是人工智能要由中間數據庫、解釋器、知識收集器、用戶界面、知識庫和推理引擎組成。
首先以知識庫為例,其是人工智能體系中的重要組成部分,是一項重要的存儲技術。知識庫里面有事實,有信息,有普通的常識和法則。有些特定的系統還包含了資料庫。其次是推理引擎,又稱推理機,它包含了控制策略和各種類型的任務搜索。作為一個特殊的數據庫,其在提供查詢的支持層面上扮演了非常重要的角色。用戶接口的內容包括了系統和有關信息的傳輸。推理引擎是一座連接外部信息和內部信息的橋梁,既能向使用者展示最后的加工效果,又能把使用者的意愿傳遞到計算機。而在這種情況下,利用的非自然語言可以減輕使用者的心理壓力,在進行工作和邏輯運算時,起到了存儲中間結果和數據的作用。在實際的使用中,系統會將問題顯示在黑板上并將問題的初始狀況呈現出來。然后,專家系統會按照知識庫中的信息進行分析,并對黑板上的信息進行分析。在需要的情況下,還會向客戶請教,以補充和解決知識上的不足。因此,從某種意義上來說,黑板也可以看作是一個動態的知識基礎,在操作過程中發揮著至關重要的作用。最后是知識采集器,其主要作用是通過對知識庫的實際操作進行更新,以確保整個系統的穩定運轉。解析儀的任務是解答使用者的問題,并為使用者提供相關該系統結果的操作路徑。總之,人工智能就是用科學、虛擬的方式來解決人類的問題。
人工智能系統包含:界面、資料庫、推理機、黑板、知識收集器和知識轉換解釋器等。
界面,也就是UI 使用者界面。使用者通過使用者界面,設定關鍵字或搜尋法則讓邏輯推理搜尋,最后呈現出使用者所需的文字資訊、音頻或影像。界面是一個輸入和輸出的媒介,可以讓數據變得直觀,讓使用者可以更好地利用信息檢索。
知識資料庫,是人工智能在內部儲存知識的場所。將知識進行科學分類,儲存各種知識,方便讀者查詢。
推理機是具備邏輯性的程序組,其任務是把人的口頭表達轉化為電腦的語言,并建立查詢的規則來滿足使用者的需求。
中間資料庫與知識資料庫不同,中間資料庫是在進行推算的時候,將某些資料存儲起來。系統中的推理組織設定了某種特定的計算機語言,在黑板上呈現出初始問題的狀況。通過對該資料庫的問題進行二次開發,對資料庫中的內容進行匹配搜索,由專家輔助人員對資料庫的內容進行及時升級,彌補缺乏的知識點。其是一個對整個智能系統進行全面控制的動態資料庫。
知識收集器的作用類似于前面提到的黑板后臺進行的人工的數據填充更新,但是采用了一種新的方法,即對缺少的知識進行了界定,并利用互聯網自動更新知識數據的信息。
知識轉換解釋器就是通過對使用者查詢到的問題進行分析,然后將計算機語言轉化為人類語言,為使用者提供信息,搜索推斷過程也可以提供給檢索使用者。
FTP 類是一種在線即時查詢的檢索方法。用戶要登陸電腦系統進行操作,才能完成對信息資料的檢索。同時,利用FTP 的查詢功能,還能進行各種數據的傳輸。比如常用的Archie,是一種基于文檔的自動檢索程序,通過對文檔相關知識進行分析,能夠對文檔的訪問和對其所屬的系統進行查詢。
基于菜單式的檢索工具,其本質是一種呈分布式的信息查詢工具。此類檢索工具能夠根據用戶的實際需求,選擇對應的數據。對于一些不太熟悉的內容,用戶也能應付自如。
基于關鍵字的檢索,則是在使用者的操作時可以不管該信息到底存在于哪個特定的電腦中。以廣域信息查詢系統(WAIS)為實例,利用WAIS 檢索系統,從相應的數據庫中獲取需要的文檔,然后在預先設置的檢索區域中進行查詢。因為這個系統可以有效地進行遠程搜索,在完成上述搜索之后,WAIS 軟件不但可以顯示出更多的內容,而且還可以很好地體現出重點信息。
與傳統的人工檢索相比,人工智能的信息檢索有很大的優越性,特別是在海量數據中。第一,其具有高精度。因為其機械電路是以電腦為基礎的,一般來講,人工智能信息檢索不會像人工那樣粗心大意。第二,人工智能永遠不會感到疲勞。有些大公司隨時都要搜索,如果是純粹的人工采集,則需要多名數據采集者輪換檢索,而使用人工智能進行信息檢索,則只需要一個智能系統。第三,其擁有龐大的信息庫。可以更精確地按照問題搜索關鍵字,并且隨著使用的年限而不斷改進,還可以通過特殊的標準,來過濾所獲得的數據。
進入新世紀,計算機技術取得了空前的突破。目前,世界各國對網絡信息安全的認識不斷深化,越來越重視網絡信息安全問題,并不斷強化網絡監測和網絡管理。通過對數據的采集,可以確定網絡監控和網絡的控制是否符合要求。在電腦剛剛出現的時候,因為網絡上的數據并不穩定,缺乏連續性和規律性,所以要讓電腦對數據進行自動的分析和判斷比較困難,因此必須融合智能技術。隨著電腦的普及,電腦越來越多地成為人們休閑、工作的便捷工具,同時也帶來了大量的信息風險。當今世界上因互聯網資訊而引發的犯罪事件層出不窮,若要讓資訊更安全、更可靠,必須更新電腦,提升電腦效能,因此必須建立一個智能化的系統型管理平臺,并具有對信息的自動識別能力。比如,對信息有無高風險的信息泄露、對網絡有無故障進行判定,從而保障了用戶的個人信息安全。計算機網絡技術的發展離不開人工智能技術的發展,而計算機網絡中的數據又是由人工智能來處理的,在遇到不確定信息時,其能迅速地解決問題,并迅速地跟蹤和定位具有動態變化的信息,使使用者獲得技術處理的相關信息。人工智能增強了信息集成的能力,改善了網絡管理的問題,提高了管理的效率,使網絡的技術水平得到了進一步的提高。
將人工智能用于網絡信息檢索,可以將其劃分成類。第一類是智能化的信息處理,主要功能是對網上所收集到的信息進行合理的歸類,再按照關鍵詞進行相似性的比對,最終將經過篩選和審查的信息輸入到資料庫。其主要過程是將所獲取的資料的類別與內容,依照一定的原則與方式進行適當的歸類,然后進行智能配對;其次,通過對信息庫中的信息進行對比和過濾,可以避免信息重復、占用計算機內存等問題,從而實現對信息的智能化升級;根據比對的結果,將數據存儲到數據庫中,替代原來的數據,也可以將新的數據和原來的數據進行融合,形成一個比較完備的數據庫;最終,通過對這些數據進行定時的整理與升級,有效防止數據的重復性,并能夠在一定程度上保證系統正常工作。
第二類是信息收集,需要有大量的信息資源來支撐,因此,信息收集是指收集、整理、更新和補充等。一般的信息收集系統包含印本信息收集和數字信息收集。印本信息收集主要是通過對紙質書籍的知識進行掃描、輸入、完成數據的轉化,轉化的工作需要通過人工智能來完成。而數字信息收集則是指通過站點鏡像、智能信息監控、智能資源發現和智能信息資源轉化4大模塊來實現的,站點鏡像就是將整個站點的信息全部拷貝到系統的后臺,從而加快采集的效率。智能信息監控是指對網上搜索到的信息數據進行監控,如果有變化或升級,那么其所存儲的信息就會隨之更新。智能資源發現主要是為目標門戶站點提供信息的智能搜索,當有與網上搜索相符的內容時,將會進行自動采集。智能信息資源轉化是將數據信息進行收集、歸類,形成一種全新的信息、知識觀念。
第三類是智能信息存儲,其是網絡信息知識庫的一個主要內容,可以保證網絡信息檢索的效能與質量。通常來說,智能信息存儲系統分為軟件、硬件和檢索3大模塊,軟件即網絡數據訪問與存儲系統,保證系統的閱讀和歸檔工作,硬件指可以存儲海量數據的物理裝置,檢索系統則是軟硬件的組合,利用人工智能提升網絡中的信息檢索速度,并且還可以利用人工智能來完善信息存儲,以提升網絡資訊查詢的效能。
在大數據環境下,以互聯網為基礎的人工智能已被大量地運用在網絡信息檢索中。其利用一套軟件程序,在獲得使用者的授權后,產生一個軟件的代理通訊協定,方便了軟件和使用者之間的數據交流,并為使用者的網頁資訊找到一個比較精確的方法。比如,當使用者需要查找某一項特定的信息時,因為該位置的關鍵詞不能被識別,所以會給出一個模糊不清的關鍵詞,然后通過智能代理技術,可以對該詞的檢索痕跡、偏好、習慣等進行分析,并對該信息進行跟蹤,剔除無效的、無用的信息,最后得到自己需要的資料。該技術更多地被用于普通的搜索引擎如百度、谷歌和搜狗。但是,智能代理技術歸類的所有資料也不可能都是精確的,往往會有很多與使用者所要尋找的主題背道而馳的內容。但是,因使用方便及精化模糊信息的功能,其仍然是目前最普遍的一種技術。
在使用智能代理技術的時候,主要就是將其運用到人工智能中去。例如,它可以幫助使用者在互聯網上找到合適的網站或者用網站來進行數據的下載,而對網上的資源點,可以進行實時的計算和監測,如果信息出現了問題,要及時地進行維修和匯報。同時,智能網管可以更好地選擇資源較多、服務器較寬松的網站,減少了網絡擁堵的沖擊,從而提升了搜索與下載的速度;同時,在智能信息的處理中,可以讓使用者對網絡信息進行全面地分析,讓使用者能夠更精確地設定檢索關鍵詞,然后利用人工智能來進行搜索,并按照使用者的喜好來選擇合適的信息。
智能代理技術在網絡信息檢索中的運用,可以根據用戶的喜好來確定適合于不同客戶的搜索服務。利用人工智能搜索代理技術,可以根據已有的數據,對信息進行分析,并根據不同的數據類別,設計出一套較為科學的搜索策略。
在網絡信息檢索領域,人工智能的具體運用包括:信息篩選、語音識別、圖像識別和視頻檢索等。其可以對信息進行篩選、查詢,并對網絡信息進行有效的控制,防止垃圾信息和病毒的傳播。而自然語言的處理技術可以通過將復雜的語言法則融入到網頁的信息提取中來識別垃圾信息;而語音辨識技術主要是從使用者的聲音中抽取出信息,利用某種特定的語言法則來進行信息檢索,從而促進網絡信息的重新排列與整合;影像辨識與影像檢索技術,就是利用電腦或手機上的影像采集裝置,將所檢索的信息轉換成影像訊號,并在影像信息中比較所檢索之物的特性與型式等,以選取最精確的信息。
總之,對網絡信息檢索的需求在大數據時代越來越高。所以,運用人工智能技術開發網絡信息檢索,能夠有效地保證網絡檢索的有效性和質量。將人工智能運用到目前的網絡信息檢索中,將極大地提高用戶的網絡信息檢索質量和使用效率。