占小雄
摘要 文章對智能搜索引擎開展了分析和說明,著重探討了知識庫體系和它在智能搜索引擎中的實際運用。
【關鍵詞】知識庫 系統 智能 引擎
互聯網技術自從出現到迅速發展的近十年時間里,從各個層面都不可估量的影響著現代社會主義的發展,伴隨網站網頁的迅速增加和用戶群體不斷的壯大,搜索引擎逐漸成為了人們使用網絡時的主要工具。從用戶的視角來說,現在的搜索引擎依舊有檢索含金量并不高、檢索形式單一、標引不夠深、缺少個性化等等的現象發生,因此新一代有著顯著的智能特性的自動搜索引擎技術油然而生。
1 智能搜索引擎的功能特征
智能搜索引擎的人機端口和網絡蜘蛛高階層的智能化,能夠跨越平臺運作、解決多種混雜文檔、支持多元化語言搜索,而且能夠按照用戶的喜好、特點、專題需要,持續進行實時推送、推薦有關的消息、知識、設計個性化的頁面等等,展現出較強的智能性、自主性、相互性、人性化等特點,促使更好地擴大用戶群體。
1.1 智能型自然語言技術
智能型的自然語言技術涵蓋了“自然語言檢索”和“動態相關詞、想象詞提醒”技術內建立具體的“布爾邏輯運算組合”的檢索條件和“相近檢索”功能,搭配“智能性迅速響應模式”,有利于提升檢索速度和準確度。用戶可以隨意選取想要檢索的數據庫。搭配“中文同義”、“中英文相似理念”、“簡體繁體轉換”、“通配字符檢索”“詞組檢索”和“多字符平行搜索”等多種智能檢索功能,繼而更加有效、方便快捷獲得有效信息。
1.2 靈活的搜索制度
帶來多種模版制作功能,可以根據用戶個人的需要情輕易修改檢索結果的顯示頁面;還能夠按照不同的檢索方式,借用能夠獲取不同的檢索結果的模版文檔。提供“機動權值順序制度”、“分層式羅列目錄”、“動態相關詞、想象詞提醒”等功能,給用戶帶去更好的檢索頁面,加大檢索結果的實用性。
1.3 搜索指引功能的強大
選用“多線式資料獲得制度”、“平行搜索指引方式”、“動態文檔解析技能”和“實時差異式搜索指引創新技術”等多項功能,有效地提升文件和數據庫的搜索指引速度,一定程度上減少了搜索指引等待的時間和更新周期。帶來“多種索引數據庫”結構和“群組式分層目錄”功能,減少資料索引的用時,靈活整合文件資料。
2 知識庫系統在智能搜索引擎當中的實際運用
2.1 知識庫系統的原理
2.1.1 知識的含義
知識是人類對于世界比較客觀性的認知,往往知識是首先從底層數據通過一系列的分類、總結、綜合等處理的過程從而獲得的上層信息,這種信息在通過詮釋、對比、推理獲得我們所得到的知識,這個過程主要是在語言意義的方面來開展的。抽象來看,知識是用著名論域內容和有名論域內容之間相關的符號來代表的。
2.1.2 知識的代表
知識代表說的是知識在電腦內部的儲存和建立,是數據架構和詮釋過程的綜合。數據架構用在知識的形式無法描述,而詮釋的過程則是用以證明知識的實際寓意。知識的代表方式主要有一些謂詞邏輯代表法、衍生式代表法、語言寓意網絡代表法和面對對象的知識表達方式等等。
2.1.3 知識庫
知識庫是有關某一個層面的理論性知識、過程性知識和對策知識的綜合。在這個綜合當中各種知識經過一定程度上的表達方法代表,并建立互相之間的關聯。知識庫不單單包括了大量的簡單事例,還包括了規定、過程型知識和對策性知識。從儲存知識的視角來說,用描述型方式來儲存和約束知識的機構就叫知識庫。從運用知識的視角來說,知識庫是由知識和知識解決機構組合而成的。
2.1.4 知識庫系統的系統結構與推理結構
(1)知識庫系統的系統結構。知識庫體系包含知識的獲取、運用和管理三個層面,知識的獲取,也叫做機器學習,就是獲得新的知識信息并且讓它作為一個完整的體系,知識的運用就是推理。知識庫、推理機構和儲存器知識庫體系的三個重要組成因素。當中推理機構可以效仿決策人員的想法經過,并且按照決策人員的需要,經過提問談話和分析問題,利用相關規定指引決策人員選取適當的模型。知識庫體系的中心組成部分是知識庫和推理機構。知識庫是用統一的模式儲存知識的機構,推理機構則是由于運用知識庫里的知識進行推理的管制機構。
(2)知識庫的推理機構。運用知識,詮釋輸入的數據或者現實,推理出用戶需要的結果;并且按照需求,證實得出結果的根據,用來開展這種推理管制的領域叫做推理機構。需要具有以下功能:①知識庫內新知識的獲得功能②推理機構和知識庫互相成為個體的功能③知識庫內信息轉換和知識補充功能;④知識庫和待解決問題之間的調節功能。
2.2 知識庫在智能搜索引擎中的運用
主要詞語查詢的前情提要是把查詢條件分割成很多關鍵詞。對于英語來說,一個單詞就代表一個詞,但是中文的詞語之間的聯系是非常繁瑣的,關鍵問題是中文里詞語和詞語之間沒有限定標準,需要人為分割,但是人為的分割存在很大的靈活性和被動性,時常會導致詞語意思失去實際意義。另外,漢語言文化中有大量的歧義情況出現,導致錯誤檢索和漏掉檢索。所以,可以運用語言意義知識庫開展歸納,得到每個詞語出現的可能性和詞與詞之間的聯系信息,就能夠有效地排除所有的歧義,很大程度上提升分詞的精準性。
短語識別技術,利用短語表述查詢申請的現象很平常,可是由于漢語詞組很繁瑣,所以在中文搜索引擎中,我們無法像英語詞組一樣簡便的把中文短語分割成詞組。比如查詢條件“上海的大學”,“上海”和“大學”有著一定的聯系,可是如若不把“上海”和“大學”相關聯作為一個短語進行查詢的話,那么除了找出有關“上海的大學”的文檔以外,還會找出有關于“上海”和“大學”的其他文檔。所以,短語識別是智能化搜索引擎面臨的一個關鍵問題。
3 結束語
智能搜索引擎技術在將來的社會發展當中,會持續完善現有的搜索引擎的功能和特性,并且會綜合人工智能、知識工程和網絡分散計算等區域的探究成果,找出一些新的探究走向,比如可視化智能搜索引擎等。與此同時,隨著互聯網上的消息量持續增多和計算機運算速度的加速,智能搜索引擎技術會是信息搜索的良好發展形勢。
參考文獻
[1]楊山豹,張曉凌,基于知識庫的智能搜索引擎研究[J].電腦與信息技術,2010,18 (02):41-44.
[2]黃意珊,王潛平.基于知識庫的啟發式智能搜索引擎的設升[J].計算機工程與設計,2007 (09): 2134-2137.
[3]郭慶琳,樊孝忠,關于智能信息處理技術的研究[J],微計算機應用,2003 (04): 200-203.
[4]楊光,人工智能思想在智能搜索引擎中的運用[J]上海鐵道科技,2002 (04): 39-16.