趙曉麗
臨沂大學費縣分校,山東臨沂 273400
搜索引擎是因特網上最常見的一種信息檢索工具。它分為定期搜索和提交網站搜索兩類。定期搜索就是每隔一段固定的時間,搜索引擎就自動開啟搜索的專門程序。這種程序通過執行語句來對固定的局域網的網絡地址進行掃描,從而發現新的網絡地址,進而對新網址對應的網站的信息進行吞吐,最終加入到自己的數據庫中。提交網站搜索是指網站自動的將自己擁有的信息發送給搜索引擎,搜索引擎每隔一段固定的時間就利用編寫好的程序對網站上的信息進行掃描,發現有新的信息就自動將其儲存在備用的數據庫空間中。
從語言學的角度看,語義分析就是對句子中用到的詞匯、動詞搭配、形容詞的運用、語法進行分析。語義學就是在對語言進行研究時形成的學科。語言學的語義研究主要是找出語義表達的規律、內在含義、內在解釋、不同語言的寓意表達方面的個性及其共性。邏輯學的予以研究就是找到對邏輯關系的解釋,憑借真值條件進行判斷。如何分析網頁中信息的語義呢,下面我們將從實際的例子中得到答案。我們知道大多數的文字都是通過文本的形式被存儲起來的,但是對于不同地方的文本要表示的意義是不一樣的。例如我們通常會將比較重要的文本文件設置在標題處,網頁上的文本根據不同的標簽分為了主標題-一級標題-二級標題-三級標題-四級標題-五級標題等等。網頁信息的檢索就是通過這些一級一級的標簽進行語法的分析的。利用這些標簽就能很快的準確的找到自己要尋找的文本及其段落,由于這項分析要求檢索系統能自動完成,準確的算法是設計檢索程序的基礎。我們在對網頁上文本進行分析時,程序就對有關的主標題進行搜索,這項搜索主要是對網頁中重復出現該關鍵字的標題進行一個一個的檢索,對于頻數比較大的標題就根據算法進行排列,然后根據優先級的大小進行下一層檢索,在分析出每個句子的模式,根據它所在的文本特征區域,首先計算出該語義模式的加權相關度,然后再對所有的語義模式的加權相關度求和,計算出全文語義相關度。
對于有固定鏈接的網頁信息的檢索分析可以直接通過網站來訪問網頁。使用該方法就要求搜索人必須知道信息所在網頁的地址或是網絡實名,該方法很快的就能找到自己想要的信息,但是我們在平時的搜索中很少知道自己要搜索信息的網絡地址,這就要求我們先運用搜索引擎進行關鍵字的搜索,等到快要接近自己尋找的信息時在轉到具體的網頁的搜索。例如我們經常要到網頁上看新聞,我們可以直接進入搜狐網;要在網上買東西可以直接進入淘寶網進行shopping.
對于就像中國知網這樣的數據庫就可以直接在數據庫中進行在線查詢。在我們的網絡上有許多數據庫,里面收錄的大量的數據信息。如果我們想要了解中國目前大學生就業問題,我們就可以直接進入中國科學院科學數據庫:http://www.sdb.ac.cn來進行搜索。目前在我國各大高校圖書館都有自己的數據庫,學生可以經過直接就如數據庫搜索自己所需的文獻和資料。
我們通過具體的實例來分析一下在網頁視頻中語義的分析和校對。我們知道對于網頁上的視頻主要是通過ASR來識別視頻腳本進而進行詞語的處理和檢測,這里以動畫片視頻為例子。首先我們是將視頻分成不同的語種,我們要子視頻中找到漢語版的《喜羊羊與灰太狼》,對于不同的語種我們有專門的是識別程序,它是根據不同的語言組織形式、不同的語法、不同的發音等等進行搜索等的。例如對于漢語我們的語法就規定動詞放在主語的后面、形容詞放在名詞的前面、讀的時候從左向右依次進行等等,而對于英語就是從后向前進行讀,根據這點的不同程序就可以利用語法的不同進行很好的邏輯判斷。當然語言的判斷還只是簡單的起步,我們還要編寫腳本程序來對具有同樣作者的視頻進行檢索和歸類,例如我們可以利用邏輯電路來進行仿真模擬,當我們將簡單的燈亮的小程序拷到芯片里的時候我們看到了預期的現象,接著我們對每個腳本進行設置使得產生不同的現象,這樣就很好的區分了作者。由于目前信息量快速地增加,每一時刻大量的信息進進入到網站,傳統的提交網站搜索法已經不能滿足信息的快速增加,這就要求新的方法來解決出現的問題,這時候外鏈接就應運而生。外鏈接主要是將原來一個頁面出現的信息分成了幾個頁面,這樣一來搜索引擎就有足夠的時間將數據收錄到自己的數據庫中。我們在進行信息檢索時通常是使用關鍵字來進行檢索的,當你輸入關鍵字進行搜索時搜索引擎就會在數據中進行掃描,對于出現頻率較高的相關鏈接就出現在網頁的最上方,按照頻度依次向下排列。
網絡信息組織是將具有共同關鍵字、共同語法、共同研究對象等等的雜亂信息進行分類整理,使其形成以一套完整的系統的過程。網頁信息檢索就是人們對整理好的信息的搜索過程,語義分析就是我們用到的一種關鍵的獲取信息的方法。該方法快速的檢索分類算法,使得我們的網頁信息整理有章可循。
[1]袁穎,趙捧未.基于語義網的數字圖書館信息檢索模型研究[J].科技情報開發與經濟,2010(7):1-3.
[2]張愛文,樊紅蓮.半離散矩陣分解改進算法在網頁信息檢索中的應用研究[J].黑龍江工程學院學報,2007,21(2):55-57.
[3]陳星光.基于語義Web的信息檢索系統的研究[D].鎮江:江蘇科技大學碩士學位論文,2010.
[4]張鐵虎,朱嘉鋼.基于本體語義教務信息檢索系統的設計與實現[J].淮海工學院學報,2011,20(2):3.