999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

搜索引擎在計算機輔助翻譯中的應用

2018-05-16 06:27:21翟云超馬王儲常璐
電子測試 2018年7期
關鍵詞:搜索引擎數據庫信息

翟云超,馬王儲,常璐

(華北理工大學外國語學院,河北唐山,063000)

1 搜索引擎的概念

搜索引擎指根據一定策略、運用特定的計算機程序從互聯網搜集信息,完成信息組織、處理后為用戶提供檢索服務,并將檢索信息展示給用戶的系統,包括 全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、門戶搜索、引擎與免費鏈接列表等(劉彥平,2011)。百度和谷歌等是搜索引擎代表。

2 搜索引擎的工作機制

(1)抓取網頁。每個獨立的搜索引擎都有自己的網頁抓取程序爬蟲(spider)。爬蟲Spider順著網頁中的超鏈接,從這個網站爬到另一個網站,通過超鏈接分析連續訪問抓取更多網頁。被抓取的網頁被稱之為網頁快照由于互聯網中超鏈接的應用很普遍,理論上,從一定范圍的網頁出發,就能搜集到絕大多數的網頁。

(2)處理網頁。搜索引擎抓到網頁后,還要做大量的預處理工作,才能提供檢索服務。其中,最重要的就是提取關鍵詞,建立索引 庫和索引。其他還包括判斷網頁類型、去除重復網頁、分析超鏈接、分詞(中 文)、計算網頁的重要度/豐富度等。

(3)提供檢索服務。用戶輸入關鍵詞進行檢索,搜索引擎從索引數據庫中找到匹 配該關鍵詞的網頁。為了用戶便于判斷,除了網頁標題和URL外,還會提 供一段來自網頁的摘要以及其他信息。

3 基本邏輯檢索符

3.1 布爾邏輯檢索

布爾邏輯檢索的使用面最廣,使用頻率最高。利用布爾邏輯運算符連接各檢索詞,然后由計算機進行相應邏輯運算,找出所需信息。需要注意的是,在使用布爾邏輯檢索時仍然需要參考具體數據庫使用幫助或說明。

表1 布爾邏輯運算符與檢索式

3.2 位置算符檢索

位置算符檢索也稱全文查找邏輯算符或相鄰度算符,是用來規定符號兩邊的 詞出現在文獻中的位置的邏輯運算算符。

(1)W算符(with):通常寫作A(nW)B,表示詞A與詞B之間至多可以插入n個其他的詞(注意是單詞,不是字母),同時A、B保持前后順序不變;其中(W)也可以寫作(),表示兩詞之間不得有其他詞,但有些系統允許有空格或標點符號。

(2)N算符(new): 通常寫作A(nN)B,表示A與B之間至多可以插入n個其他詞,同時A、 B不必保持前后順序。其中W)表示算符兩側的檢索詞必 須前后相連,但詞序可顛倒,詞間不允許插入其他詞或字母。

(3)Same:通常寫作A SAME B,表示SAME兩側的檢索詞A和B必須同時出現在數據庫的同一個段落中。

(4)s算符(subfield):通常寫作A(S)B,表示A與B必須同時在一個句子或同一子字段內出現,但詞序可隨意變化,且各詞間可以加任意多個詞。例如輸入solar(W)energy,會得到solar energy;輸入solar(N)energy可能會得到solar energy或者energy solar。

3.3 截詞檢索

截詞檢索是指在檢索詞的合適位置進行截斷,然后使用截詞符進行處理,既 可節省輸入的字符數目,也可達到較高的查全率。需要注意的是,任何一種 截詞檢索,都隱含著布爾邏輯中的“或”運算(劉振西、李潤松、葉茜,2006)。檢索符:“?”代表零或一個字符,“*”代表無限截詞符號。

(1)后截詞 :輸入“book?”,檢索結果為“book”或“books”;輸 入“educat*”,檢 索 結 果 為“education” 、“educational”、“educator”。

(2)中截詞 :輸入“s?w”,檢索結果為“saw” 、“sew”。

3.4 字段檢索

字段檢索是指根據標題、作者、摘要、關鍵詞、作者單位、文獻來源、學位授予單位、學位級別、會議信息、會址、會期、書名、出版地、出版年、專利號報告號、ISBN 和 ISSN 等字段檢索所需內容。

表2 常見字段檢索

3.5 全文檢索

全文檢索是一種將文件中所有文本與檢索匹配的文字資料檢索方法。全文檢索系統是按照全文檢索理論建立的用于提 供全文檢索服務的軟件系統,可將存儲于數據庫中整本書、整篇文章中的任 意內容信息查找出來,進行各種統計和分析。

3.6 精確檢索

精確檢索是指盡可能限定檢索范圍,以最快速度找到自己所需的檢索方式。在計算機輔助翻譯中采取精確檢索能夠提升檢索效率,避 免大量冗余信息。需要注意的是,采取該種檢索方法的前提是譯者對自己的檢索內容非常確定。

例 1

使用雙引號“”。檢索符含義:對引號中的內容不進行任何添加刪除處理進行檢索。

在 Google 中檢索短語 knock down joint 會發現,除了包含完整關鍵詞 knock down joint的檢索結果外,還顯示了包含 knock down、joint 等關鍵詞和關鍵字的結果。將整個關鍵詞 knock down joint 加上雙引號“”進行檢索,結果則只剩下包含完整關鍵詞knock down joint 的詞條。

例 2

使用布爾邏輯檢索符“-”。檢索符意義:排除減號“-”后面的內容?!癇ass”在中文中既指一種低音樂器(貝斯),同時也有“鱸魚”之意。如要在搜索引擎中僅查找有關“貝斯”的檢索詞條,需在檢索框中輸入“bass[空格] -fish”,就可以把有關鱸魚的檢索詞條全部屏蔽掉。

4 結語

除了電子詞典與工具書,在進行翻譯實踐時,搜索引擎已經成為翻譯實踐工作必不可少的工具。與此同時,在使用搜索引擎輔助翻譯時也要辨別檢索結果的真偽,避免出現偏差、低質量或違法的結果。

參考文獻

[1]李躍珍.信息檢索與利用[M].杭州:浙江大學出版社,2006.

[2]劉廷元,邵衛東,湯凝.信息檢索原理教程[M].北京:北京交通大學出版社,2008.

[3]劉彥平.關于網絡搜索引擎及其優化的討論[J].電子商務,2011(04).

[4]劉振西,李潤松,葉茜.實用信息檢索技術概論[M].北京:清華大學出版社,2006.

[5]徐劍,柯貴明.網絡爬蟲技術在搜索引擎中的應用[A].全國第21 屆計算機技術與應用學術會議(CACIS·2010)暨全國第 2 屆安全關鍵技術與應用學術會議論文集[C]. 2010.

[6]趙慧,李春明,鮑可進.一種基于 DotLucene 搜索引擎的知識庫中文全文檢索系統[A].第二十二屆中國數據庫學術會議論文集[C].2005.

猜你喜歡
搜索引擎數據庫信息
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
網絡搜索引擎亟待規范
中國衛生(2015年12期)2015-11-10 05:13:38
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
基于Nutch的醫療搜索引擎的研究與開發
廣告主與搜索引擎的雙向博弈分析
搜索,也要“深搜熟濾”
主站蜘蛛池模板: 亚洲国产理论片在线播放| 欧美亚洲欧美区| 97精品久久久大香线焦| 午夜视频在线观看免费网站| 亚洲无码37.| 国产视频一二三区| 欧美曰批视频免费播放免费| 国产乱子伦视频在线播放| 国产成人喷潮在线观看| 日本91视频| 理论片一区| 亚洲中文字幕av无码区| 日韩不卡高清视频| 四虎在线观看视频高清无码| 狠狠干欧美| 精品国产自| 欧美成人手机在线观看网址| 老熟妇喷水一区二区三区| 国产成人凹凸视频在线| 中文成人在线视频| 欧美国产精品拍自| 色播五月婷婷| 亚洲综合天堂网| 综合久久五月天| 在线欧美一区| 国产在线无码av完整版在线观看| 色成人亚洲| 伊在人亚洲香蕉精品播放| 国产精品久久久久婷婷五月| 在线播放精品一区二区啪视频 | 国产精品久久久久久久久kt| 青草精品视频| 精品一区二区三区视频免费观看| 99草精品视频| 午夜久久影院| 亚洲毛片网站| 久久久精品国产亚洲AV日韩| 国产精品午夜福利麻豆| 亚洲日韩第九十九页| 精品视频一区二区三区在线播| 国产精品久线在线观看| 亚洲精品福利视频| 亚洲第一网站男人都懂| a级毛片免费看| 久久国产黑丝袜视频| 色香蕉影院| 国产午夜看片| 美女无遮挡免费网站| 啊嗯不日本网站| 伊人91在线| 国产无码精品在线| 成人在线亚洲| 99久久国产综合精品女同| 人人爱天天做夜夜爽| 98超碰在线观看| 中文字幕在线一区二区在线| 国产乱子伦手机在线| 久青草免费在线视频| 中国丰满人妻无码束缚啪啪| 色综合狠狠操| 91色国产在线| 国产噜噜噜视频在线观看| 国产高清免费午夜在线视频| 日韩在线永久免费播放| 亚洲国产欧美国产综合久久| 国产人前露出系列视频| 99热这里只有精品久久免费| 一级毛片免费播放视频| 色精品视频| 2018日日摸夜夜添狠狠躁| 99视频只有精品| 中文字幕人妻无码系列第三区| 免费a级毛片18以上观看精品| 国产精品无码一区二区桃花视频| аⅴ资源中文在线天堂| 精品人妻无码中字系列| 欧美性久久久久| 国产亚洲精品在天天在线麻豆 | 少妇精品在线| 在线精品亚洲国产| 香蕉视频在线观看www| 香蕉国产精品视频|