999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Web的圖像檢索技術研究

2016-03-22 10:21:4661683部隊張相國
電子世界 2016年4期
關鍵詞:產品質量頁面文本

61683部隊 張相國

?

基于Web的圖像檢索技術研究

61683部隊張相國

如今,在Web圖像檢索過程中,有很多成熟的技術,如基于Web的數據倉庫,Web數據挖掘,Web數據源集成技術。因此,必須建立適當的數據模型頁面,數據模型可有效地用來獲得從Web信息。為了應對中國的數據網絡,還必須使用一系列中國自然語言處理技術。根據對比技術,自動分割,其它如信息抽取,自動摘要,自動文檔分類,中國話和像自動發現的概念來確定語義關系的詞與詞之間的技術概念是必不可少的。需要實現上述堅實的技術積累和自然語言處理能力。

而如何利用現有成熟的傳統圖像檢索手段,并迅速開發出一種快速,便捷的方式,以提高檢索效率,本文會發現中國和頁面之間的圖像的固有特性是基于現有的搜索引擎的研究和檢索裝置和接觸,提高在原始文本搜索中使用的模型和方法,提出了新的文本相似性匹配算法,并引入檢索反饋技術,這些技術的引進到圖像檢索,使它更容易的搜索裝置落實和提高檢索效率。

1 文字和圖像之間的關系

在文本檢索,各大搜索引擎考慮的Web頁面相關聯的文本信息和其語義,這些文本反映了一個網頁的信息內容,但與頁面中的圖片內容不完全一致。HTML頁面,基于HTML語言的格式,圖像采集信息反映的短信,這些文本的語義分析具有十分重要的意義。作為一個HTML文檔標簽的文本消息以及周邊,并在頁面圖文并茂的內容是緊密相連的。

1.1顯示了文本標記的圖像

為了識別嵌入到網頁中的圖像的內容,這必須小心檢索和標記文本反映圖像內容的HTML文檔。大量的研究和HTML頁面格式的實際網頁的分析之后,可以看到標有文字和圖像內容有以下幾個方面的聯系最緊密的。

說明:

(1)的圖像,文本顯示在圖像的周圍,用句,句子過度內容顯示圖像時,圖像被放置在桌子上,在細胞中相同的元件或文本鄰近并通常表示圖像的含義。

(2)圖像的標題,圖象信息通常是由一個關鍵詞來表示。當一些文字用語的摘要信息

(3)利用圖像,并更換標簽指示標記圖像時,圖像不顯示圖片,顯示的摘要信息。

(4)在頁面的標題,該標題反映了頁面的中心的內容,如圖像內容和標題頁之間的網絡的性能也有一定的聯系。

1.2文本的權重的比較

在頁面圖像信息上述圖像檢索討論,首先是描述圖像內容特征建立查詢,然后比較,獲得需要被檢索到的圖像描述信息并區分的相似和查詢之間的差異。然而,上述信息圖像聚焦在一個不同的角度,并在暴露于圖像信息的程度是不一樣的。標題頁和一個簡單的條目,取其相對接近的視頻標題圖像主題的標題圖像。的圖像和標簽圖像的描述是圖像信息,它是該內容的相對更詳細的文本描述。因此,各種類型的文本信息之間的比較來區分,以確定是否搜索請求,其重量份額應有所不同。的根據在下面的尺寸中的份額加權序列的信息的重要性:

Image Caption>Image Title>Image Alternate>Page Title

2 圖像信息檢索

什么檢索使用Web搜索引擎的模式,這將直接影響提供獲取搜索結果的質量。現在我們使用多個布爾檢索模型,概率檢索模型,概率推理網絡模型和向量空間模型。這是近年來使用更多更好的,信息檢索模型:向量空間模型。

2.1 相似性檢索模型

在使用向量空間模型搜索,首先描述在Web視為條目的有序序列短信圖像,因此上文概述的信息被稱為:ICW,ITW,IAW,PTW。在該模型的應用,我首先要量化這種信息,文檔結構圖作為特征矢量V(D)=(T1,ω1(D); ...; TN,ωN (D)),其中TI( I = 1,2,...,n)是相互相同的條目而言列表,ωi的(D)在D的Ti的重量,通常被定義為發生鈦TFI(四)D的函數中的頻率,亦即:

在信息檢索中常用的詞條權值計算方法為 TFIDF 函數:

其中N為所有文檔的數目,ni為含有詞條ti的文檔數目。TF-IDF公式有很多變種,下面是一個常用的TF-IDF公式:

兩文檔之間的相似度可以用其對應的向量之間的夾角余弦來表示,即文檔di,dj的相似度可以表示為:

處理查詢,先查詢狀態?量化,主要是基于布爾模型:

當ti在查詢條件Q中時,將對應的第i坐標置為1,否則置為0,即:

即當兩個相同的條目,這一個是1,其余情況為零。由此可以看出,當含有相同術語的文檔時,相似性= 1;且其中不存在相同的術語,相似度=0。從而文檔d與查詢Q的相似度為:

根據一些機器學習算法,例如神經網絡算法,K-最近鄰算法和貝葉斯算法文檔之間的相似性,以及組合可分為設置的文件的一些小的子集的文件。

在查詢過程中,可以計算每個文檔和查詢之間的相似性,然后將結果可以基于該查詢的大小的相似性進行排序。

VSM可以自動區分文檔和相似性排序結果,可以有效地提高檢索效率;它的缺點是大量的計算相似的,在添加新文檔時,必須計算的字的權重。

圖3中的產品質量信用理論模型是企業產品質量信用關系模型的一種表達方式。產品質量信用意愿、產品質量提供能力是產品質量信用水平的內部決定因素,對應的影響指標為決定型指標。產品質量保障能力是產品質量信用水平的外在表現因素,對應的影響指標為反映型指標。即產品質量信用意愿、產品質量提供能力和產品質量保障能力三個方面是該關系模型的輸入,輸出的是產品質量信用水平。因此,企業產品質量信用評價的關系表達式可以表示為:

2.2技術和詞語匹配

2.2.1常用詞切算法

統計似然方法通常不依賴于字典中,但任何原始和一個統計單詞頻率發生之前立即字,分別后,字出現的更高的數量變大。當頻率超過預定閾值,這將被索引為一個字。這種方法可以有效地提取未知單詞。

2.2.2匹配方法

(1)字典存儲格式:

首先,建模,三層結構的存儲的形式是一個樹結構,如下:

層存儲所有的話。第二層和多雙字字(因為有可能是ABC字,而不是下一個字AB案)之前保存所有的字,并做不同的標簽(T / F)。每個字對應于一個系列詞語,所有字中的第二層的一個節點,用于存儲第一個字的一個雙字(包括上述兩種情況)。和,這里,對于每個雙字,則需要記錄雙字的最大長度是所有字的第一個字,在實踐中,可以保存移除的雙字的部分的最大長度(表示為n),第三層存儲的所有單詞,雙頭特征。為了減少存儲空間,不是僅去除(如上所示)的雙字存儲部等。已經有的每一層的每個節點的基礎上的,可以使用散列,二進制搜索方法來查詢。有了這個分層存儲架構,可以快速縮小在一個小范圍內的搜索詞,它有利于字工作效率。

(2)匹配

由于字的長詞匯通常比切口的字長的最大分離越大,為了提高分割的效率,而不是在連續的還原方法的詞,但使用正向單獨生長方法。

假設一個句子C1C2 ......是文字處理算法描述如下:

1)個字(在C1C2的開頭),查詢是否有在辭典C1C2。

2)不存在,C1是一個字,一個字結束時,返回1。

3)存在,判斷是否C1C2字,并獲得中國漢字的字典的術語低級節點的最大長度,設定為n。

4)如果n = 0,所述第一子碼字的結束時,保存的結果。

5)否則,I = 2,轉6)。

6)I = I + 1,若i = N + 3,開關8);否則,轉向7)。

7)然后取一個字(這里C),第三層決定是否一詞開始C3......字(精確匹配不是必需的,只要匹配的話,我就開始)。

8)如果有,這個詞的結尾,可以只返回C3 ...... CJ (J

9)否則,轉6)。

(3)統計方法

由于不完整的字典,字典中的很多話可能沒有注冊的句子來處理未知的話,我們嵌入統計方法的頻率在原來的算法,一些連續場作為一個分詞的頻率較高,我們先設定閾值頻率f。

已成立C1 ......道道由分割算法和模糊處理算法C1 ......慈用一個詞在一個分段的,是CJ之間的所有單個的詞......道道通字,詞和CJ,即C1 ......慈和CJ ...... Cn為相鄰兩個最近多字,然后CI + 1 ...... CJ-1作為多字詞頻統計,完成制品的所有分割后,如果CI + 1時出現的次數...... CJ-1到達f,則它被認為是一個字,否則,它被分成單個詞。

同時,對于相同或類似的專業領域,建立動態的詞匯,由這個詞不斷補充詞庫獲得的統計數據,字典可以實現動態維護。

通過上述處理方法,基于字典,結合匹配的次數依據不僅保證了分割速度快,精度高的優點搜索操作的統計方法,并在這方面最大限度的標識名稱,位置和其他技術術語不能登錄。

3 檢索反饋

由于查詢圖像的開始,它往往是與我們想要的不一致,所以我們無法找到我們想要的,因此,許多系統已出臺相關意見,那就是,通過選擇一些正確/錯誤反饋搜索結果的一個例子,以逐步改善。參考文本信息檢索的方法,我們也推出了相關的反饋來修改用戶提交的查詢,使得被修改的查詢更貼近用戶的實際需求,以提高該系統的性能。通過修改用戶提交的相關反饋,檢索性能比原來已經一定程度的提高。然而,大多數不具備相關的反饋的內存容量,每個結果,這不僅提高了查詢結果后的反饋。因此,我們引入了一個語義網絡中,每個記錄到語義Web反饋的結果,以便增加越來越多地使用該系統的頻率的效果。

本文介紹了反饋系統,主要集中在查詢(Q1,W1,Q2,W2,...,Qm的,,WM)在WJ修整查詢來定義初始WJ已有些偏差反饋系統可以適當地調整WJ,使查詢(Q1,W1,Q2,W2,...,Qm的,,WM),但也反映了檢索的目的。當查詢到的畫面,無論在哪里與目標關聯?圖片n的圖像和目標為m = R + N個。根據用戶反饋的結果反饋系統,并重新生成查詢如下:

其中載體是一種圖象檢索結果網頁矢量表示,矢量,選擇相似度計算部件作為反饋信息。在公式5,一般選γ=1,0<β<1,0<α<1,α和β選擇的影響深度的反饋值,也直接影響了檢索的準確度。

實踐表明,以比無反饋圖像檢索精度反饋系統中的圖像檢索系統由約10%,且m,較高的檢索的準確度提高。

我們設計了一個檢索系統,不提供反饋反饋選項,并在選舉制度提供反饋超值的選擇。當m值較小時,直接顯示檢索到的圖像,并選擇是否為用戶目標圖像之間的相關性。這些都是以提高應用反饋系統的用戶界面。這里是合適的度量m = 1時,檢索精度和反饋系數α,β的數字之間的曲線關系可以得出α= 0.1檢索最大值精度精密圖2可以在0.5被吸引到0.6檢索之間β精度時精度取最大值。從圖1和2,可以得到,當α=β= 0時,沒有反饋檢索精度精密= 48%,當α= 0.1,β= 0.5或0.6檢索精度精密= 61%,引入了反饋系統的時允許檢索的準確度是由13%的提高。

圖1 檢索精度Precision與系數α的關系

圖2 檢索精度Precision與系數β的關系

圖3 相似度臨界值與檢索精度的關系

圖4 相似度臨界值與 檢索完全度的關系

要測試的模型搜索,下載包含4000多個中國網頁圖像(從超過1000個網址),這些HTML文檔檢索。創建的查詢后,具有相同語義的擴大網絡進入的入口處,構建多個IQW匹配查詢,然后計算它們的相似度,分別基于所述相似性閾值規定屈服查詢的結果。實驗表明,一個合理的閾值可以被選擇以確保高度的相似性檢索精度和檢索的完整性。因為它可以從圖3可以看出,當該相似性閾值>0.6,以確保從圖4看出>80%的檢索精度,當相似性閾值<0.6,以確保>60%完成檢索。當相似度閾值是0.6,這種模式可以保證> 80%的搜索檢索精度和檢索全>60%。

為了確定ICW,ITW,I?AW,PTW右相似度計算值,測試所有的系數為0.1至1.0。最終拉伸重量ICW,ITW,I?AW,PTW為0.4,0.3,0.2,0.1時,它可以合理地反映這些文本和圖片的相關性,以確保檢索的準確性。

4 結論

了解搜索公式和反饋的搜索引擎的原理,我們可以根據理論相應的搜索引擎,并可以做一個對比的搜索結果。但為了更好地使用和要小心,以更好地歸類文檔,此引擎查詢反饋更多的培訓,使網絡搜索引擎有更好的情報和個性化功能。

參考文獻

[1]張量,詹國華,袁貞明.基于Web的圖像搜索[J].計算機工程,2002,5.

[2]朱學芳.多媒體信息處理與檢索技術[M].電子工業出版社,2003.

[3]陳瀅,徐宏炳,王能斌.協作式Web資源發現系統模型[J].計算機學報,1998,4.

[4]陽小華,周龍驤.World Wide Web 的索引與查詢技術[J].計算機科學,1997.

猜你喜歡
產品質量頁面文本
大狗熊在睡覺
刷新生活的頁面
保健醫苑(2022年1期)2022-08-30 08:39:14
產品質量監督抽查的本質與拓展
在808DA上文本顯示的改善
加強PPE流通領域產品質量監督
勞動保護(2019年7期)2019-08-27 00:41:04
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
“望聞問切”在產品質量鑒定工作中的應用
產品質量好 認證不能少
新農業(2016年20期)2016-08-16 11:56:22
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 欧美一级专区免费大片| 高潮毛片无遮挡高清视频播放 | 夜精品a一区二区三区| 久久久亚洲国产美女国产盗摄| 精品久久香蕉国产线看观看gif| 亚洲人成网站18禁动漫无码| 国产sm重味一区二区三区| 国产真实乱子伦视频播放| 国产精品自在线拍国产电影| 看国产一级毛片| 欧美黑人欧美精品刺激| 亚洲天堂首页| 亚洲无码电影| 亚洲精品色AV无码看| 国产精品夜夜嗨视频免费视频| 欧美亚洲激情| 好紧太爽了视频免费无码| 国产免费久久精品44| 精品撒尿视频一区二区三区| 女人18毛片一级毛片在线 | 国产精品免费电影| 又爽又大又光又色的午夜视频| 亚洲美女视频一区| h视频在线观看网站| 日韩高清欧美| 精品国产乱码久久久久久一区二区| 国产精品九九视频| 国产福利一区二区在线观看| 夜夜操国产| 国产91麻豆免费观看| 日韩精品一区二区三区免费| 亚洲第一精品福利| 国产成人永久免费视频| 无码人中文字幕| 亚洲V日韩V无码一区二区| 欧美精品一区在线看| 国产中文一区a级毛片视频| 亚洲av综合网| 91福利在线看| 久久中文电影| 亚洲免费黄色网| 欧美日韩国产在线播放| 国产成人禁片在线观看| 中文毛片无遮挡播放免费| 日韩国产无码一区| 中文字幕日韩视频欧美一区| 香蕉视频在线观看www| 曰韩人妻一区二区三区| 伦精品一区二区三区视频| 狠狠干欧美| 亚洲91精品视频| 久久精品国产一区二区小说| 欧美亚洲一二三区| 永久免费无码成人网站| 成人久久精品一区二区三区 | 亚洲h视频在线| 午夜欧美在线| 国产在线观看精品| 91小视频在线播放| 国产成人成人一区二区| av午夜福利一片免费看| 色视频国产| 久综合日韩| 精品无码一区二区三区在线视频| 国产一区二区三区在线无码| 国产成人乱无码视频| 久视频免费精品6| 老司机午夜精品网站在线观看| 丁香婷婷激情网| 国产成人综合在线视频| 久久频这里精品99香蕉久网址| 激情乱人伦| 国产高清毛片| 亚洲黄色视频在线观看一区| 国产在线拍偷自揄观看视频网站| 欧美啪啪一区| 亚洲第一国产综合| 国产网站免费看| 午夜a级毛片| 九月婷婷亚洲综合在线| 影音先锋亚洲无码| 国产精品免费p区|