盛建強(qiáng),陳驍
(深圳信息職業(yè)技術(shù)學(xué)院,廣東 深圳 518172)
隨著拍照設(shè)備的日益普及,各種各樣的圖像數(shù)量呈現(xiàn)幾何級的飛速增長。而同時互聯(lián)網(wǎng)的快速發(fā)展也使得圖像傳播與共享變得更加快捷。為了有效地組織、查詢與瀏覽如此大規(guī)模的圖像資源,圖像檢索技術(shù)應(yīng)運(yùn)而生,成為計(jì)算機(jī)視覺領(lǐng)域的研究重點(diǎn)。
目前,圖像自動標(biāo)注已經(jīng)得到廣泛研究,眾多的研究者從不同的方向分析和解決標(biāo)注問題,提出了各種新穎的自動圖像標(biāo)注算法。這些圖像標(biāo)注方法大致可以分為三類:一類是基于分類的方法,第二種是基于搜索的方法,第三種是基于概率模型的方法。
特別地,在統(tǒng)計(jì)概率模型的方法中,統(tǒng)計(jì)主題模型(Statistic Topic Model)近年來得到了充分的重視和深入的研究。
在Blei和Jordan[1]提出的C-LDA模型中,首次構(gòu)建了基于LDA模型的圖片和主題的一致性關(guān)系,其模型如圖2所示。受此啟發(fā),我們構(gòu)建了基于流程圖上下文關(guān)系的一致性LDA模型(CC-LDA),根據(jù)流程圖本身所包含的文本信息W以及流程圖在全文中的上下文信息C[2-5],構(gòu)建一個向量(W,C),通過計(jì)算概率P(W|C),估算流程圖在全文中上下文信息條件下的主題分布,作為我們標(biāo)注流程圖的主題。
一幅流程圖,diagram中的單詞和context中單詞的聯(lián)合概率分布如式(1)所示:

式(2)是diagram中單詞的條件概率
符號定義如表1所示。

表1 符號定義說明
cc-LDA模型中Context的生成過程如下:
(1)對于每個Context d∈D,從參數(shù)為α的Dirichlet先驗(yàn)分布中抽樣,得到文檔-主題多項(xiàng)分布θd;
(2)對于每個主題z∈K,從參數(shù)為γ的Dirichlet先驗(yàn)分布中抽樣,得到主題-單詞多項(xiàng)式分布ψz;
(3)對Context d中的第i個詞cd,i:
①從多項(xiàng)分布抽取一個主題zd,i;
②從多項(xiàng)分布抽取一個單詞cd,i;
③重復(fù)(a,b)N次
(4)重復(fù)步驟(3)D次,直到整個corpus生成完成。
流程圖(Diagram)的生成過程如下:
(1)對于每個Diagramd∈D,從參數(shù)為α的Dirichlet先驗(yàn)分布中抽樣,得到文檔-主題多項(xiàng)分布θd;

(3)對Diagram d中的第i個詞wd,i;
從[0,N]上的均勻分布中抽取gd,i
從多項(xiàng)分布θd抽取一個主題zd,i;
從多項(xiàng)分布ψz抽取一個單詞wd,i;
重復(fù)(a,b,c)M次
(4)重復(fù)步驟(3)D次,直到整個corpus生成完成。
cc-LDA模型的推導(dǎo)過程如下:

式(3)為主題z的概率分布。

式(4)為Context中單詞對主題z的條件概率分布。

式(5)為Diagram中單詞對主題z的條件概率分布。
然后使用Gibbs Sampling采樣計(jì)算得到如下后驗(yàn)分布:

我們的實(shí)驗(yàn)結(jié)果分兩部分進(jìn)行,首先我們用Perplexity指標(biāo)對圖像的標(biāo)注結(jié)果進(jìn)行度量。結(jié)果圖1所示。
本文基于生物醫(yī)學(xué)流程圖的特有屬性,構(gòu)建了基于上下文語境的圖片和主題的一致性關(guān)系,通過實(shí)驗(yàn)表明,該方法具有較好的冗余性和魯棒性,得到了較好的實(shí)驗(yàn)結(jié)果。

圖1 實(shí)驗(yàn)運(yùn)行結(jié)果