薛艷
(西安美術學院, 藝術教育學院, 陜西, 西安 710000)
互聯網技術的飛速發展以及多媒體技術的廣泛應用,使人類獲取多媒體資源的方式發生了很大的變化[1-2]。在這種情況下,各種類型的多媒體資源定向檢索已經逐漸成為不同類型用戶獲取多媒體的重要工具[3]。但是傳統的資源檢索主要是通過關鍵詞進行搜索,檢索效果往往無法令人滿意。為此,相關專家給出了一些較好的研究成果,例如鄭偉等[4]通過貝葉斯網絡組建信息檢索模型,實現信息檢索。李愛勤[5]重點分析不同平臺中地名的表達特征,設計了面向地名信息的多級索引組織方式以及檢索框架,以有效實現信息檢索。以上2種方法雖然取得了較為滿意的研究成果,但是由于未能對多媒體課件資源進行降維處理,導致定向檢索錯誤率增加,檢索效率和課件資源的總相似度降低。為此,提出一種大學英語多媒體課件資源定向檢索方法,最后通過仿真實驗證明本文所提方法的優越性。
在大學英語多媒體課件資源定向檢索中,對圖像和視頻的內容進行描述,通常情況下使用特征向量的形式表示,特征向量是指在變換下方向不變,或者簡單地乘以一個縮放因子的非零向量。為了更加精準地描述多媒體信息[6],大部分特征向量往往是高維的。為此需要選擇特征組合進行降維處理。以下采用LLE算法對大學英語多媒體課件資源進行降維處理,具體步驟如下。
給定N個輸入特征向量集合{x1,x2,…,xn},采用LLE算法,獲取降維后的輸出向量,整個算法主要劃分為以下幾個步驟。
(1) 獲取各個特征向量的k個最近鄰點,即距離每個特征向量最近的點。
(2) 采用各個特征向量的近鄰點對特征向量進行重建[7],獲取重建過程中誤差最小的近鄰局部重建權值矩陣。
(3) 通過步驟(2)中組建的矩陣和對應鄰近點計算特征向量的輸出向量。
計算各個特征向量的k個近鄰點,其中k為一個固定值。設定一個誤差函數,主要用于求解局部重建權值矩陣,具體計算如下:
(1)

(2)
當求解局部重建權值矩陣W時,需要使誤差函數的取值達到最低[8-9],即通過樣本點的近鄰點組建最優W矩陣使誤差函數取值達到最低。
針對特征向量xi,通過k個近鄰進行局部重建,則誤差能夠表示為

(3)
其中,Q(i)為k×k的矩陣,具體的表達形式如下:
(4)
如果設定r是一個規范化參數,I為單位矩陣,則:
(5)
將全部的特征向量映射為低維空間中的向量,同時需要使輸出數據在低維空間中保持初始拓撲結構。以此為依據[10],建立一個代價函數,在映射的過程中需要使代價函數的取值為最低,具體為
(6)
式中,yi為xj的輸出向量,y(i)j為y(i)的k個近鄰點,同時需要滿足以下約束條件:

(7)
其中,誤差代價函數式(6)可改寫為以下形式:

(8)
式中,M為一個N×N的對稱矩陣,利用式(9)給出具體的表達形式為

(9)
通過拉格朗日乘子法將其進行轉換,則特征值和特征向量為

(10)
為了使代價函數最小化,需要選取M的最小m個特征值對應的向量為列向量組建矩陣YT,則Y的列向量為m維空間的降維向量。
當確定特征向量的局部最近鄰個數k值后,組建如下的稀疏矩陣,即:

(11)
給定限定條件,將上述問題轉換為最小化問題,即轉換為最小代價函數的特征值和特征向量:

(12)
在上述分析的基礎上,通過LLE算法對大學英語多媒體課件資源進行降維處理,即:
(13)
采用多模態檢索機制進行大學英語多媒體課件資源定向檢索,利用圖1給出多模態檢索體系結構。

圖1 多模態檢索體系結構
當給出交叉參照索引時,需要優先設定多媒體對象,以下將交叉參照多媒體對象簡稱為廣義關鍵字,即:
P(Oi)=(〈gki1,wi1〉,〈gki2,wi2〉,…,〈gkik,wik〉,…,
〈gkiN,wiN〉)
(14)
在組建檢索系統的初級階段,需要優先對多媒體進行預處理,多媒體對象的交叉參照索引可以根據分析已有的多媒體文檔組成結構以及網絡上的超鏈接組建。
通過自動得到的交叉參照索引全面利用大學英語多媒體課件資源間的隱式語義關系,針對面向用戶的檢索而言,僅僅使用這些交叉進行檢索能力是有限的。首先,在大學英語多媒體課件資源進行預處理以及用戶提交查詢的過程中,會出現單一的多媒體對象,這些多媒體對象的交叉參照索引很難建立。同時,大學英語多媒體課件資源組成的結構僅僅是課件設計者對多媒體對象語義關系的理解,由于檢索是面向用戶的,所以在進行交叉參考索引時還需要全面分析大學英語多媒體課件資源語義間的關系。
為有效提升檢索精度,需要加入相關反饋這種人機交互手段,通過用戶對檢索的反饋信息及時調整多媒體對象的交叉參照索引。其中,交叉參照索引以及關鍵字索引兩者存在一定的相似性,兩者的主要差異是交叉參照索引使用的是一組多媒體對象進行標注,而關鍵字索引使用的是關鍵字標注多媒體對象。
在交叉參照索引中,各個廣義關鍵字gkik所對應的權重wik體現了上述的第一個因素,所以需要對其進行調整,如式(15):
(15)
式中,M為關鍵字的總數量,Mik為交叉參照索引中含有gkik廣義關鍵字的多媒體對象總數。
兩個多媒體對象間交叉參照索引間的相似度計算主要通過余弦距離完成,同時能夠將交叉參照索引間的相似度轉換為對應夾角的余弦值,具體表達形式如下:
(16)


(17)
通過加權平均算法計算多媒體對象P和查詢對象Q兩者間的距離,即:
(18)
其中,相關反饋信息的處理問題能夠被描述為通過用戶的反饋信息獲取理想的查詢對象,同時使反饋正例和查詢向量間的加權距離平方和最小化,即:
(19)
采用拉格朗日乘子法將具有約束條件的優化問題轉換為無約束的最優問題,即:
(20)
檢索主要是通過多個不同的階段完成的,首先通過索引進行候選對象匹配;再更新查詢矢量和相似度度量,計算候選對象的綜合相似度;最后排列對象并且返回至用戶。其中,多媒體對象和例子對象兩者間的總相似度計算式為
(21)
式中,Ri為第一階段計算出Oi和例子對象兩者間的對等索引相似度。
為進一步提升檢索結果準確性,用戶可以將大學英語多媒體課件資源標注為相關或者不相關。通過上述操作流程,對查詢向量以及歐拉相似函數進行優化處理,通過一個全面的相似度量方法來重新計算各個對象的總相似度,具體計算式如下:
(22)
由此,實現大學英語多媒體課件資源定向檢索。
為了驗證本文所提方法的綜合有效性,在Ubuntu16.04,電腦配置為GPU(NVIDIA GTX-10606G顯存),CPU(i7-6700),8G內存,進行仿真實驗測試。在仿真實驗測試過程中,為保證實驗結果的準確性,使代價函數的取值為最低,大學英語多媒體課件資源總數為800條,共進行50次實驗測試,將定向檢索錯誤率作為測試指標,具體的實驗對比結果如圖2所示。

圖2 不同方法的定向檢索錯誤率對比結果
分析圖2可知,隨著實驗次數的持續增加,文獻[4]、文獻[5]方法的定向檢索錯誤率均呈直線上升趨勢,而本文所提方法的定向檢索錯誤率則處于穩定的狀態,這是因為設計方法優先對不同的課件資源進行了降維處理,有效剔除了無價值信息,從而使錯誤率得到了明顯降低。
為預測各個檢索方法的性能,以下實驗測試將檢索效率設定為測試指標,具體實驗結果如表1所示。

表1 不同方法的檢索效率對比結果
分析表1可知,本文所提方法能夠獲取課件資源中有價值的信息,剔除無用的信息,有效降低資源重疊,大大提升整個方法的檢索效率,且明顯優于另外2種方法。
為了更深入驗證本文所提方法的優越性,將大學英語多媒體課件資源總相似度作為測試對象進行實驗,對比如圖3所示。

圖3 不同方法的大學英語多媒體課件資源總相似度對比結果
分析圖3可知,相比另外2種方法,本文所提方法的大學英語多媒體課件資源總相似度明顯更高,最高可達到97.5%,這是因為其他2種方法未能對資源進行降維處理,導致其受到外界因素和人為因素影響嚴重,無法獲取理想的檢索效果,而本文設計方法對相關資源進行降維處理,能夠滿足大學英語多媒體教學的需要,具有一定的實際應用價值。
本文設計并提出一種大學英語多媒體課件資源定向檢索方法。仿真結果表明,本文所提方法能夠有效降低定向檢索錯誤率,提升檢索效率和課件資源總相似度。由于受到時間以及環境等因素的限制,致使本文所提方法仍然存在一定不足,后續將對其進行全面的完善和改進。