張興旺 鄭聰



摘 要:視覺大數(shù)據(jù)資源作為大數(shù)據(jù)的重要組成部分,其價(jià)值產(chǎn)生機(jī)理與轉(zhuǎn)換規(guī)律具有高度的領(lǐng)域依賴性。文章從數(shù)字圖書館移動(dòng)視覺搜索引擎的領(lǐng)域依賴性分析入手,運(yùn)用模塊化設(shè)計(jì)思想對(duì)其業(yè)務(wù)流程進(jìn)行了分析,在此基礎(chǔ)上,提出了一種領(lǐng)域?qū)虻摹⒆赃m應(yīng)的、可演化的數(shù)字圖書館移動(dòng)視覺搜索引擎。最后,分析了該引擎的各功能模塊,并對(duì)該引擎的自適應(yīng)性、可演化等特征進(jìn)行了探討。
關(guān)鍵詞:移動(dòng)視覺搜索;數(shù)字圖書館;搜索引擎;領(lǐng)域?qū)?/p>
中圖分類號(hào): G254.9 文獻(xiàn)標(biāo)識(shí)碼: A DOI:10.11968/tsyqb.1003-6938.2016092
Abstract As an important part of big data, visual big data resources have a high degree of field dependence on the mechanism and the law of the conversion. This article from the digital library mobile visual search engine field dependence analysis, using the modular design of the business process, based on this, puts forward the adaptive evolution of digital library can be a domain oriented, and mobile visual search engine. Finally, the function modules of the engine are analyzed, and the characteristics of the adaptive and the evolution of the engine are discussed.
Key words mobile visual search; digital library; search engine; field oriented
1 引言
隨著互聯(lián)網(wǎng)和信息檢索技術(shù)的飛速發(fā)展,文本、圖像和視頻等不同類型的視覺資源及關(guān)聯(lián)信息(如評(píng)論、描述、用戶行為等信息)更加緊密的融合起來,以一種全新的形式來描述視覺資源之間的語義、主題和事件,并逐漸成為各類數(shù)字圖書館重要的信息載體及各種信息搜索引擎、系統(tǒng)與平臺(tái)的重點(diǎn)處理對(duì)象。據(jù)IDC于2012年發(fā)布的報(bào)告顯示預(yù)計(jì)到2020年,全球數(shù)據(jù)總量將超過40ZB(約4萬億GB),其中75%來自于互聯(lián)網(wǎng)環(huán)境,數(shù)據(jù)類型主要是文本、圖像與音視頻等。面對(duì)如此龐大的視覺資源,如何對(duì)其進(jìn)行有效的組織、描述、表達(dá)與處理,使用戶能夠便捷地找到最有價(jià)值的信息,自然就成為信息檢索、數(shù)字圖書館等領(lǐng)域亟待解決的前沿問題。
視覺資源的價(jià)值發(fā)現(xiàn)需求與語義檢索、移動(dòng)互聯(lián)網(wǎng)技術(shù)的跨界融合有效推動(dòng)了移動(dòng)視覺搜索理論、模型與技術(shù)的發(fā)展。而移動(dòng)智能終端、移動(dòng)互聯(lián)網(wǎng)及移動(dòng)應(yīng)用等軟硬件條件的迅速發(fā)展,也為視覺搜索從PC端向移動(dòng)終端發(fā)展提供了軟硬件支持[1]。……