李默

摘 要:[目的/意義]大數據時代智慧圖書館用戶需要精確智能的檢索工具,而移動視覺搜索技術能夠滿足用戶以視覺資源數據為中心的檢索需求。[方法/過程]文章在分析國內外基于深度學習的視覺資源識別技術的研究基礎之上,構建了基于深度學習的智慧圖書館移動視覺搜索服務模式模型,并設計了模型的工作流程,最后對基于深度學習的智慧圖書館移動視覺搜索系統的發展趨勢進行了展望。[結果/結論]將深度學習融入智慧圖書館移動視覺搜索系統中,可以整合多源異構視覺數據、貼合用戶個性化偏好以及提高移動視覺搜索系統性能。
關鍵詞:智慧圖書館;移動視覺搜索;深度學習;服務模式;卷積神經網絡;循環神經網絡
DOI:10.3969/j.issn.1008-0821.2019.05.012
〔中圖分類號〕G250.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2019)05-0089-08
Abstract:[Purpose/Significance]In the era of big data,smart library users need precise and intelligent retrieval tools.Mobile visual search technology can meet users search requirements centered on visual resource data.In recent years,deep learning technology has made breakthroughs in many research fields.[Method/Process]Based on the analysis of the deep learning based visual resource recognition technology at home and abroad,this paper constructed a mobile visual search service model of smart library based on deep learning,and designed the workflow of the model.Finally,the future development trend of deep learning based mobile visual search system of smart library was forecasted.[Result/Conclusion]Applying deep learning technologies into the smart library mobile visual search system,it can integrate multi-source heterogeneous visual data,fit users personalized preferences and improve visual search system performance.
Key words:smart library;mobile visual search;deep learning;service model;convolution neural network;recurrent neural network
隨著人工智能、大數據、云計算、移動互聯網等新興技術的不斷發展和廣泛應用,以文獻借閱為中心的圖書館傳統館藏服務模式逐漸向以滿足讀者個性化需求為中心的智慧型知識服務模式轉變。智慧圖書館利用智能化、網絡化、數字化的信息技術,為讀者提供立體互聯、無線泛在、節能高效的智慧型知識服務,是未來圖書館發展的新模式[1]。智慧圖書館提供的信息資源也不再僅僅局限于文本形式的數據,而是包括了圖像、視頻、3D模型等在內的多種視覺載體類型,以文本搜索為主的信息資源獲取方式已經不適用于視覺資源的檢索利用。而移動視覺搜索(Mobile Visual Search,MVS)技術利用移動智能終端獲取的圖像、視頻、3D模型等視覺資源作為檢索對象,并通過移動互聯網在視覺資源知識庫檢索其關聯信息資源,可以幫助讀者從海量視覺資源數據中快速有效地找到其感興趣的關聯知識信息[2]。因此,MVS能夠適應智慧圖書館多種類型數字資源的檢索服務要求,為讀者提供個性化的知識需求。
現有MVS系統中使用的檢索方法大致可以分為兩類,即基于文本和基于視覺資源內容兩種方法。其中,基于文本的檢索方法是將讀者的檢索關鍵詞與視覺資源知識庫中對應視覺資源的文本描述信息進行相似度比對,將相似度較高的視覺資源信息返回給讀者,但這種方法會由于視覺資源標簽標注的不準確導致檢索結果的準確率比較低;基于視覺資源內容的檢索方法是對讀者提供的檢索對象進行分析,提取檢索對象的內容特征,包括低級特征(如紋理、形狀、顏色等)和高級特征(如分層梯度方向直方圖、顏色和邊緣方向特征、尺度不變特征變換等),檢索時計算檢索對象的內容特征與視覺資源知識庫中已有視覺資源內容特征的相似度,檢索結果按相似度排序并提供給讀者,然而這種檢索方法受外界因素的影響比較大,在視覺資源采集環境或拍攝設備發生變化時檢索結果也會發生很大的變動。近年來,隨著深度學習在語音識別、圖像識別、個性化推薦、自然語言理解等領域的突破性進展[3],為MVS的研究帶來了新的機遇。綜上,為了提高MVS的準確度和魯棒性,本文提出一種基于深度學習的智慧圖書館MVS服務模式,利用深度學習技術提取視覺資源內容特征和讀者個性化特征,降低外部因素對檢索結果的影響程度,提高讀者的MVS服務滿意度。
1 相關研究
自2009年David M Chen等[4]在首屆MVS研討會首次提出MVS概念以來,國內外研究機構和學者對MVS技術及其應用進行了研究,取得了一些顯著成果。MVS的應用已經出現在了電子商務、移動識別、地標搜索、印刷品查詢等領域,Google、亞馬遜、淘寶、京東等公司也都開展了應用嘗試,建立了具有代表性的MVS應用系統,提升了用戶在移動網絡環境下的搜索體驗。而智慧圖書館的興起和發展為MVS在圖書情報領域的應用開拓了新的研究方向,引起了許多學者的關注。張興旺等較早地對MVS在數字圖書館的應用進行了研究,分析了數字圖書館MVS機制的內涵、分類及架構設計[2],設計了數字圖書館MVS的基本流程、服務模式和服務框架[5],并提出了一種領域導向的、自適應的、可演化的數字圖書館MVS引擎[6];曾子明等則在智慧圖書館MVS研究方面開展了一系列工作,構建了智慧圖書館MVS服務模型及技術框架[7],提出了基于SoLoMo的智慧圖書館移動視覺搜索服務模式[8],設計了去中心化的智慧圖書館MVS管理體系[9]。另外,李晨暉等[10]對基于大數據的文化遺產數字圖書館MVS機制建設進行了研究;韓璽等研究了基于語義關聯的圖書館MVS資源多維度聚合模型及其實現流程[11],并提出了基于MVS的圖書館、檔案館、博物館資源融合服務模式[12];孫翌等[13]以李政道圖書館特藏陳展服務為例,闡述了MVS技術在特色資源陳展服務中的各項應用功能;鐘志鵬等[14]開發了一個基于MVS技術的博物館導覽系統。上述研究拓展了MVS在數字人文領域的應用實踐,但作為一個新的研究方向和應用領域,智慧圖書館對MVS技術提出了更高的要求,比如,在視覺特征提取、語義分析與匹配、視覺資源個性化推薦等方面還有許多問題有待研究。
在移動終端計算資源有限的情況下,如何增強智慧圖書館MVS系統的魯棒性和準確性,減少讀者等待時間,是衡量MVS服務質量高低的核心問題。而深度學習具有組合低層特征形成高層語義抽象的能力,可以自動發現視覺數據的分布式特征表示,對提高MVS智能化水平具有重要意義。深度學習起源于人工神經網絡,但由于受到梯度彌散問題和硬件資源的限制,神經網絡的研究一直徘徊不前。2006年Geoffrey E Hinton等[15]提出了訓練深層神經網絡的基本原則方法,降低了深度神經網絡的優化難度。近年來,隨著計算能力的提升和訓練數據集的增長,深度學習在人工智能多個研究領域都有了長足的發展。在圖像識別領域,Krizhevsky A等[16]在2012年首次將卷積神經網絡應用于大規模數據集ImageNet中,大幅降低了圖像識別的錯誤率,而在2016年的ImageNet圖像分類競賽中,深度學習的圖像識別準確率更是超過了97%;在視頻識別領域,Wang W等[17]提出了一種基于全卷積神經網絡的視頻目標檢測算法,設計了用于獲取時間信息的動態神經網絡和獲取空間信息的靜態神經網絡,利用仿真生成的視頻訓練數據獲得了視頻的時間和空間特征;在3D模型識別領域,Han Z等[18-19]首先設計了一種圓形卷積受限玻爾茲曼機,用來學習3D模型局部區域的幾何結構信息,然后又研究了一種Mesh卷積受限玻爾茲曼機,實現了3D模型的無監督特征學習。目前應用于視覺資源識別領域的深度學習模型主要包括:玻爾茲曼機、卷積神經網絡、深度信念網絡、自編碼器和循環神經網絡等。
深度學習可以對輸入數據按層次進行抽象,獲取數據的深層次表示特征,并通過對多源異構數據的自動特征學習,將不同數據在最初空間的表征映射到一個相同的隱空間,從而獲得數據的統一表征[20]。因此將深度學習引入到智慧圖書館MVS系統中,能夠對多源異構視覺數據進行有效地特征提取和分類操作,并通過構建相適應的服務模式提高智慧圖書館視覺資源的利用率,為讀者提供以視覺資源為中心的個性化知識體系。
2 基于深度學習的智慧圖書館MVS服務模式
基于深度學習的智慧圖書館MVS系統將用戶的視覺檢索對象作為輸入數據,利用深度學習模型提取智慧圖書館各類學術資源特征,通過融入用戶情境信息和反饋數據,實現個性、準確、交互的智慧圖書館MVS服務。一個基本的服務模式模型如圖1所示,由系統離線學習和用戶在線檢索兩個階段組成。
2.1 系統離線學習階段
在系統離線學習階段,主要是為整個搜索系統做好數據準備工作,包括提取視覺資源庫中的數據特征、分析文本資源庫中的文本語義、計算情境數據庫中的情境信息以及獲取用戶知識庫中的個性化需求特征。其中,視覺資源庫用于存儲從互聯網采集的圖像、視頻、3D模型等視覺資源,將視覺資源內容以文件形式存儲在分布式集群上,并將視覺資源文本描述信息存儲在關系數據庫中,同時為深度學習模型提供必需的訓練數據集;文本資源庫主要用來存儲智慧圖書館中的學術文本數據,在對文本資源數據進行清洗后存儲在分布式數據庫中,并實現異構數據源文本數據的規范統一;情境信息庫采用分布式表示技術存儲與用戶相關的情境信息,包括用戶的檢索時間、地理位置、網絡環境、移動終端類型等數據,為基于深度學習的用戶情境計算模型提供數據支持。
特征提取模塊利用深度神經網絡來提取視覺資源特征,而深度視覺資源特征是從大規模視覺數據中自動學習獲得的,并將視覺資源的特征提取和識別分類任務融合到一個模型中進行,其功能在系統離線學習階段和用戶在線檢索階段共享。本文采用卷積神經網絡和循環神經網絡處理視覺資源數據,對于2D圖像數據直接將圖像作為網絡輸入進行特征提取計算,對于視頻數據則提取視頻中的時態和空間特征,而對于3D模型數據則將模型的投影視圖和體素作為神經網絡的輸入。卷積神經網絡避免了傳統圖像處理算法中復雜的特征提取融合過程,而且可以減少深度神經網絡模型中的神經元和參數數量,提高了單位時間內的計算能力,它一般由輸入層、卷積層、池化層、全連接層和輸出層組成。循環神經網絡能夠建模序列數據中不同時刻數據之間的依賴關系,它將網絡內部節點定向連接成環,通過自連接的方式實現序列數據信息的記憶與傳遞,對于處理序列數據建模能力強大且非常有效,一個循環單元由輸入層、循環隱層和輸出層組成,但是普通的循環神經網絡存在梯度消失問題,Hocheriter S等[21]提出的長短時記憶網絡增加了保存長期狀態的隱層單元,可以更有效地對長程依賴關系進行建模。視覺資源特征提取模塊具體流程和功能實現將在本文第三部分進行闡述。
語義分析模塊則使用卷積神經網絡對文本信息進行處理,首先通過卷積層對文本中的局部信息進行建模,得到若干個特征映射面,然后池化層從每一個特征映射面中選擇固定數目的節點,將文本表示為固定長度的向量,經過多個卷積層和池化層后,最終會得到表示文本語義信息的輸出向量,而且隨著網絡深度的增加,可以捕捉到更加全面的文本語義信息和特征。情境計算模塊結合卷積神經網絡和循環神經網絡來進行情境信息的識別計算,首先基于卷積神經網絡學習情景數據的隱情境表示,然后將隱情境表示特征輸入到循環神經網絡中,得到隱情境表示的狀態分類類別概率,最后融合隱情境表示和清晰的情境信息得到用戶的情境模型。關聯挖掘模塊是在對智慧圖書館數據資源進行特征提取和語義分析的基礎上,實現視覺資源與文本資源之間的語義關聯,并采用倒排索引標注關聯后的視覺資源,方便MVS過程中快速定位視覺資源信息。
行為分析模塊通過分析用戶的操作記錄提取用戶特征,將用戶的檢索、瀏覽、下載等歷史記錄作為深度學習模型的輸入,通過模型學習得到用戶的隱表示。評價反饋模塊則是將收集的用戶評價信息作為輸入,利用深度學習模型學習用戶的隱表示,并利用損失函數構建目標優化函數優化深度學習模型的參數。在獲得用戶特征隱表示的基礎上,結合用戶的年齡、職業、學歷、性別、社會關系等個人信息,構建用戶個性化知識模型并存儲在用戶模型庫中。需求抽取模塊從用戶模型庫中提取出檢索用戶的個性化需求模型,構建用戶個性化信息向量,為MVS檢索結果排序計算提供輸入數據。
2.2 用戶在線檢索階段
用戶在使用MVS系統進行視覺資源檢索時,需要將自己的檢索意圖通過具體的視覺檢索表達方式提交給MVS系統,良好明確的表達方式可以有效降低檢索的難度,獲得滿意的檢索結果。根據視覺資源的不同類型,檢索表達的構成方式可以分為基于圖像檢索、基于視頻檢索和基于3D模型檢索等,將不同的檢索表達構成方式存儲于視覺檢索對象庫中,根據待檢索視覺對象數據類型采用不同的檢索表達方式。
結果展示模塊的功能是將檢索結果提供給用戶瀏覽,首先按照主題對檢索到的視覺資源進行分類和關聯,然后根據移動終端類型和網絡狀況為用戶展示以視覺資源為中心的知識架構和知識圖譜,方便用戶查找自己感興趣的視覺資源知識信息。另外,結果展示模塊還包括用戶信息管理功能,用戶具有編輯個人信息、設置視覺資源興趣標簽、填寫評價反饋意見等權限,為用戶模型庫的建立和完善提供數據支持。
3 智慧圖書館MVS深度學習神經網絡工作流程
在實現智慧圖書館MVS服務模式各功能模塊的設定后,本文提出的智慧圖書館MVS深度學習神經網絡工作流程主要分為4個子流程,分別是數據獲取及數據預處理子流程、生成用戶特征向量和視覺檢索數據圖集子流程、深度學習訓練網絡輸出視覺單詞向量子流程、計算相似度得到視覺檢索推薦列表子流程,如圖2所示。
3.1 數據獲取及數據預處理
圖書館MVS服務平臺首先獲取檢索所需的相關數據,包括視覺檢索數據和用戶歷史行為數據,其中,視覺檢索數據用于生成視覺檢索數據圖集,用戶歷史行為數據則用于生成用戶特征向量。數據預處理主要是對數據進行清洗,檢查數據的一致性,過濾掉視覺檢索數據收集過程中產生的干擾信息,并將視覺檢索數據從模擬信號的形式轉化為連續性的函數形式,然后整理數據,獲取每個用戶的ID信息,生成用戶索引和視覺檢索數據索引。
3.2 生成用戶特征向量和視覺檢索數據圖集
首先統計用戶的有效點擊行為信息,然后搭建并訓練深度學習神經網絡模型,將用戶的檢索行為記錄作為模型輸入得到用戶的分布式特征向量表示,用于描述用戶的特征信息,計算得到的用戶特征向量是低維且非稀疏的,便于以此作為視覺檢索推薦的數據依據。而對于視覺檢索數據則根據數據類型進行不同處理,圖像類數據獲取其精確圖片語義文本對,將圖片語義文本切詞后得到每個詞的詞向量,為每個圖片匹配其準確的語義文本表示;視頻類數據通過鏡頭分割、關鍵幀提取、鏡頭聚類3步獲得其視頻圖像集,其中,鏡頭分割采用x2直方圖法和梯度法對視頻鏡頭的切換和淡入淡出進行檢測,關鍵幀提取則使用非相鄰幀比較算法來計算,其思想是將鏡頭的第一幀作為參考幀,然后計算后續幀和當前參考幀的差值,當差值大于預定閾值時則將當前幀替換為關鍵幀,鏡頭聚類則將歸為一類的鏡頭集作為場景,完成對視頻的場景劃分,最終得到視頻的場景圖像集;對于3D模型類數據首先將模型進行體素化,然后采用旋轉、尺度變化、水平翻轉、隨機摳取等方法對3D模型進行數據擴充,得到相應倍數的3D模型體素圖像數據集。總之,使用處理后的圖像集作為深度學習訓練網絡的輸入,有利于視覺檢索數據特征的學習和訓練分類。
3.3 深度學習神經網絡訓練生成視覺單詞向量
該子流程的功能是從視覺數據圖像集中提取各種類型視覺數據的特征向量并進行識別。對于圖像類數據利用卷積神經網絡作為視覺模型,首先準備圖像的深度學習訓練集,根據圖片語義文本內容對建立的卷積神經網絡進行訓練得到圖像分類模型,然后利用訓練好的模型對測試集中的圖像進行特征提取,將圖像像素向量{x1,1,x1,2,…,xm,n}作為卷積神經網絡的輸入數據,xi,j表示尺寸為m*n圖像中第i行第j列的像素值,在對輸入圖像做卷積運算得到卷積特征圖像后,再對卷積特征圖像作最大池采樣獲得池化后的特征圖像,如果下一層為卷積層則繼續進行卷積計算,否則執行全連接運算,最后經過全連接層計算得到圖像特征輸出。然而通過上述方法提取的圖像特征有數千維,為了挖掘有意義的特征數據還需要對數據進行降維,可以采用訓練后的棧式自編碼器進行圖像特征的降維運算,最終得到圖像的向量化表示。
視頻圖像集則首先使用卷積神經網絡提取其人物、動作和上下文環境3個通道的特征向量圖,卷積神經網絡采用多層串聯結構,上一層的輸出作為下一層的輸入,其參數值在訓練過程識別率穩定后即為最終的參數,各個卷積神經網絡層都包括若干個卷積層和池化層,卷積層對輸入的視頻圖像集進行卷積,池化層對卷積后的二維矩陣執行池化操作,激活函數采用線性糾正函數ReLU,并對池化后的輸出值進行歸一化,使得卷積神經網絡的訓練速度加快并且保持每次迭代網絡參數的正態分布;循環神經網絡也是由多層網絡順序連接構成的,并加入長短期記憶網絡單元,以使循環神經網絡可以選擇記憶多段時間序列之前的內容,其計算過程如下:首先將基于卷積神經網絡提取出來的人物、動作和上下文環境語義特征作為輸入,經過第一層長短期記憶網絡編碼后得到固定長度的輸出向量,然后把第一層的輸出向量作為第二層長短期記憶網絡的輸入,運用Softmax函數計算每一個語義在語義集上的概率分布,最終得到視頻圖像集的向量化語義描述。
3D模型體素圖像數據集則采用3D卷積神經網絡進行特征提取,相比于應用于2D圖像的卷積神經網絡,3D卷積神經網絡將對3D數據進行卷積計算并輸出另外一個3D數據。該網絡結構由卷積層、池化層、整合層、全連接層和分類層組成,在卷積層,3D模型體素化分辨率用di表示,用i表示輸入層數,則網絡輸入是大小為di*di*di的體素數據,隨機生成歸一化的卷積核矩陣W,卷積核大小為ei*ei*ei,則第k層卷積層特征圖對應的卷積核為wkiPei*ei*ei,第k層特征圖可以由計算公式Fki=h(wkix+b),其中,表示卷積運算,h(·)是非線性激活函數,x為輸入3D模型的體素化表示,b為偏置。在池化層,采用最大值池化操作,用Pki表示第k個池化特征圖,則Pki=max(Fki+b),max(·)為取最大值操作。整合層將卷積層和池化層提取的特征圖進行向量化,即把多維向量變為一維列向量。全連接層將整合層得到的特征向量作為輸入,經過全連接后可以將3D模型的特征表示映射到樣本標記空間中。最后,使用Softmax分類層將多分類的輸出數值轉化為相對概率,得到3D模型的特征向量。
3.4 得到視覺資源檢索推薦列表
在完成深度學習神經網絡模型的訓練之后,便可以將檢索用戶特征向量和目標視覺資源單詞向量信息輸入到深度學習神經網絡模型中,通過訓練好的深度學習神經網絡模型得到用戶對目標視覺資源的預測評分值,最后按照評分值的大小順序進行排列,將評分較高的前N個視覺資源信息生成推薦列表并推送給檢索用戶。
4 基于深度學習的智慧圖書館MVS研究展望
隨著大數據和人工智能技術的不斷發展,深度學習在智慧圖書館中的應用也越來越受到重視,但目前基于深度學習的智慧圖書館MVS系統研究仍處于起步階段,而在未來必將會有更深入的探討和應用,以下總結了3個可能的研究方向。
4.1 基于深度學習的智慧圖書館MVS跨平臺信息融合問題
智慧圖書館MVS系統數據獲取能力的不斷提升,使得用戶和視覺數據在不同平臺的信息能夠越來越方便的獲取,融合用戶和視覺數據在不同平臺的信息可以有效克服單一平臺信息的不足,更好地發現用戶的個性化偏好,為用戶提供更為準確的視覺資源檢索推薦列表。利用深度學習技術,將各類視覺資源數據進行統一輸入,構建有效融合各種類型、跨平臺異構視覺數據的深度學習訓練網絡模型,以實現跨平臺信息融合的智慧圖書館MVS服務將是重要研究方向之一。
4.2 基于深度學習的智慧圖書館MVS系統優化問題
首先,對于智慧圖書館MVS系統來說,面向不同的用戶和場景時采用統一的深度學習網絡架構和計算參數是不可能的,需要根據不同的目標任務構建新的深度學習框架來提供MVS服務。其次,還需要積極拓展視覺數據特征提取的語義線索,充分利用和融合視覺數據中的音頻、標簽、評論等固有信息,通過建模更多視覺數據信息提升深度學習MVS系統的語義識別能力。再次,智慧圖書館MVS系統移動端功能也需要進一步的完善,努力實現移動端視覺信息采集、實時傳輸、深度學習訓練及檢索反饋的MVS服務全過程,使用戶在任何場景下都可以使用智慧圖書館MVS系統進行視覺數據檢索。
4.3 基于深度學習的智慧圖書館MVS自動進化問題
隨著深度學習模型的不斷發展,其能力將遠遠超過對輸入數據進行簡單的連續幾何變換,而是具有豐富的算法特性和更強的泛化能力,既能實現正式的推理、搜索和抽象功能,又能提供非正式的直覺和模式識別能力。智慧圖書館MVS系統的功能模塊可以通過復用全局庫(通過在先前任務和數據集上學習高性能模型得到)中的模塊化部件,實現MVS功能的自動進化,而不需要人工強干預,并且隨著MVS系統對經常出現問題解決模式的識別,這些模式將被轉化為可復用的子程序并添加到全局庫中,最終達到智慧圖書館MVS系統具有永久學習能力的目標也需要進一步的研究。
5 結束語
大規模視覺數據的搜索問題是衡量智慧圖書館MVS服務是否滿足用戶需求的一個重要問題,而且用戶進行MVS時往往都是在線完成的,因此快速準確響應用戶的MVS服務請求是智慧圖書館MVS系統必需具備的能力。近年來,深度學習技術在圖像處理、語音識別和動態數據特征提取等領域取得了突出成就,但是基于深度學習的智慧圖書館MVS系統的研究還處于探索階段。本文在分析深度學習技術和圖書館MVS系統研究現狀的基礎上,設計了基于深度學習的智慧圖書館MVS服務模式及其工作流程,并對深度學習技術在智慧圖書館MVS系統中的應用趨勢進行了展望,以期為用戶提供更加優質的MVS服務,滿足用戶的個性化知識需求。
參考文獻
[1]王世偉.未來圖書館的新模式——智慧圖書館[J].圖書館建設,2011,(12):1-5.
[2]張興旺,李晨暉.數字圖書館移動視覺搜索機制建設的若干關鍵問題[J].圖書情報工作,2015,59(15):42-48.
[3]Lecun Y,Bengio Y,Hinton G.Deep Learning[J].Nature,2015,521(7553):436-444.
[4]David M.Chen,Sam S.Tsai,Vijay Chandrasekhar,et al.Tree Histogram Coding for Mobile Image Matching[C]//Proceedings of the 2009 Data Compression Conference,IEEE,2009:143-152.
[5]劉喜球,張興旺.移動視覺搜索:“互聯網+”時代數字圖書館信息檢索新模式[J].情報理論與實踐,2016,39(5):58-63.
[6]張興旺,鄭聰.領域導向的數字圖書館移動視覺搜索引擎建設研究[J].圖書與情報,2016,(5):40-47.
[7]曾子明,秦思琪.智慧圖書館移動視覺搜索服務及其技術框架研究[J].情報資料工作,2017,(4):61-67.
[8]曾子明,宋揚揚.基于SoLoMo的智慧圖書館移動視覺搜索服務研究[J].圖書館,2017,(7):92-98.
[9]曾子明,秦思琪.去中心化的智慧圖書館移動視覺搜索管理體系[J].情報科學,2018,36(1):11-15,60.
[10]李晨暉,張興旺,秦曉珠.基于大數據的文化遺產數字圖書館移動視覺搜索機制建設研究[J].情報理論與實踐,2018,41(4):139-144,133.
[11]韓璽,何秀美,張玥,等.基于語義關聯的圖書館移動視覺搜索資源與服務聚合研究[J].現代情報,2017,37(10):3-7,22.
[12]韓璽,張玥,朱慶華.基于移動視覺搜索的圖書館、檔案館、博物館資源融合服務模式研究[J].情報資料工作,2018,(2):63-70.
[13]孫翌,周鋒,張浩.移動視覺搜索在特色資源服務中的應用實踐[J].現代情報,2017,37(9):107-113.
[14]鐘志鵬,王涌天,陳靖,等.一個基于移動視覺搜索技術的博物館導覽系統[J].計算機輔助設計與圖形學學報,2012,24(4):555-562.
[15]Geoffrey E.Hinton,Simon Osindero,Yee-Whye Teh.A fast Learning Algorithm for Deep Belief Nets[J].Neural Computation,2006,18(7):1527-1554.
[16]Krizhevsky A,Sutskever I,Hinton G E.ImageNet Classification with Deep Convolutional Neural Networks[C]//International Conference on Neural Information Processing Systems.Curran Associates Inc,2012:1097-1105.
[17]Wang W,Shen J,Shao L.Video Salient Object Detection Via Fully Convolutional Networks[J].IEEE Transactions on Image Processing,2017,27(1):38-49.
[18]Han Z,Liu Z,Han J,et al.Unsupervised 3D Local Feature Learning By Circle Convolutional Restricted Boltzmann Machine[J].IEEE Trans Image Process,2016,25(11):5331-5344.
[19]Han Z,Liu Z,Han J,et al.Mesh Convolutional Restricted Boltzmann Machines for Unsupervised Learning of Features with Structure Preservation on 3-D Meshes[J].IEEE Transactions on Neural Networks & Learning Systems,2017,28(10):2268-2281.
[20]Peng Y X,Zhu W W,Zhao Y,et al.Cross-media Analysis and Reasoning:Advances and Directions[J].Frontiers of Information Technology & Electronic Engineering,2017,18(1):44-57.
[21]Hochreiter S,Schmidhuber J.Long Short-term Memory[J].Neural Computation,1997,9(8):1735-1780.
(責任編輯:郭沫含)