周力恒 金陽 康軼澤 王彬 趙連啟



摘 要:隨著智能移動終端的普及,以其便捷性、便攜性、實時性等特點,顛覆了傳統PC電子商務模式。移動電子商務成為了電子商務發展的未來趨勢,以其空前無限生命力推動著部門經濟、區域經濟、國民經濟和世界經濟躍上了一個新的臺階。隨著移動電子商務在全球迅速普及,并形成爆炸性增長,購物搜索將成為互聯網搜索中的重要分支。基于圖像搜索的購物方式,或利用拍照后直接搜索呈現出拍照商品的方式,將更高效、更便捷地獲取到目標商品,帶來了全新的搜索模式,極佳的用戶體驗。
關鍵詞:圖形圖像搜索 以圖搜圖 移動電子商務
中圖分類號:G350 文獻標識碼:A 文章編號:1674-098X(2016)04(a)-0090-04
1 基于移動電子商務的圖形圖像搜索
移動電子商務,移動設備輕便易攜、碎片化、娛樂化特征明顯,可隨時隨地滿足用戶的即時性消費需求,由此,移動終端日漸成為用戶網上購物的重要選擇。同時,移動購物和生活場景相互交融,偶發性和沖動型消費快速滋長,電商情境化趨勢日益彰顯;另一方面,智能移動終端對音頻、視頻、圖像等各類信息采集方便,以圖片為例,其中適合圖像搜索的圖片為20%,假設0.5%人次成功轉移,1%平均購買轉化率,平均購物單價為200元,如,按平均10%的傭金計算,那么一年產業規模也超過220億元。加上其他收入,比如:廣告、手機搜索等,總體市場規模不低于600億元。
隨著移動電子商務日益興起,圖形圖像搜索已能為客戶帶來全新的用戶體驗。在購物領域,非常典型的就是服裝服飾等非標類產品,占到整個電子商務的55%市場份額。淘寶用戶只要看到了目標商品,就可以使用圖片搜索功能對比同款產品的市場價格,也能找到更多相似款。這是移動電子商務能帶來的極致便捷體驗。圖形圖像搜索技術一直受到巨頭們的青睞,百度為深入研究“深度學習”算法,特地設立了IDL(Institute of Deep Learning)研究院。谷歌更是在短短幾年內,陸續收購了七八家涉足圖像識別的技術公司,并試圖以谷歌眼鏡搶占智能移動終端的場景入口。圖圖搜利用微信公眾號,以微信拍照購物搜索功能,率先成為第一家接入微信的圖像搜索引擎網站。谷歌、騰訊、百度等大公司也都在圖片搜索領域有資源投入,為圖片購物搜索發展帶來了壓力的同時,更為市場帶來了各大圖像技術競相追逐的動力。
2 典型應用舉例
2.1 手機購物網站相似商品搜索
可以是用戶上傳圖片搜索,也可以是站內圖片點擊搜索。(如圖1所示)
2.2 移動拍照購物
隨手拍照—— 準確搜到相關商品。(如圖2所示)
2.3 區域搜索
給定一張時尚或明星圖片,根據自主的圖片選定區域,能夠識別與圖片選定區域內容相似的其他商品圖片,然后根據相似度排序。(如圖3所示)
3 關鍵技術總結
3.1 圖像搜索系統結構
基于移動電子商務的圖形圖像搜索技術,通常的做法包括IEEE的標準,都是用圖像特征值來實現的。搜索引擎將目標圖片進行特征提取,形成一組特征描述或特征向量。當用戶搜索時,將查詢圖像的特征描述與數據庫中其他圖像的特征描述進行自動匹配,并返回匹配結果。(如圖4所示)
3.2 核心技術
上述圖像搜索系統的技術核心就是對圖像特征的提取,特征提取是計算機視覺和圖像處理中的一個概念。它指的是使用計算機提取圖像信息,決定每個圖像的點是否屬于一個圖像特征。特征被檢測后它可以從圖像中被抽取出來,這個過程可能需要許多圖像處理的計算機,其結果被稱為特征描述或者特征向量。
常用的圖像特征有顏色(Color)、紋理(Texture)、形狀(Shape)、空間(Space)關系等。
(1)顏色特征:顏色特征是一種全局特征,描述了圖像或圖像區域所對應的景物的表面性質。一般顏色特征是基于像素點的特征,此時所有屬于圖像或圖像區域的像素都有各自的貢獻。顏色直方圖是最常用的表達顏色特征的方法,其優點是不受圖像旋轉和平移變化的影響,進一步借助歸一化還可不受圖像尺度變化的影響,其缺點是沒有表達出顏色空間分布的信息。此外,顏色特征提取還有顏色集、顏色矩、顏色聚合向量、顏色相關圖等方法。
(2)紋理特征:紋理特征也是一種全局特征,它與顏色特征不同,紋理特征不是基于像素點的特征,它需要在包含多個像素點的區域中進行統計計算。在模式匹配中,這種區域性的特征具有較大的優越性,不會由于局部的偏差而無法匹配成功。在檢索具有粗細、疏密等方面較大差別的紋理圖像時,利用紋理特征是一種有效的方法。常用的紋理特征提取與匹配方法有灰度共生矩陣、Voronio棋盤格特征法和結構法、隨機場模型法、Tamura紋理特征、自回歸紋理模型、小波變換等。
(3)形狀特征:各種基于形狀特征的檢索方法都可以比較有效地利用圖像中感興趣的目標來進行檢索。通常情況下,形狀特征有兩類表示方法:一類是輪廓特征;另一類是區域特征。圖像的輪廓特征主要針對物體的外邊界,而圖像的區域特征則關系到整個形狀區域。典型的形狀特征描述方法有傅里葉形狀描述符法、Hough變換檢測平行直線方法、有限元法(Finite Element Method或FEM)、旋轉函數(Turning)和小波描述符(Wavelet Deor)等方法。
(4)空間關系特征:所謂空間關系,是指圖像中分割出來的多個目標之間的相互的空間位置或相對方向關系,這些關系也可分為連接/鄰接關系、交疊/重疊關系和包含/包容關系等,空間關系特征的使用可加強對圖像內容的描述區分能力。提取圖像空間關系特征可以有兩種方法:一種方法是首先對圖像進行自動分割,劃分出圖像中所包含的對象或顏色區域,然后根據這些區域提取圖像特征;另一種方法則簡單地將圖像均勻地劃分為若干規則子塊,然后對每個圖像子塊提取特征。
自從Hinton在2012年將深度卷積神經網絡(CNN)帶入到圖像分類領域后,深度學習在圖像處理相關領域的研究一下子變得異常火熱起來。基于深度學習原理的圖像檢索,更多的是從一種圖像理解的角度來進行的,得到的是一種更加抽象的描述,也可以理解為“語義”,它更多的是在解釋這個圖像描繪的是什么物體或者什么場景之類的。這種仿照人腦的識別過程而設計的深度神經網絡能夠自動提取圖片中的語義信息,彌補了其他傳統算法在這方面的不足。(如圖5所示)
3.3 應用集成設計
應用集成設計如圖6所示。
3.4 系統關鍵技術指標
(1)該平臺表現出良好的用戶服務支持能力。經系統實際運行測試,目前平臺已入駐企業近萬家,平臺運行平穩,響應速度快,具有良好的用戶體驗。(2)項目自上線以來,該平臺運行平穩,在高性能單服務器上支持并發搜索5 000以上。(3)擁有的圖像算法,搜索結果效率高,核心算法庫搜索響應速度<1 s。(4)高效的海量數據檢索,準確的復雜場景提取,兼容對多元化信息數據,平均提取海量數據響應速度<1 s。(5)可視化索引技術,采用高度并行的多核心圖形處理單元(Graphics Processing Unit),模仿人腦細胞進行并行高速特征提取和目標分類,搜索準確率高達98%以上。(6)通過基于云的信息架構和數據管理模型來取代傳統模型,動態擴展服務集群時間<1 s。(7)通過這個基于云的數據存儲模式,節點間的信息共享和信息整合變得更加有效。支持TB級數據存儲。目前可視化商品搜索數據庫,收錄產品百萬以上。
4 產業機遇與面臨問題
圖像搜索,可以簡單地認為是“以圖搜圖”,但又不只是圖像識別這么簡單。如果把圖像搜索等同于圖片識別,它并不算什么高超的技術,不同領域的圖像識別技術已經趨于成熟。識別只是圖像搜索的第一步,第二步是理解,第三步是檢索,每一步都存在著技術難點。在移動互聯網時代,圖片已逐漸替代文字成為了移動終端的主要信息載體,圖形圖像搜索以圖搜圖的產品特點,天然貫通了移動終端到電子商務平臺圖片信息傳遞的過程,利用圖像搜索服務來引導移動電子商務消費已成為趨勢。
5 圖形圖像搜索的發展方向
在移動電子商務領域內,對比其他搜索產品,將對以下三點技術指標進行重點研究和提升:(1)實現“所見即所得”,讓圖像搜索由被動到主動;(2)實現動態圖像搜索,手機網絡視頻購物;(3)實現移動場景下對“線下實體”的搜索,成為用戶的第三只眼。
參考文獻
[1]余飛.基于HTML5的圖形圖像協同處理技術研究與實現[D].長江大學,2015.
[2]陳微微.基于顏色特征提取的圖像搜索引擎研究[D].重慶理工大學,2012.
[3]夏定元.基于內容的圖像檢索通用技術研究及應用[D].華中科技大學,2004.
[4]周力恒.圖像的搜索在電商領域的發展與實現[C]//中國報業協會電子技術工作委員會編.全國報社新聞工作會議暨2015中國報業技術年會論文集.北京:中國報業協會電子技術工作委員會.2015.