
搜索引擎已經出現將近20年了,雖然在這個過程中搜索引擎能提供的內容已經發生了翻天覆地的變化,但主流的搜索方法幾乎沒有任何改變。無論是搜索一家餐館、一個景點還是一個人,打開任何搜索引擎頁面之后,用戶的第一步都是輸入的關鍵詞。
為了簡化輸入,部分搜索引擎已經推出的語音搜索,然后將語音轉化成文字,讓用戶只需要說話就能解決輸入的問題。這一點在移動設備上尤其受歡迎,因為在移動設備上打字比在PC上要困難的多。但究其本質,這依然是基于關鍵詞產生的搜索行為。
但是,很多時候人們在搜索的往往是自己并不知道的東西,比如某種植物、某個景點或者某件服裝,這時候用戶往往很難想出一個合適的關鍵詞。
正是基于這樣的考慮,最擅長利用搜索引擎盈利的谷歌推出了按圖搜索,讓用戶可以上傳圖片進行搜索—這可以說是搜索的一大變革,因為搜索引擎第一次由匹配文字信息變成了匹配圖片的特征。
這項搜索變革,谷歌的中國團隊做出了很大貢獻。谷歌技術總監李鋼江告訴《環球企業家》,按圖搜索的大部分功能都是由谷歌在上海的團隊完成的。如果把谷歌的圖像搜索看成獨立的搜索引擎,它的搜索量排名全球第四,這也說明人們搜索圖片的需求非常大,也需求更好的圖像搜索的方法。
早在2009年,谷歌就推出了相似圖像搜索,可以根據一張圖片尋找出相似的圖片,比如可以通過某位明星的一張照片,找到這位明星的很多其他照片。但是,按圖搜索能做的更多:
—用戶可以上傳一張某個景點的照片,就能發現更多和這個景點有關的信息,比如景點的名稱、介紹等。因為在這個時候,用戶上傳的圖片就是輸入的關鍵詞,谷歌會根據這個關鍵詞給出搜索結果;
—用戶可以搜索一位網上匿名網友的頭像,如果對方用的是網上的圖片而非真實頭像,搜索結果里就會出現大量原圖的信息;
—用戶還可以上傳某件服飾的照片,谷歌會自動判斷用戶搜索的意圖就是希望購買這件服飾,于是搜索結果里會出現大量有這件服飾在售的網站。
其實用戶對按圖搜索這些功能的需求已經存在了很長時間,而且核心算法在李鋼江上大學的時候就已經存在,但真正要投入商用還需要很多調整。在學術上和商用最大的不同在于數據量,在實驗室里,按圖搜索的圖片庫通常只有幾百張圖片,而整個互聯網的圖片有幾百億張,如此大的數量級跨越,就要對算法進行很大的改進。
布林的鼓勵
在發布按圖搜索之前,谷歌已經為此做了大量的準備。在谷歌推出圖像搜索之初,谷歌就已經推出了 Image Label,讓用戶為圖片加上描述;2009年谷歌又對圖像搜索做了很大的改進,包括對圖片按色彩、紋理進行分類、相似圖像搜索等;2010年谷歌又推出了手機應用 Google Goggles,只要給某種具有統一特點的產品拍照就能知道這款產品的信息。
大約一年前,谷歌正式開始按圖搜索的研發。谷歌產品經理李琿表示,啟動這么大的一個項目需要很大的勇氣。圖片的處理比文字處理最大的不同是,圖片包含更多的信息量,因此也需要很大的儲存空間和很強的計算能力。據李鋼江計算,在按圖搜索的算法已經固定的情況下,假定有一千億張圖片,提取一張圖片的特征只要花0.1秒的時間,就算有一千臺服務器不停的算,把這千億張圖片處理完也需要115天。這樣大規模的計算可能只有谷歌才能完成。
對于用戶新上傳用來搜索的圖片,如果這張圖片已經存在于谷歌的圖片庫里,那么谷歌就能馬上給出相應的搜索結果。如果這是用戶新拍的一張照片,那么谷歌就會首先從這張照片上提取成千上萬的特征值,然后將這些特征值和谷歌圖片庫里的照片進行比對,最后返回搜索結果—而且這個過程也會控制在一秒鐘之內。
對計算機來說,要找出相同的圖片并不難,難在要找出相似的圖片,比如經過不同處理的同一張照片或者同一個人的不同照片。如果用戶用一位名人的照片進行搜索,而搜索結果都是這位明星的同一張照片,這對于用戶來說并沒有什么價值。所以谷歌會確保搜索結果第一屏最多只出現三張完全相同的照片,另外都是這位明星的其他照片。尤其對人的搜索,谷歌會提高出現人臉照片的權重,但是如果一張照片上出現了多個人臉,這樣的照片又往往會被降權。
李琿還記得第一次去谷歌總部山景城演示按圖搜索這款產品時的情景。當時谷歌網頁搜索的產品總監 Johanna Wright 直接在現場用自己的一張圖片進行了測試,搜索結果里出現了她的 Facebook 主頁,因為這張照片就是她在 Facebook 上的頭像。另一位高管 Jack Menzel 也嘗試了自己的頭像,同樣得到了滿意的搜索結果?!斑@就像一個里程碑一樣?!崩瞵q事后回憶說。
谷歌上海的工程師黃燕來是一名攝影高手,對攝影有很深的研究。一張照片會因為使用的鏡頭、焦距、曝光時間、光圈等產生完全不同的效果,于是他希望將照片的EXIF參數引入圖像搜索。
經過調查,黃燕來和李琿發現有7%的用戶都希望谷歌增加這個功能。在研究了用戶的搜索關鍵詞后,他們也發現了很多可以用EXIF信息搜索到更準確的圖片的例子,比如用戶搜索夜景圖片的時候就可以選擇光線較暗而非輸入“夜景”—這種對圖片的過濾也更加自然,而且上傳夜景照片到互聯網上的人也不會把每張照片都打上“夜景”的標簽。
當時谷歌已經在圖像搜索結果頁上推出了由中國工程師陳立捷開發的按顏色過濾圖片的功能,谷歌聯合創始人謝爾蓋·布林(Sergey Brin)看到后鼓勵圖像搜索團隊,說“做的很好,這是個很有用的功能”。于是有工程師告訴他谷歌圖像搜索團隊還在開發基于EXIF信息的搜索。但是如果將EXIF信息都添加到圖片的索引庫中,又會增加很大的數據量,當時他們正猶豫是否選擇一部分EXIF參數加入索引庫。布林建議他們開發出真正強大的系統,不用花太多時間挑選這個參數,而是支持任意EXIF參數的搜索?!安剂值脑捊o了中國工程師很大鼓舞?!崩瞵q表示。
對于按圖搜索這款產品,李鋼江和李琿認為就目前的功能而言,已經可以打90分。但是如果從一款完美解決各種圖像搜索問題的產品角度考慮,李鋼江覺得它還不及格?!罢先蛐畔?,使人人皆可訪問并從中受益”是谷歌的使命,在整合圖片信息并使之便于搜索的路上,用戶對谷歌還可以有更多期待。