陳凱
人們很容易知道,圖1中四張圖片其實來自同一張愛因斯坦的肖像畫,第二張圖片在尺寸上有變化(為后續(xù)行文方便,稱其為苗條愛因斯坦),第三張圖片加了個小點綴(稱為靈感愛因斯坦),第四張布滿了白色噪點(稱為混沌愛因斯坦)。人的視覺和頭腦很容易就能在一大堆無關的圖片中,挑選出這幾張圖像,并把不完全相同的愛因斯坦歸于一組,計算機能做到嗎?本文設計了一個活動,以計算圖像相似程度為主線,通過“應用—操作—討論”這三步,探索計算機“辨圖”的奧妙。
● 應用——專業(yè)找圖
TinEye是一個在線的反向圖片查找工具,地址是www.tineye.com,用戶上傳圖片,該工具負責找出圖片的原始出處。將以上四張愛因斯坦的肖像畫上傳后,這款工具就能找到相近的愛因斯坦肖像(如圖2)。
TinEye能認出圖1中這四張圖都是“愛因斯坦”嗎?其實不能。但計算機能借助算法,判斷不同圖像之間的差異。或許大家頭腦中會冒出諸如“深度學習”“神經網絡”這樣的名詞來,其實要實現上述判斷,并不需要用到那些“高端”功能,用感知哈希算法就可以實現了,為了解釋感知哈希算法最基本的原理,下面筆者就利用圖像編輯工具,一步一步手工進行圖像識別,看看計算機是如何判斷圖像相似程度的。
● 操作——手工辨圖
先找到某個圖像編輯工具,本文用小巧簡單的“易筆易畫”軟件來舉例,大家也可以使用自己熟悉的圖像編輯工具來做這個實驗。打開愛因斯坦圖像,然后縮小到8×8像素,注……