宋辰



“親愛的”與人臉識別
嘉賓在40張父母合照中隨機挑選一張,選手和小度同時觀察該照片,在40位造型一致,身材接近的女生中,找到該父母的親生女兒,所找出的女兒手中全家福照片與父母合照背面的全家福完全一致,則挑戰成功。
AI技術解讀——人臉識別
人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部識別的一系列相關技術。
隔代識別仍屬于圖像識別分類中的人臉識別,只是難度更大。其技術原理與人臉識別相同,形成灰度圖,分別提取父母面部的特征點和孩子的特征點進行比對。賽前通過多次機器學習,在各種變量中間平衡,提高識別的正確率。
實際上,人臉識別遠超人類且可靠性很強,在過去的3場比賽中,人類選手做對了2道題,而機器卻做對了5道題,機器識別的準確率遠高于人類。
技術應用:
目前,百度的人臉識別技術已經對寶貝回家的人尋家、家尋人兩個數據庫的6萬多條數據進行技術分析,這批數據已經交給警方,警方會對這些尋親人進行DNA核實認證,目前已經有一例通過了DNA比對。
截至2017年3月,百度與民政部合作推出的基于人臉識別技術的百度尋人平臺,已對接民政部全國救助尋親網27003名走失者的數據。
“滄海桑田”與圖像檢索
老華僑手中唯一一張老城市的老照片,其中一個很小的細節會遺留在現代城市中,小度和人類選手依據這個小細節中模糊的信息幫助老華僑尋找家鄉。舞臺上呈現30張城市街景圖,嘉賓在30張老照片剝離的30個含有唯一有效信息的碎片中,任意抽取一個碎片。選手雙方共同依據這個有效信息的碎片,在30張城市圖中尋找匹配。
AI技術解讀——圖像檢索技術
計算機分類和提取出圖像的重要特征,并對多余的無用特征加以有效地排除,以此實現對圖像的識別。
此外,這局比賽中還用到了語義圖像檢索,這是一種在互聯網上進行圖像檢索的方法,它是根據圖像的邏輯特征和抽象屬性進行檢索,使計算機檢索圖像的能力接近人的理解水平的檢索技術。
技術應用:
小度在本局比賽中所展現的語義圖像檢索能力,是基于百度在日常圖片搜索技術上的升級,百度利用深度學習的方法,讓圖像特征抽取的過程更加穩定,不受模糊、噪點等信息的干擾,讓搜索結果更精準。這是百度最新的技術,會盡快把這個技術在搜索中落地,讓大家可以更快更順利地在互聯網中找到想要的圖像。
“永不消逝的電波”與聲紋識別
現場30段情景的說話聲,與30個笑聲相匹配。小度采集完整的30段說話聲,隨后根據嘉賓隨機你挑選的一個笑聲,找到對應的說話聲。正確找出,挑戰成功。
AI技術解讀——聲紋識別
聲紋識別和語音識別一樣,都是通過對采集到的語音信號進行分析和處理,提取相應的特征或建立相應的模型,然后據此做出判斷。
但不同于語音識別,聲紋識別的目的不是識別語音的內容,而是識別說話人的身份。其理論基礎就是“每個人的說話特性都具有其獨特的特征”,聲腔的差異以及發聲的操作方式都是聲紋識別的獨有特征。
聲紋識別主要分為聲紋確認技術(1:1)和聲紋識別技術(1:N)兩類。聲紋確認技術回答的是兩句話到底是不是一個人說的問題,而聲紋識別技術回答的則是“給定的一句話屬于樣本庫中誰說的”問題。
技術應用:
目前,百度在聲紋識別技術的應用上,已經有了以下的幾個方向:金融領域反欺詐(用聲紋識別確認用戶信息,提高客服和系統反欺詐的能力);客服呼叫中心,快速定位用戶身份等;智能硬件的聲紋識別能力,讓機器人知道自己在和誰對話以及聲紋喚醒能力;安全領域的聲紋認證,類似于人臉閘機;輔助個性化語音識別和語音合成。