王雪淳

摘 要 圖像識別與生成技術是計算機通過分析圖片而提取圖像特征,根據特征來模仿,生成圖片的技術。這項技術目前已較廣泛應用于手機解鎖,司法鑒定,醫學診斷,游戲娛樂等領域。圖像識別與生成技術在人工智能領域已有多方面的應用,且有極大的上升空間與發展潛力。
關鍵詞 人工智能;圖像識別;圖像生成
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2019)232-0153-02
2017年11月3日,蘋果公司推出一款可以通過人臉識別技術來解鎖的手機iPhoneX,一時大受追捧。這一技術不僅為廣大用戶提供便利,同時也使大部分人愿意為這樣一份新鮮感而買單。一些網頁程序,如近期比較熱門的網頁小游戲image-toimage,可以將用戶輸入的簡單幾何形轉化為貓,建筑物等實物圖像。本文將簡要分析這些應用背后的圖像識別與生成技術。
1 人工智能概述
人工智能,是一門研究、開發用于擴展人類智能的理論、方法、技術及應用系統的科學技術[ 1 ]。它起源于20世紀50年代,至今已經過了多個瓶頸期和突破期,其中最新的一個突破源于近五年計算機數據科學的蓬勃發展所帶來的大數據技術。人工智能是計算機科學的一個分支,主要以能做出與人類相似的反應,并勝任一些需要人工智能才能完成的復雜工作為目標,具體研究領域包括機器人,語言識別,圖像識別,自然語言處理和專家系統等領域。其中主要分為具備自我思考、自我推理及解決問題能力的強人工智能,及不具備此類能力的弱人工智能[ 2 ]。
2 圖像識別技術及其在人工智能中的應用
2.1 圖像識別技術原理
圖像識別技術,是一種計算機通過提取圖像關鍵性重要特征以識別各種不同模式的目標和對象的技術。這一技術已經得到了深入的研究和廣泛的發展,是計算機學科領域非常重要的研究方向之一[ 3 ]。
2.2 人工智能圖像識別應用
人工智能圖像識別廣泛應用與多個領域,如司法、娛樂等,同時還與醫學等學科有交叉。
1)識別筆跡。其在司法筆跡鑒定中的應用也較為成熟,能分析且提取筆跡形態上的特征,如長寬比,字間距,筆畫粗細,折筆角度等關系,實現筆跡鑒定。但同時也存在一些如對于摹仿簽名筆跡的有效識別率較低等問題[ 4 ]。對筆跡的識別研究是法務判斷的重要參考。在經濟領域,涉及合同簽名等問題中,筆記鑒定顯得尤為重要。除此,筆記識別還可鑒定收藏品中的名家筆墨,是真品還是贗品,抵制販賣假貨的行為,保護公民個人財產。
2)識別繪畫圖像。一些小程序游戲可成為開發者前期訓練人工智能的絕佳場所?!安庐嬓「琛本褪沁@樣是一款谷歌推出的微信游戲小程序,其主要內容是人工智能識別玩家的簡筆畫。游戲的玩法類似“你畫我猜”,但游戲的參與者不全是真人玩家。在玩家畫畫的同時,人工智能可以不斷地提供猜測的答案并顯示在手機屏幕上,直到猜對正確答案或游戲時間(每輪20秒)結束為止。“猜畫小歌”可以通過預先分析上萬張手繪簡筆畫,提取其中不同物體的關鍵特征,掌握群眾繪圖時的基本思路。然后當用戶們只畫下簡單的線條,甚至是人類也看不出所畫何物時,“猜畫小歌”可以迅速將線條與數據庫匹配,繼而給出答案[ 5 ]。由于小程序游戲的廣泛傳播與極易上手,越來越多的用戶為“猜畫小歌”的數據庫提供素材,從而促進人工智能領悟人類繪畫時的思維習慣,不僅降低前期訓練人工智能成本,也大大提高訓練效率。
3)識別實物圖像。人工智能的圖像識別技術還可識別人臉和植物等實物。
人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術。人臉可受發型,胡子,妝容,光源等影響,故此人臉識別需要先分割人臉,才能提取人臉特征,如五官大小,分布間的參數比例等,建立三維人臉模型,再匹配和識別人臉。此項技術極廣泛的應用于日常生活,如人臉識別解鎖手機,超市中識別人臉后即可用相應賬戶付錢[ 6 ]。隨其安全性仍飽受爭議,但不可否認人臉識別技術的發展也為社會帶來極大的便捷。
“花伴侶”App是一款植物智能識別App,由于花卉種類繁多,分布廣泛,特性相異,光建立數據庫就已是一項龐大的工程。制作團隊選取眾多花的照片,進行分析鑒定,現已實現五千多種中常見植物的智能識別[7]。這一大眾化App使用戶們每拍一張照片,就可了解所見一些常見植物的相關知識,更易滿足人們求知欲,同時也為科學研究作出一定貢獻。
4)識別醫學診斷。病理圖像是疾病診斷的金標準,醫師通過分析圖像中細胞屬性來進行診斷決策。數字病理切片是將整張載玻片進行全信息、全方位快速掃描,使物質化的玻璃載玻片變成數字化的病理切片[8]。計算機可識別組織中的腫瘤,并將結果快速輸出成病理報告,從而為醫師減負,也大大提高就診效率與準確率。在中醫領域,計算機也可以識別不同植物的紋理,判斷中藥真假,甚至能推測其作用部位。這些應用都降低醫生工作難度,也降低誤診率,為人類社會提供更好的就醫體驗。
3 圖像生成技術及其在人工智能中的應用
圖像生成技術有助于人工智能的機器學習等系統,促進其將接收到的信息轉化為系統可以理解與處理的信息,使自我知識體系不斷完善,逐漸降低對人類專家依賴程度,從而使性能提高。
3.1 圖像生成技術原理
圖像生成技術指系統通過計算機視覺嘗試分析一副或多副二維圖像,感知幾何信息,提取其中特點,而用能力模仿特征生成相關圖像。
3.2 人工智能圖像生成應用
基于圖像生成技術,人工智能可模仿人類書寫效果或名畫家繪畫風格,可將實物與繪圖相互轉換。同時,圖像生成技術對于虛擬現實、人機交互、網絡輔助教學等都有廣泛應用。
1)生成筆跡。筆記生成技術主要是計算機對人類的真實書寫進行分析,從而能模仿出其書寫風格。但由于在電子產品上書寫時,沒有壓感,機器必須先分析真實毛筆的筆刷形態,筆鋒等進行分析,建立相關筆刷模型,在分析人類書寫時的速度,從而調整筆畫粗細與筆鋒,生成能具體體現書寫者書法效果的字體[ 9 ]。然后人類在電子產品中寫下的字體就更美觀也更真實,促進無紙化辦公發展。