
書名:《深度學習與計算機視覺:算法原理、框架應用與代碼實現》
作者:葉韻
出版社:機械工業出版社
ISBN:978-7-1115-7367-8
出版時間:2017 年8 月
定價:79 元
近年來,基于深度學習算法的人工智能技術得到了迅猛發展,并與社會各個領域深度融合,推動著人類社會的教育、娛樂、工業以及農業等多個方面發生了重大變革,可以說人工智能熱潮已席卷全人類社會。在人工智能領域,語音識別、自然語言處理以及計算機視覺是最主要的三大技術領域,現今已基本實現落地產業化,尤其是計算機視覺技術,被廣泛應用于農業智能機械、汽車交通、醫療診斷以及工業檢測與安防監控等領域,為人類社會發展作出了重要貢獻。筆者參考由葉韻編寫、機械工業出版社出版的《深度學習與計算機視覺:算法原理、框架應用與代碼實現》一書,探討深度學習背景下計算機視覺算法的可行性應用場景。
全書共13 章,分為2 篇。第1 篇包括1~4 章,主要介紹了人工智能、深度學習、計算機視覺以及神經網絡基礎知識,并對其發展歷程以及國際前沿趨勢進行了簡單闡述。第2 篇為實例精講,包括5~13 章,詳細介紹了Python 基礎、OpneCV 基礎、Hello World、圖片分類與識別以及Caffe 回歸、遷移學習和模型微調、目標檢測算法、度量學習、圖像風格遷移等應用計算機視覺算法的場景,每一章都包含了算法介紹與大量的程序代碼、以及構建好的模型,可供讀者進行參考、研究。
計算機視覺算法是指利用數學算法構建模型從而對圖像進行識別、理解、處理的技術。一張照片或圖像中會包含很多信息數據,但僅憑肉眼很難準確捕捉并識別、處理這些信息,且人工處理信息數據的速度與精確度都很難比得上計算機,因此開發并利用計算機視覺算法處理大量圖像十分必要。現今的計算機視覺技術主要基于深度學習算法而建立。深度學習是一種以人工神經網絡為架構,對數據進行表征學習的算法,可模擬人腦進行分析學習。根據學習框架不同,其可形成以卷積神經網絡、深度神經網絡以及遞歸神經網絡等不同模型而建立的計算機視覺算法研究工具。目前來看,基于深度學習的計算機視覺算法主要應用于以下領域。
農業智能機械領域。信息技術的發展為農業現代化轉型發展提供了技術支撐,而計算機視覺技術的應用可推動農業機械設備向著更加智能化、數字化的方向發展。一方面,計算機視覺技術可賦予農業機械設備圖像獲取與識別能力,幫助農業機械設備快速識別田間作業環境,完成智能播種、灑藥以及采收等工作。如現今應用較為常見的無人機播種機、智能采摘機器人便利用了計算機視覺技術從而大大提高了農業機械的田間作業效率,實現了農業生產的智能化管理。
汽車交通領域。在汽車交通領域,計算機視覺技術主要應用于汽車自動駕駛與導航方面,汽車生產商將計算機視覺算法內嵌于智能駕駛系統中,能夠使該系統通過掃描周邊道路環境與車輛情況從而智能調整車輛行駛路線與速度。此外,該技術還可用于道路交通違章拍照檢測、路況檢測以及疲勞駕駛檢測等方面。如在攝像頭、傳感器的幫助下可實現對車輛車牌、行人狀態以及駕駛員狀態的掃描、拍攝,在對拍攝圖像進行深度分析處理后,計算機系統可對車輛、駕駛員狀態進行識別、判定,從而實現違規行為的自動檢測。
醫療診斷領域。計算機視覺技術在醫療診斷領域被廣泛應用于影像診斷設備。醫生可利用基于計算機視覺技術研發的智能影像診斷機器進行輔助治療。首先醫護人員可利用攝影儀器拍攝病人患病部位,并將圖像上傳至系統,接著利用計算機視覺算法對圖像進行分析、識別,從而判斷患者情況。可以說,計算機視覺技術的應用大大提高了醫療診斷的精確性,為患者治療提供了可靠的幫助,推動了我國醫療水平的進一步提高。
工業檢測領域。在工業生產過程中,計算機視覺技術可被用于工業產品的質量缺陷檢測,以便企業更好地優化生產工序與技術水平,從而提高產品質量;另外,計算機視覺技術還可用于車間生產物料的監督與檢測,避免投放物料出錯造成生產失誤。
安防監控領域。計算機視覺技術在公安系統與監控系統中的應用也十分常見。一方面,公安系統可利用計算機視覺算法構建城市安全網絡系統,實現對犯罪可疑人物與物體的識別、監測,從而采取科學的應對措施,另一方面,人們可將計算機視覺技術應用于智能監控系統,實現對室內外環境的安全監控,避免安全事件突然發生。
總之,計算機視覺技術在各行業中的應用都具有重要意義。隨著人工智能技術不斷進步,計算機視覺技術的應用前景必將更加廣泛,能夠推動我國很多行業的生產與服務方式發生徹底變革,推動整個社會向著智能化、數字化方向發展。