999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于媒體認知課程的人工智能人才培養方法探索

2018-06-27 07:53:08王生進
計算機教育 2018年6期
關鍵詞:微信

楊 毅,顏 歷,王生進,喬 飛

(1.清華大學 電子工程系,北京 100084;2. 英特爾(中國)有限公司,北京 100013)

1 背 景

隨著電子信息技術日新月異,電子信息教學領域也面臨著全新的挑戰,需要培養具有全方位視野和超強能力的新一代工程師及領導者。

媒體與認知是清華大學電子信息學科在課程體系改革過程中提出的一門重要的必修課程。結合清華大學電子工程系在該領域研究的基礎、優勢和創新性成果,我們有針對性地將已有科研成果轉化為教學內容,建設了一套全新的涵蓋人機感知交互、媒體信息處理、虛擬現實及信號處理領域的前沿教學平臺,并采用集體創新培養和個人研究探索相結合的方式,最終達到理工與人文、技術與藝術、感知與思考的高度融合,使學生成為具有國際一流水平的、兼具科研創新能力和未來探索精神的領軍型人才。

通過參考國內外諸多科研院所及名企與智能感知技術相關的項目內容,結合本系在該領域研究的基礎優勢和創新性成果,本課程建設了多種基于人工智能技術的項目。經由對該項目的學習和研究研發,學生能夠獲得智能感知技術的基礎理論知識和開發能力,力爭成為具有國際領先水平的智能感知技術專業人才[1-2]。

2 基于Realsense的微信表情輸入項目

英特爾的RealSense設備[3]是一種能通過采集視覺、深度、音頻等多種媒體信息獲得手勢、語音等表征意圖的智能感知設備,可以廣泛應用于自然互動、沉浸式協作與創作等創新應用,能夠幫助開發人員在游戲、娛樂和內容創建交互方面實現新的突破。

2.1 系統框架

基于Realsense的微信表情輸入項目通過Realsense體感攝像頭采集輸入視頻,調用SDK中的C++接口,實現在Windows電腦版微信中根據人面部表情自動識別并輸入如圖1所示的6種表情的功能。

圖1 需要識別的6種表情

系統框架如圖2所示。

首先,通過Realsense攝像頭采集輸入視頻;然后調用Realsense SDK識別出14種低層次的面部表情特征,如微笑、張嘴、閉眼、伸舌頭、揚眉毛、嘟嘴等。

圖2 基于Realsense的表情識別系統流程

其次,基于表情初級特征建立與微信表情的映射關系并引入開關和鎖變量,避免表情的重復識別和誤識別。

最后,通過控制鍵盤的方式與微信連接,實現在Windows電腦版微信中根據人面部表情自動識別并輸入表情的功能。

2.2 主要模塊及屬性定義

本項目主要使用Realsense算法模塊中的面部跟蹤和識別模塊(face tracking and recognition)。該模塊提供人臉檢測、78個面部關鍵點的檢測和定位、14種初級表情屬性的識別以及人臉跟蹤、人臉識別等功能,可以同時檢測和跟蹤4張人臉。項目主要使用SDK的表情識別部分,該部分可以對14種表情屬性給出0~100的置信度打分。14種初級表情屬性定義見表1。根據實測的14種屬性的靈敏度和誤報情況,確立合適的閾值和表情映射關系。

在表情識別中,為了避免對同一個表情的重復識別,或在不需要識別的時候發生誤識別,產生錯誤判斷,可進行如下兩種處理:

(1)加入開關功能。按下鍵盤上的“向右”方向鍵,開啟表情識別功能;再次按下該鍵,停止表情識別。

(2)引入鎖變量。引入整型變量expression_LOCK記錄上一幀識別的表情編號(0:未識別到有效表情;1~6:對應6種微信表情);只有當前幀識別到的表情與expression_LOCK不同時,才產生有效輸出,相同時不產生重復輸出。

表1 初級表情屬性定義

基于這兩種方法,重復識別的問題可以避免;當開關持續打開時,表情變化過程中的誤識別無法完全避免,但也有效減少。

2.3 接口調用及系統輸出

在調用微信接口時,主要通過C++頭文件中的keybd_event()函數控制鍵盤,在微信中輸入對應表情的英文名稱,再輸入回車鍵,即可發送出對應的表情。具體實現時,整體框架使用樣例DF_FaceTracking,在源文件“FaceTrackingRenderer2D.cpp”中加入void keybord(int Express[])函數完成表情映射、邏輯判斷和微信鍵盤輸入的功能;并在FaceTrackingRenderer2D類的DrawExpressions函數中調用keybord函數,實現整個框架的功能。最終實現的結果如圖3所示。測試表明,該系統對特定用戶的6種人臉表情識別正確率超過90%以上。

3 基于深度學習的人臉表情識別項目

人臉識別[4]是當前最活躍的人工智能領域應用之一。傳統的表情識別方法主要有活動外觀模型(active appearance model,AAM)、Gabor小波變換[5-6]等。這些方法的共同點就是使用一組人工設計的特征,在一定程度上損失了原有的特征信息,或者假設屬性之間相互獨立,往往與實際應用環境下不相符合。深度學習算法舍棄了依靠人工精心設計的顯示特征提取方法,通過逐層構建一個多層的深度神經網絡,讓機器自主地從樣本數據中學習到表征這些樣本的更加本質的特征,從而使得學習到的特征更具有推廣性和表征能力。

圖3 人臉表情實現微信表情輸入的實例

3.1 卷積神經網絡

近年來,卷積神經網絡[7](convolutional neural network,CNN)利用局部感受野的原理,在ImageNet大規模視覺識別挑戰賽(ImageNet large scale visual recognition challenge, ILSVRC)中大大提升了人臉表情識別準確率,連續刷新了圖像分類和目標定位任務的識別率記錄。

本項目構建并訓練了一個含有3層卷積結構的卷積神經網絡,通過取消每個卷積層中的偏置項增快訓練速度。軟硬件環境為modern Linux OS,256GB memory,32 cores CPU,1 NVIDIA TITAN X (Pascal),Caffe & Keras Deep Learning Framework。

3.2 系統主要模塊

首先使用開源的caffe框架[8]實現的 MTCNN完成對原始圖片的alignment任務。該網絡是一個三階級聯的網絡,流程圖如圖4所示,隨后使用Data Augmentation方法擴充訓練數據量,從而提升模型精度;對每張圖片隨機采取平移、縮放、旋轉、剪切等操作,每一張圖片都隨機生成3張新的圖片。

圖4 原始圖片alignment方法

本項目的CNN網絡總共含有3個卷積層,每個卷積層分別有64、128、256個5*5的filters,所有的激活函數均采用ReLU。每個卷積層都放棄偏置項,這能夠加快網絡的訓練。每個卷積層后面都有一個max pooling層,pool核的大小為2*2;之后又連接了一層含有300個神經元的全連接層,最后有一層長度為8的softmax層用于分類,輸入格式為96*96*1的灰度圖像矩陣。

本項目使用的損失函數是cross-entropy loss,所用的優化器是隨機梯度下降(SGD),初始學習率設為0.5,并采用annealing方法在訓練過程中調整學習率,這會使loss更穩定地收斂。weight decay參數為1e-5, momentum參數為0.9。在全連接層前面還使用了概率為0.5的dropout,可以防止過擬合。訓練過程采用批訓練,batch-size為64,一共訓練 20個 epoch。

3.3 系統性能及分析

在訓練過程中,隨機選取10%的圖片作為驗證集。隨著epoch的增加, loss收斂到0.3左右,訓練和交叉驗證準確率變化如圖5所示,模型最終在驗證集上的準確率為81.4%。

分析發現此模型對happy和neutral的識別能力最好,對于sad、surprise和angry識別效果最差;模型傾向于將angry當成disgust,把sadness和surprise當成fear,把fear當成sadness。最終此模型的測試結果為公開訓練集的準確率88.47%,自采訓練集的準確率65.83%。

圖5 訓練和交叉驗證準確率

4 結 語

本文主要介紹了媒體與認知課程的自主研發項目“基于Realsense的微信表情輸入項目”和“基于深度學習的人臉表情識別項目”,實現了用人臉表情輸入微信表情及用卷積神經網絡完成人臉表情識別兩個完整的開發平臺。下一步,我們將在這些項目平臺中引入其他更先進的算法和數據,進行更加深入的研究探索。

[1]清華大學電子工程系. 院系簡介[EB/OL]. [2018-03-01]. http://www.ee.tsinghua.edu.cn/publish/ee/3684/index.html.

[2]楊毅, 徐淑正, 喬飛, 等. 媒體認知實驗教學改革研究與探索[J]. 計算機教育, 2015 (9): 107-109.

[3]Intel Corporation. Intel? RealSense? Technology [EB/OL]. [2018-03-01]. http://www.intel.com/content/www/us/en/architectureand-technology/realsense-overview.html.

[4]Szegedy C, Liu W, Jia Y, et al. Going deeper with convolutions[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Washington D C: IEEE, 2015: 1-9.

[5]COOTES T F, EDWARDS G J, TAYLOR C J. Active appearance models[J]. IEEE Transaction Pattern Analysis and Machine Intelligence, 2001, 23(6): 681-685.

[6]GU W, XIANG C, Venkatesh Y V, et al. Facial expression recognition using radial encoding of local Gabor features and classifier synthesis[J]. Pattern Recognition, 2012, 45(1): 80-91.

[7]Deng J. A large-scale hierarchical image database[C]// 2009 IEEE Computer Society Conference on Computer Vision and Pattern Recognition(CVPR).Washington D C: IEEE, 2009: 1-8.

[8]Jia Y Q. Caffe: Deep learning framework by BAIR[EB/OL]. [2018-03-01]. http://caffe.berkeleyvision.org/.

猜你喜歡
微信
微信
微信
微信
微信
微信
微信
微信
微信
微信
微信
主站蜘蛛池模板: 欧美全免费aaaaaa特黄在线| 色综合日本| 日本精品影院| 国产精品无码一二三视频| 国产在线视频导航| 日韩在线欧美在线| 亚洲精品日产AⅤ| 午夜毛片免费观看视频 | 九一九色国产| 在线观看91香蕉国产免费| 亚洲国产中文综合专区在| 91久久精品日日躁夜夜躁欧美| 国产成人综合日韩精品无码首页 | 亚洲自偷自拍另类小说| 片在线无码观看| 国产无码精品在线播放 | 国产综合另类小说色区色噜噜| 99久久婷婷国产综合精| 国产无吗一区二区三区在线欢| 日本成人不卡视频| 天堂久久久久久中文字幕| 精品少妇三级亚洲| 99这里精品| 亚洲婷婷在线视频| 免费高清a毛片| 91综合色区亚洲熟妇p| 国产黄色片在线看| 精品国产www| 老司机精品99在线播放| 依依成人精品无v国产| 婷婷六月激情综合一区| 国产精品妖精视频| 欧美天堂久久| 免费av一区二区三区在线| 成人日韩视频| 久久久久久久久久国产精品| 亚洲无线一二三四区男男| 国产一区二区三区在线无码| 亚洲黄色成人| 高清不卡一区二区三区香蕉| 久久亚洲美女精品国产精品| 欧美日韩午夜| 中文字幕日韩视频欧美一区| 免费观看国产小粉嫩喷水| 99在线观看免费视频| 久久综合干| 欧美色综合网站| 麻豆AV网站免费进入| 在线免费观看AV| 亚洲最大福利网站| 先锋资源久久| 久久成人免费| 熟妇丰满人妻| 深夜福利视频一区二区| 国产福利一区二区在线观看| www.国产福利| 日本色综合网| 网久久综合| 伊人福利视频| 亚洲成aⅴ人片在线影院八| 国产精品欧美亚洲韩国日本不卡| 久久伊人色| 日韩欧美中文字幕在线精品| 久久久久久高潮白浆| Jizz国产色系免费| 制服丝袜在线视频香蕉| 精品人妻一区二区三区蜜桃AⅤ| 国内精品一区二区在线观看| 日韩一区二区三免费高清| 99久久无色码中文字幕| 亚洲精品无码高潮喷水A| 特级欧美视频aaaaaa| 伊人天堂网| 国产91特黄特色A级毛片| 97亚洲色综久久精品| 欧美精品1区2区| 欧美激情视频一区二区三区免费| 亚洲无码高清免费视频亚洲| 在线中文字幕网| 亚洲欧美日韩成人高清在线一区| 全裸无码专区| 幺女国产一级毛片|