高建新 關禹 李俊杰 石超
摘要:傳統的會議模式已不能滿足用戶方便、高效的召開視頻會議的需求。文章提出建立優化型智能會議系統,系統由5大模塊組成,分別為人臉識別模塊、語音識別模塊、智能控制中樞、云計算平臺和會議平板。各模塊協調工作,實現會議簽到、攝像機自動特寫、會議紀要生成等功能,以提高視頻會議的自動化程度、便捷性、智能化,降低會議成本,有效解決用戶體驗差等問題。
關鍵詞:人工智能;優化智能會議系統;系統技術
中圖分類號:TN948.63?文獻標識碼:A?文章編號:1672-9129(2020)10-0062-02
引言:現如今,國網視頻會議召開頻繁,2019年召開國網視頻會議近4萬場。國網總部與網省電力公司之間聯系緊密,工作交流頻繁。會議規模不斷擴大,隨之會議成本、會議系統的復雜度不斷提高。企業各部門的會議也多采用網絡視頻形式,但對網絡視頻會議的體驗有諸多不滿,例如自主服務體驗差、系統功能不夠人性化、音頻效果差等。實現完成網視頻會議的系統主要有視頻、音頻、中樞控制等部分。系統終端操作復雜,負責操作終端的工作人員往往需要長期技術培訓后才能夠正常完成工作。以往的視頻會議需要多個專業人員進行電子設備管控,以保證會議正常進行,效率低、用工成本高。
因此,傳統的會議模式已越來越不能滿足公司發展需求,亟需探索建立一種新的智能會議系統。本文結合目前人工智能的研究成果,提出一種智能會議系統技術,來提高會議系統自動化程度,提升用戶體驗。
1?智能會議系統現狀
目前常見的智能會議系統,其終端是電腦,具有原筆記簽到、終端設備桌面共享、無線投影、自動生成會議紀要、參會人員信息交互、投票、資料分發等功能。智能會議系統具有自適應性,會根據會議所在場地環境自動調節系統模式,例如音頻接受,系統中有降噪模塊,會對非人類語言發出的聲音外的其他聲音音量減少或者消除,提高語音清晰度。智能會議系統與傳統視頻會議相比,可以提高視頻會議的效率、降低會議的經濟成本與時間成本。
近年來,智能手機的普及率不斷提高,走入人們的生活日常,越來越多會議的進行選擇使用智能手機。微信軟件是每部智能手機上必備的一款軟件,這款軟件不僅方便親朋好友間的交流,更是方便了人們的日常工作。通常,一個團隊的負責人會用微信建群,有什么工作通知會在群里發布,也常常會用微信群來召開視頻會議。參加會議的人員可以隨時隨地跟進會議,掌握會議內容。這種會議切實地提高工作效率,使得對人員的管理更加便捷。
2?智能會議系統技術
2.1系統總體技術架構。優化智能會議系統主要由 5 個模塊組成,分別是語音識別模塊、人臉識別模塊、智能控制模塊、云計算平臺模塊、智能控制模塊、會議平板,每個模塊子系統分別獨立完成相應功能,各個子系統之間分工協作,共同實現智能輔助功能。
2.2技術原理。
(1)人臉識別模塊。
人臉識別模塊是負責整個系統的人臉圖像采集、人臉特征提取、人臉圖像識別與人臉圖像匹配工作。會議室門口的攝像機采集的參會者人臉畫面經過視頻編碼后,送至人臉識別子系統,對參會者進行面部識別。會議過程中,通過會議攝像頭監控與會者發言狀態,廣播發言者特寫圖像。
人臉圖像采集是指將攝像頭拍攝到的圖像進行預處理,標注出圖像中人臉的大小與人臉位置。
人臉特征提取是指用數字化信息得出人臉中各個器官的形狀大小和各個器官間的位置關系信息。把這些數字化信息作為人臉分類的特征依據,人臉的特征分量為曲率、角度、歐式距離等。
人臉圖像識別與人臉圖像匹配的實現是根據人臉特征提取得到的特征數據信息與人臉特征數據庫中的信息進行比對。設置一個最適的閥值,這個閥值可以使系統可以成功識別出人臉的概率最大。若識別結果的相似度大于所設閥值,就將匹配到的結果輸出。
(2)語音識別模塊。會議過程中,通過麥克風采集錄制參會人員說出的語音,語音信號經編碼后送達語音識別子系統,從而對語音信號進行智能識別,將語音轉換成文字形式保存。
(3)智能控制模塊。智能控制子系統,負責將語音識別出的命令轉換為會議系統自身可識別的一系列控制指令發送給相應的設備。利用 API 接口進行集中管理,實現有效實現有效屏蔽終端設備發出的控制指令。與傳統視頻會議系統相比,優化型智能控制系統可以有效減少對會議系統運作的人為干預,降低操作難度。
(4)云計算平臺模塊。系統的語音識別與人臉識別的實現過程中,有龐大的數據信息需要處理,普通計算機是無法完成系統中的海量數據處理。因此,本文提出的系統選用云計算平臺來進行對語音識別與人臉識別中的數據處理。云計算平臺具有極高的處理效率、準確率,以實現系統的實時性。云計算平臺的運行是由系統總公司統一分派數據信息,總公司與各分公司為云端,將需要處理的所有音視頻數據通過 IP 網絡集中上傳至總公司,總公司對數據信息進行處理,并及時將處理結果反饋給各分公司。云計算平臺具有龐大的信息儲備空間,除了可以對數據信息快速、高精確度的處理外,還可以將員工的各種信息數據儲存,以便于實時查詢、實時調取分析處理。
(5)會議平板。會議演示平板是最近會議室常用的一款集高清大屏顯示、多點觸控、電腦、電子白板、音響、網絡傳輸于一體的高科技多媒體產品,其采用超薄機身設計,防炫光玻璃表面,支持超高分辨率顯示,觸控反應速度靈敏,支持雙系統一體化和多屏互動,并可以配合云會議平臺實現召開電視會議功能。
個人會議平板,可取代紙質會議材料,方便會議組織者及時將更新的會議資料發給參會者。另外還具有文檔批注及保存、投票、發送即時消息、請求服務等功能。
3?智能會議系統功能作用
3.1會議室準入、會議簽到和面部檢測。利用人臉識別技術,系統可以采集與會者的人臉信息,與預約時的信息比對,一致時,會議室門禁打開,并進行會議簽到。防止會議室被未登記的人員占用,節省會議簽到時間。
在會議進行中,系統能夠對在主席臺發表講話的人的面部表情做實時檢測。當系統檢測到要開始發言的參會者,系統中的智能控制模塊會將攝像頭調節至對準要發言的人,對其特寫,并投射到屏幕和各個終端。提高智能會議系統自動化,減少負責會議的工作人員的工作量。
3.2會議語音轉錄為文字。通過語言識別智能技術,系統對會議音頻做實時檢測、記錄,及時記錄、生成會議紀要,有效降低文秘和參會人員的會議相關工作量。
3.3會議過程的靈活控制。在會議進行中,系統通過麥克風接收用戶在端口發出的語音指令,然后將接收到的指令上傳到云端到語音識別模塊。語音識別模塊把接收到的語音指令譯作系統可以識別的計算機代碼Command API,將Command API傳送至端口設備,端口設備接收到指令后,完成相應的任務,例如觀看會議、輪巡會場、點名發言、演示PPT等。
3.4會議平板應用。會議平板可以連接傳屏器,實現無線投屏,以便捷地進行會議內容演示;支持會議演示平板反向觸控電腦,投屏后可直接由會議平板控制電腦進行打開文件、ppt翻頁等操作,無需演講者來回切換設備;電子白板功能可以書寫、保存批注,與電視會議功能相結合,處于不同地點的終端可以在“同一屏幕”上進行實時雙向協同,標記、批注、繪圖、數據共享等。
個人會議平板,支持會議資料批量上傳、多人同步批注,讓會議進程更加順心和高效;每個平板獨立顯示,資料隨時無線同屏共享;創新手勢控制,輕輕一劃,來回切換共享畫面和自己的畫面,讓會議更加靈活有趣;便捷呼叫服務功能,及時準確地傳遞每位參會者的需求給會場服務員,提高服務效率;會議結束后可一鍵下載會議資料,刪除會議后自動清空所有相關信息,不留痕跡,為重要會議保駕護航。
4?結語
本文在以往學者提出的智能會議系統和人工智能科技的基礎上,提出優化型智能會議系統。優化型會議系統具有人臉識別、語音識別、原跡簽字、自動生成會議紀要等功能,有效地提高了會議效率,降低會議成本。系統相較于以往的視頻會議系統,其自動化程度大大提高,體驗效果提升,便捷程度提升,從而將視頻會議系統運行提升到全新水平。系統在各個模塊的設計、自動化程度有待提高,例如自動生成的會議紀要的有效性和準確度,人臉識別的準確率和識別速度等。
參考文獻:
[1]劉曉東.智能會議系統在會議管理中的應用及發展趨勢[J].建筑工程技術與設計,2017,(15):3354.
[2]顧克明,顧程.智能會議系統的自適應性[J].電聲技術,2017,41(2):1-3,57.
[3]鄭廣寧,車四四,魏永靜等.基于人工智能的電視會議自主控制系統[J].電力信息與通信技術 , 2018, 16(8): 72-76.
[4]馮嬌.基于阿米西棱鏡的高光譜成像系統研究[D].南京:南京郵電大學,2015.