







摘要:隨著智能化辦公的興起。文章提出一種基于國產工控機的桌面辦公機器人,集成了定時提醒和人臉識別功能。對工控機、電容式觸摸屏、小型4G工業路由器、散熱風扇、USB相機和云服務器的選型與配置進行設計。構建邊緣側與云端的通信架構,實現了文本轉音頻、任務清單管理等功能,并部署了離線狀態人臉識別比對算法,具有主人識別和陌生人監視功能。實驗結果表明,所選人臉識別算法在國產工控機上運行時總體識別準確率大于90%,在3米的距離范圍內,隨著距離的增加,其識別準確率呈現出下降趨勢。人臉比對功能的識別準確率與召回率的大小因測試人員的不同而展現出一定的差異性,總體識別準確率大于95%、總體召回率大于95%、總體精確率接近100%。
關鍵詞:機器學習;移動辦公;人臉識別;邊緣計算
中圖分類號:U231.4" "文獻標識碼:A
文章編號:1009-3044(2025)08-0013-03
開放科學(資源服務) 標識碼(OSID) :
0 引言
國產工控機是智能制造的核心設備之一,在工業互聯網時代發揮著重要作用。近年來,移動辦公和人臉識別技術逐漸普及,為智能化辦公提供了新的思路。在工業互聯網時代,國產工控機應用于各類控制系統,通過聯邦學習等先進技術手段,實現了業務行為的安全檢測與數據隱私保護,有效提升了工業控制系統的安全性和防護能力,為智能制造提供了堅實的技術支撐。
隨著移動互聯網技術的飛速發展和智能手機的廣泛普及,以及辦公自動化(Office Automation,OA) 技術的日益成熟與完善,移動辦公的概念應運而生,并逐漸成為一種新的工作模式。這種靈活的辦公方式在航運企業[1]、政務管理[2]等領域取得了顯著的應用效果,極大地提高了工作效率和響應速度。
人臉識別技術作為一種基于生物特征識別的先進技術,也在智能化辦公中發揮著重要作用。通過對人臉圖像或視頻流進行精確的分析和處理,人臉識別技術能夠自動提取人臉特征并與數據庫中存儲的特征進行快速比對,從而實現個體身份的準確識別或驗證,在遠程線上考勤[3]、中醫面診等領域取得了廣泛的應用,為身份認證和信息管理提供了便捷高效的解決方案。
基于國產工控機、移動辦公和人臉識別技術的發展情況,本文提出一種基于國產工控機的桌面辦公機器人,旨在為用戶提供智能化的辦公體驗。桌面辦公機器人集成了定時提醒和人臉識別功能。
1 硬件設計
在構建機器人硬件系統時,選擇核心及外圍設備以確保系統的高效運行和良好用戶體驗。作為機器人的大腦,工控機選型綜合考慮了處理速度、內存容量、存儲能力和擴展性等指標,最終采用了具有低功耗、高性能,能在有限空間內提供強大計算能力的國產嵌入式工控機,以滿足機器人復雜任務執行需求。
受文獻[4]顯示屏啟發,選用了高分辨率、具有較快響應速度的電容式觸摸屏以實現人機交互的直觀便捷,支持復雜圖形界面設計,提升用戶體驗,并確保對細微手勢操作的精準識別與響應,如圖1所示。
為確保機器人與外部網絡的穩定連接,配備了具備良好的信號接收能力、穩定的數據傳輸速度以及安全防護功能并且支持4G網絡的小型工業路由器,保障機器人互聯網接入、數據交換和遠程控制的需求。
針對工控機及其他電子元件長時間運行產生的熱量問題,采用了低功耗、高效能的散熱風扇,既確保設備穩定運行,又有效控制了噪聲水平。
配備2K高清USB相機用于人臉識別功能,采集人臉信息供后端算法計算分析。同時部署了Centos7操作系統的云服務器,與工控機通信,實現文字轉音頻API交互等功能。硬件設備選型參數,如表1所示。
2 軟件設計
2.1 軟件系統架構
邊緣側國產工控機采用 Ubuntu 20.04 操作系統,并基于 Docker 容器技術構建軟件運行環境以方便代碼和環境的部署移植。邊緣側軟件系統架構,如圖2所示。
邊緣側國產工控機通過外設網卡實現與小型4G工業路由器的連接,進而建立起與云端服務器之間的通信鏈路。這一通信架構的設計,旨在充分利用邊緣計算與云計算的優勢,實現數據的高效傳輸與處理。具體而言,云端服務器不僅承擔著數據存儲與管理的角色,還具備調用語音交互API的功能,該功能能夠實現將文本信息轉換為音頻信號,從而為用戶提供更為直觀、便捷的信息獲取方式。
在實際應用場景中,當邊緣側國產工控機需要讀取用戶設定的行程任務清單時,它會向云端服務器發送請求。云端服務器在接收到這一請求后,會迅速處理并響應,將當前用戶所設置的任務以數據形式返回給工控機。這一過程充分利用了云計算的強大處理能力,確保了任務信息的及時獲取與更新。
為了提升用戶體驗,系統設計了智能化的任務提醒機制。當到達預設的任務執行時刻,邊緣工控機將會發出音頻提示,以聲音的形式告知用戶當前需要執行的任務內容。同時,為了增強任務的提醒效果并確保信息的準確性,云服務器還會將任務詳情以電子郵件的形式發送給用戶的電子郵箱,作為任務的備份與第二次提示。云端系統架構,如圖3所示。
在圖3 中,展示了一個云端系統的架構示意圖。該架構主要由四個核心模塊構成,分別承擔著不同的功能與角色。具體而言,模塊(a)作為語音交互API,負責處理上傳的文本信息,并將其轉化為音頻數據,隨后將這些音頻數據傳輸至模塊(b),即云服務器,進行進一步的存儲與處理。模塊(c)代表邊緣工控機,它通過廣域網與模塊(b)云服務器進行信息交互,從中獲取需要提示的時間點以及相應的音頻文件。在獲取這些信息后,模塊(c)邊緣工控機負責外放聲音,與用戶(模塊(d)) 進行語音交互,實現信息的有效傳達與反饋。
用戶在這一系統中擁有多種交互方式:他們可以直接觸摸控制邊緣工控機進行操作,也可以通過瀏覽網站來操作模塊(b)云服務器,進行如設置行程內容等更為復雜的操作。為了增強信息的傳達效果與用戶體驗,模塊(b)云服務器還會向用戶發送電子郵件,作為二次提醒與信息的備份,確保關鍵信息能夠準確無誤地到達用戶手中。這一設計不僅提升了系統的靈活性與用戶友好性,也進一步增強了信息的可靠性和安全性。
2.2 人臉識別比對算法
桌面AI機器人具有人臉識別功能,部署離線狀態人臉識別比對算法face_recognition[6]。具有判斷當前用戶是否為機主,以及監視是否有陌生人經過的功能,如圖4所示。
圖像采集:通過設備上的攝像頭捕捉畫面中的人臉圖像。
人臉檢測:在采集到的圖像中,使用face_recognition算法庫的人臉識別模型檢測和定位人臉的位置。這一步的目的是從復雜的背景中分離出人臉區域,以便進行更精確的分析。
人臉預處理:對檢測到的人臉圖像進行預處理,包括去噪、增強、分割和姿態校正等操作。這些步驟旨在改善圖像質量,減少光照、角度、表情等因素對識別結果的影響,確保人臉圖像在后續處理中具有統一的姿態和標準。
特征提取:利用face_recognition算法庫的特征提取模型從預處理后的人臉圖像中提取關鍵特征。這些特征包括眼睛、鼻子、嘴巴等部位的關鍵點等信息,它們能夠一定程度上區分不同個體。特征提取是整個人臉識別過程中最核心的一步,其準確性直接影響最終的識別結果。
特征比對與匹配:將提取出的人臉特征與預設的主人人臉特征進行比對。這一步驟涉及計算特征向量之間的相似度,可以使用歐氏距離,也可使用余弦相似度等方法,并根據設定的閾值來判斷兩者是否一致。如果相似度超過閾值,則判定為同一人,否則判定為陌生人。
結果輸出與后續處理:根據比對結果執行相應的操作。如果識別出是主人,設備會向主人問好,否則設備會記錄陌生人人臉信息并在下次遇見主人時展示陌生人圖片。
2.3 定時提醒模塊
定時提醒模塊具有網頁前端、后端服務、郵件提醒等服務。用戶行程任務管理系統如圖5所示。
網頁前端:允許用戶通過網站輕松設置、編輯和查看自己的行程安排。支持輸入行程內容、日期、時間。
后端服務:負責處理前端發送的請求,存儲用戶數據(如行程信息、郵箱地址等) ,并根據設定的時間觸發提醒事件。后端可確保提醒的準時發送。
郵件提醒:當到達用戶設定的時間點時,系統自動發送電子郵件至用戶指定的郵箱,包含行程詳情等提醒信息。
3 實驗結果
3.1 人臉識別
多次選取5名男性和5名女性在不同距離正視攝像頭3次,統計后端算法識別出人臉情況(成代表成功,敗代表失敗) ,某次選取數據如表2所示。
實驗結果表明,所選人臉識別算法在國產工控機上運行時,識別準確率達到 90% 以上,在3米范圍內測試距離的增加會導致人臉識別準確率下降。
3.2 人臉比對
在本研究中,為了全面評估人臉識別系統的性能,進行了多次實驗,每次實驗均選取2名男性和2名女性作為測試對象。這些測試對象分別將自己的當前人臉圖像設置為機主(即系統預設的識別對象) 的人臉圖像。實驗設計考慮了不同距離下的識別情況,要求測試對象在正視攝像頭時進行識別嘗試,以確保數據的多樣性和實用性。
在每次識別嘗試后,詳細統計了人臉比對的結果,主要關注四種情況:真同(True Positive, TP) ,即系統識別結果與實際情況一致,當前測試人員確實與機主為同一人;真異(True Negative, TN) ,即系統識別結果與實際情況一致,當前測試人員確實與機主不是同一人;假同(False Positive, FP) ,即系統識別結果與實際情況不一致,當前測試人員并不與機主為同一人但被錯誤識別為同一人;假異(False Negative, FN) ,即系統識別結果與實際情況不一致,當前測試人員與機主為同一人但被錯誤識別為不同人。
通過對這四種情況的統計分析,可以全面評估人臉識別系統在不同性別、不同距離下的識別準確率和誤識率,進而為人臉識別技術的實際應用提供有力的數據支持和改進方向。某次選取數據如表3所示(1-2代表人員1為機主,測試人員2) 。
實驗結果表明,所選人臉比對算法在國產工控機上運行時識別準確率大于95%,召回率大于95%,精確率接近100%,測試人員的不同會使識別準確率和召回率產生不同結果。
4 總結與展望
本文提出一種基于國產工控機驅動的桌面辦公機器人系統,融合了定時提醒與人臉識別兩大核心功能。在硬件設計方面對工控機、電容式觸摸屏、小型4G工業路由器、散熱風扇、USB相機和云服務器進行選型與配置。在軟件設計方面,構建了邊緣側與云端的通信架構,實現了文本轉音頻、任務清單管理等功能,并部署了離線狀態人臉識別比對算法,具有機主識別和陌生人監視功能。
實驗結果表明,所選人臉識別算法在國產工控機上運行時識別準確率大于90%,人臉比對功能的識別準確率大于95%、召回率大于95%和精確率接近100%。
未來進一步優化機器人的硬件和軟件設計,提高識別準確率和運行效率。并將探索更多的智能化辦公應用場景與功能,如智能會議、智能客服等場景以及語音交互,機械臂控制等功能,以推動智能化辦公的進一步發展。
參考文獻:
[1] 吳晨剛.航運企業移動辦公通用平臺架構設計[J].青島遠洋船員職業學院學報,2024,45(2):22-25.
[2] 程浩.政務移動辦公系統安全技術規范在政務領域的應用實踐[J].信息技術與標準化,2024(S1):51-55.
[3] 趙永麗.基于人臉識別的人力資源遠程線上考勤系統[J].自動化技術與應用,2024,43(8):167-171.
[4] 王飛,張大偉,王振飛,等.基于嵌入式移動桌面機器人的實踐教學模式改革與實踐[J].中國現代教育裝備,2022(7):87-89.
【通聯編輯:朱寶貴】