劉 煒,張 為
(烽火通信科技股份有限公司,武漢 430074)
全球信息與通信技術(Information and Communications Technology,ICT)產業正向第5代移動通信技術(5th-Generation,5G)、云計算、物聯網和人工智能(Artificial Intelligence,AI)等方向發展,邊緣計算(Edge Computing,EC)也獲得空前關注。EC是在靠近物或數據源頭的網絡邊緣側,就近提供智能服務,融合網絡、計算、存儲和應用核心能力的開放平臺,其滿足行業數字化與智能化的關鍵需求[1]。
作為“新基建”的核心領域之一,工業互聯網(Industrial Internet)可以看作數字“新基建”的領頭羊,是實現產業數字化、網絡化和智能化發展的重要基礎設施和關鍵支撐,為行業數字化轉型升級提供了網絡連接和計算處理平臺,加速了實體經濟各領域的數字化進程[2]。工業4.0與工業互聯網蓬勃興起,對現場設備管控、資源優化配置和生產智能化等領域都提出了新的要求,迫切需要在工業現場邊緣處加強網絡、數據和安全體系建設。可以說,EC是實現工業互聯網的必要路徑,工業互聯網是EC落地最多的應用場景。工業場景下,傳統中心云架構的安全性和實時性難以滿足需求,需要具備低時延要求和輕量化的信息與物理深度融合的應用。目前國內工業互聯網平臺雖不少,但多側重于商業產品的宣傳和包裝,缺乏兼具指導性和實用性的通用技術架構。在此背景下,我們提出了邊緣智能(Edge Intelligence,EI)2.0的概念,可就近部署智能化運維服務與靈活便捷的運行環境,基于此構建了云、網、邊、端4位一體協同的完整工業互聯網平臺架構,并在表面貼裝技術(Surface Mounted Technology,SMT)生產線進行了實踐和總結。
EI是指將AI技術與EC相結合部署在邊緣節點,為邊緣側就近提供場景感知、圖像識別、數據分析和制造協同與預測性維護等智能化的服務,以滿足行業數字化在敏捷連接、實時業務、數據優化、應用智能和安全與隱私保護等方面的關鍵需求[3]。
雖然EI自提出以來就得到了業界的普遍關注,但目前仍處于EI 1.0的初級發展階段,應用并不成熟,主要面臨如下一些挑戰:
一是信息技術(Information Technology,IT)、通信技術(Communication Technology,CT)和運營技術(Operational Technology,OT)缺乏融合。目前IT與CT已逐漸融合為ICT技術,但OT技術體系碎片化明顯,與ICT在標準規范、行業語言和知識背景等方面存在較大差異,數據信息難以有效流動與集成[4]。
二是知識沒有模型化,難以有效利用。工業互聯網平臺的核心是在工業技術原理、行業知識、基礎工藝和研發工具規則化、模塊化和軟件化基礎上的數字化模型[5],使之封裝為可重復使用的組件,否則EI應用無從談起。
三是缺乏智能和高效的整體架構,云邊缺乏有效協同。目前國內工業互聯網平臺架構尚未形成統一認識,云端與邊緣側缺乏有效管理與協同,相關業務與應用仍處于割裂狀態,沒有形成端到端的協作。
EI 2.0是在EI 1.0的基礎上,引入了云邊協同、邊邊協作、模型裁剪、模型分割與邊緣安全等概念,形成智能化更強、協同性更好和安全性更高的EI體系,可充分發揮邊緣設備與邊緣云的綜合優勢。
EI 2.0重點關注5個方面的能力:
(1)云邊協同能力:通過云端與邊緣測的協同,實現分布式與集中式的平衡;
(2)邊邊協作能力:在邊緣自治的前提下,實現邊邊協作,強化互聯互通;
(3)模型裁剪與分割:對AI模型做裁剪與分割,可在邊緣服務器和終端同時做AI訓練,并支持可重構計算,最大化發揮終端與邊緣協同的優勢;
(4)容災備份能力:在邊緣側和邊緣云增加本地容災備份能力,并且在中心云也能進行異地數據備份;
(5)數據隱私與安全:通過虛擬專網、安全組件和權限控制等手段增加數據隱私與安全性。
EI 1.0與2.0的主要差異如表1所示。

表1 EI 1.0與2.0對比
為充分發揮中心云的優勢與EI 2.0的能力,我們設計了“中心云/行業云—工業邊緣云(邊緣智腦)—邊緣網關—邊緣設備”的工業互聯網平臺4層架構,總體邏輯框架如圖1所示。其中,邊緣智腦是平臺的重中之重,按照基礎設施即服務(Infrastructure as a Service,IaaS)、平臺即服務(Platform as a Service,PaaS)和軟件即服務(Software as a Service,SaaS)的通用云計算架構設計。EI 2.0主要部署在邊緣智腦的PaaS層,包括開放應用編程接口(Open Application Programming Interface, OpenAPI),軟件開發過程、方法與系統的統稱(Development & Operations, DevOps)、微服務框架和AI訓練模型等;邊緣網絡主要包括無線保真(Wireless Fidelity,WiFi)、工業無源光網絡(Passive Optical Network,PON)和時間敏感型網絡(Time Sensitive Network,TSN)等多種網絡結構;邊緣網關則分為北向、核心層和南向,其中北向包括輕量級現場應用與安全外殼協議(Secure Shell,SSH)、消息隊列遙測傳輸(Message Queuing Telemetry Transport,MQTT)等上行通信協議,核心層主要是嵌入式操作系統及核心組件,南向則主要包括中央處理器(Central Processing Unit,CPU)、圖形處理器(Graphics Processing Unit,GPU)和現場可編程邏輯門陣列(Field Programmable Gate Array,FPGA)等硬件及用于過程控制的對象鏈接和嵌入統一體系結構(Object Linking and Embedding for Process Control Unified Architecture,OPC UA)和Modbus等通用工業協議;邊緣終端則包括傳感器、工業機器人、自動導引運輸車(Automated Guided Vehicle,AGV)和有軌制導車輛(Rail Guided Vehicle,RGV)等現場設備。

圖1 基于EI 2.0的工業互聯網平臺總體架構
在圖1所示架構中,中心云、行業云、公有云和其他云處于外網環境,主要提供行業數據與公共資源。工業邊緣云處于企業內網,由邊緣智腦、邊緣網絡、邊緣網關和邊緣終端共同構建,邊緣智腦平臺作為整個工業互聯網平臺的核心,起到設備管控、資源調度、數據處理、建模分析與應用支撐等關鍵作用;邊緣網關則將生產一線的數據進行采集與預處理,實現現場設備與工業系統之間的打通。
該架構最大的特色是融合了邊緣云與工業大數據以及行業云和公有云的各自優勢,具備了云網融合、云邊協同與邊邊協作3大關鍵特征,可以最大化地發揮出EI在工業互聯網領域的重要作用,有極強的創新性、開放性與適用性。
邊緣智腦是工業邊緣云的核心,也是EI 2.0的主要載體,按照邊緣云基礎服務(EC-IaaS)層、邊緣云平臺服務(EC-PaaS)層和邊緣云應用服務(EC-SaaS)層的3層云計算架構來構建,其詳細技術架構如圖2所示。

圖2 工業邊緣智腦技術架構示意圖
(1)EC-SaaS包括與工業制造密切相關的設備綜合效率(Overall Equipment Effectiveness, OEE)、生產過程執行管理系統(Manufacturing Execution System,MES)、統計過程控制系統(Statistical Process Control,SPC)與企業資源計劃(Enterprise Resource Planning,ERP)等工業APP,為生產一線提供行業賦能。
(2)EC-PaaS主要包括虛擬化網絡功能(Virtualize Network Function,VNF)、AI訓練模型、DevOps、微服務架構及通用的工業機理模型與數據建模工具等,并能通過標準的OpenAPI 規范提供遠程服務,EC-PaaS可以說是工業邊緣智腦的重中之重。
(3)EC-IaaS主要提供資源統一編排能力、異構資源管理能力、邊緣設備管理能力和系統部署運維能力等,通過Kubernetes+Docker底座對OpenStack組件進行容器化部署,可以為應用層提供裸機、虛擬機(Virtual Machine, VM)和容器集群等多樣化的管理與服務。
(4)其他功能:包括X86邊緣服務器、AI芯片、分布式存儲、虛擬交換機(Open vSwitch,OVS)與軟件交換系統(Auvtech VoIP SoftSwitch,AVS)等軟硬件系統,主要為邊緣智腦提供底層的計算、網絡、存儲與安全等基礎能力支撐。
邊緣網關是聯結物理世界與數字世界的重要橋梁,就像工業互聯網的神經結,將工業現場的產線、管道、變頻器、可編程邏輯控制器(Programmable Logic Controller,PLC)和機器人等設備連接起來,以適應現場應用低延時、高可靠和多樣化的需求,并配合邊緣智腦共同進行智能化數據處理。按照邊緣網關云邊協同與邊緣自治的需要,我們將邊緣網關設計為北向、南向與核心層3部分,技術架構如圖3所示。

圖3 工業邊緣網關技術架構示意圖
(1)北向:指邊緣網關的數據層,包括流式數據的預處理、現場側AI算法、服務注冊以及規則引擎下發等。通過SSH和MQTT等北向接口協議,邊緣智腦能對邊緣網關進行集中運維和管控,并實現系統和應用程序的遠程更新,支持遺留設備或專有設備的軟件開發工具包(Software Development Kit,SDK)。
(2)南向:指邊緣網關的物理層,可以是X86架構或更輕量化的精簡指令集機器(Acorn RISC Machine,ARM)架構,支持CPU、GPU、FPGA和適應機器學習的張量處理單元(Tensor Processing Unit,TPU),能進行協議轉換并連接各類現場設備。南向協議采取TSN與OPC-UA的融合技術(OPC UA over TSN),將 IT 和 OT 無縫融合到工業通信項目中,可實現從傳感層、控制層和管理層直到云端的數據通信,是打通現場設備與邊緣網關的重要通道,確保了工業場景中擁有跨廠商的互操作性,構建了全新OICT(IT+CT+OT)融合生態系統[6]。
(3)核心層:指邊緣網關的系統層,包括操作系統、容器環境與核心組件。目前主流嵌入式操作系統都是基于Linux的,包括CentOS和Ubuntu等;Kubernetes則是容器編排事實標準;核心組件我們采用EdgeX Foundry框架,可在Kubernetes環境中運行,能提供微服務配置、持久性存儲庫和設備服務配對等功能,處理北向應用及其他微服務發往南向的請求。EdgeX Foundry框架與平臺或供應商無關,可由微服務或軟件組件進行升級或替換,支持設備/傳感器現場部署,安全且易于管理[7]。
(4)通信層:負責現場設備、傳感器與邊緣網關之間的數據通信,具體又分為通用無線分組服務(General Packet Radio Service,GPRS)、窄帶物聯網(Narrow Band Internet of Things, NB-IoT)、長程無線(Long Range, LoRa)等中遠距離通信技術,和藍牙、WiFi、近場無線(Near Field Communication,NFC)與紫蜂(Zigbee,ZB)等短距離無線通信技術,可適應不同應用場景。
云邊協同與邊邊協作是實現工業互聯網的重要基礎,涉及邊緣云平臺與邊緣網關各層面的協同,包括EC-IaaS層與邊緣網關南向的計算、存儲、網絡與安全等資源的協同;EC-PaaS層與邊緣網關核心層的數據協同、智能協同和業務管理協同;EC-SaaS層與邊緣網關北向的應用服務協同;加上邊緣節點之間構成的邊緣通信網與邊緣算力網,從而克服數據傳輸瓶頸,對數據、計算和網絡進行整體優化以達到最佳效率,最終達到云、網、邊、端4位一體的協同,其協同方式如圖4所示。

圖4 云邊協同與邊邊協作示意圖
(1)資源協同:包括邊緣節點所需的計算、存儲、網絡和虛擬化等基礎設施資源的協同,以及邊緣節點設備自身的生命周期管理協同[8]。在邊緣網關資源不足的情況下,可以調用邊緣云的資源作為補充,并根據現場情況對邊緣側網絡的負載均衡進行調整,滿足邊緣側應用對資源的需求。
(2)數據協同:邊緣節點主要負責數據采集,按照規則或數據模型對數據進行初步處理與分析,將處理后的數據,尤其是異常(如告警和故障)數據上傳給云端;邊緣云持續接收邊緣節點的數據,基于海量的運行狀態數據開展大數據統計分析、供應鏈和訂單分配等模型的持續訓練與優化[9]。
(3)智能協同:EI 2.0的核心是通過模型分割與模型壓縮將復雜的計算任務放到邊緣云平臺上運行,計算量小的算法則放在現場側運行,通過邊緣網關與云平臺協同訓練,有效降低深度學習模型的推斷時延。目前模型壓縮較主流的是剪枝(Pruning)法,利用無監督端對端訓練剪枝網絡中冗余的異質結構,通過快速迭代閾值收縮算法解決優化問題,穩定移除冗余結構,提升剪枝效率[10],以更好地在邊緣側進行模型推理。此外,針對邊緣推理中大規模推理服務的成本優化問題,可采取多版本模型與多數據模型自適應推理機制,通過預先測量模型“壓縮”和數據“壓縮”對推理精度的影響,在滿足用戶對推理服務要求的響應時間和準確性的基礎上,利用計算資源和帶寬資源之間的折衷,并同時調整模型和數據版本,在面向大規模推理請求服務時,可最大程度地降低總體服務成本[11]。
(4)邊邊協作:包括邊邊網絡與邊邊計算協作(邊緣算力網)。邊邊網絡的重點是邊緣節點之間直接通信,基于由眾多邊緣節點構建的分布式傳輸加速網絡來克服互聯網的數據傳輸穩定性和跨運營商的傳輸速度瓶頸等問題,無需通過中心繞道[12]。邊緣算力網將計算能力和網絡狀況作為路由信息發布到網絡,網絡基于虛擬的服務身份標識號(Identity Document,ID)將計算任務報文路由到最合適的計算節點,實現邊邊協作,利用服務的多副本特性,實現用戶的就近接入和服務的負載均衡,適應服務的動態性[13]。
SMT是在印刷電路板(Printed Circuit Board,PCB)基礎上進行加工的系列工藝流程的簡稱,是電子組裝行業里最主要的一種技術和工藝。傳統SMT產線是孤島式的,沒有設備間的互聯互通,僅依靠技術人員的經驗設定參數,需要大量人員進行設備維護與檢測,尤其在錫膏檢測(Solder Paste Inspection,SPI)和自動光學檢測(Automated Optical Inspection,AOI)等工序的誤判點數多,造成產線直通率下降,每條SMT產線均需安排目檢人員進行二次復判,而大量目檢容易造成成本上升和產能下降[14]。
上述問題普遍存在于電子制造業中,是典型共性問題,因此我們建立了基于SMT大數據的EI 2.0解決方案。本次研究對象為兩條全自動SMT生產線,采取本文第2部分所述架構,由邊緣網關負責采集和緩存SMT數據,邊緣智腦則對采集的數據進行建模與分析,對SMT制程、SMT機臺參數和SPI/AOI的檢測數據等進行處理,及時偵測產線異常狀態,并提供基于EI 2.0的智能化應用。
SMT產線包括多種設備,需通過邊緣網關數據采集功能滿足對流式數據源、靜態數據源和應用程序接口(Application Programming Interface,API)數據源等多種數據源的整合。數據采集以采集插件的形式適配各種場景,包括數據庫采集器、文件采集器、API采集器和日志采集器等。數采對象包括3類:一是絲印機和回流爐等生產類設備,以收集設備當前狀態信息為主,從而實現信息追溯;二是SPI和AOI等檢測類設備,需要對生成的數據進行深度分析;三是貼片機等綜合類設備,既要收集狀態信息,也需要對數據進行深度分析,以提升生產效率。
SMT產線數據源分為設備通用數據及關鍵數據,包括PCB條碼、機器標識碼、開關機狀態、運行狀態、待機狀態、運行效率和程序參數等。本次試點SMT產線設備清單及關鍵數據采集需求如表2所示。

表2 SMT產線關鍵設備數據
SMT產線具有小批量和多品種的特點,其智能化是以工業4.0時代少量多單、快速備料及易于維護為目標。SMT產線的智能化應用可分為生產與檢測兩大類,SMT生產類應用包括SPI看板、生產時序圖、產線平衡統計分析和OEE等,具體應用情況如下:
(1)數字地圖:實時反映工廠、車間和產線的設備布局和狀態,針對產線的實際布局和設備類型進行了定制化展示;
(2)生產時序圖:通過生產節拍、設備狀態、不良品和不良率時序圖4種維度綜合反映真實的生產狀態,滿足各種場景下的數據分析和回溯;
(3)產線平衡統計分析:主要用于分析產線設備之間的生產平衡度,找出產線的生產瓶頸工序,然后進行針對性地分析和優化,以提升產線的整體生產效率和產量;同時找出產線生產不飽和工序,然后考慮對不飽和設備進行更多任務的分配及資源整合,提升整體的設備利用率,降低設備等料和空轉等不必要的浪費。
(4)設備效率分析:SMT產線之間比較相似,橫向對比多條SMT產線之間的OEE數據,進行對標,找出表現較好和表現較差的產線,包括直通率、拋料率及拋料根因分析等,并預估出較差產線的提升空間和預期目標,同時對比產線內設備的利用率,找出瓶頸設備和不飽和設備,再進行針對性優化。
典型的SPI看板與智能應用情況如圖5所示。

圖5 SMT產線智能應用看板
SMT產線對元器件的包裝方式、引腳共面性和可焊性等有嚴苛的要求,AOI是基于光學原理對焊接生產中遇到的常見缺陷進行檢測的設備,在SMT產線中普遍應用。AOI通過攝像頭自動掃描PCB,采集圖像,測試的焊點與數據庫中的合格參數進行比較,經過圖像處理,檢查出PCB上的缺陷[15]。
AOI普遍存在缺陷條件建立過程繁瑣、無法符合新型態或更細微的條件檢查、產品100%全檢且誤報率低等問題,因此我們引入AI模型進行改善。在邊緣網關部署SMT AI AOI推理引擎,將AOI設備近半年的照片數據送至邊緣智腦服務器,通過AI模型的部署及再訓練,在7 s內即可完成單片PCB瑕疵檢測,在此基礎上產線人員做二次復判認定模型瑕疵并標記,同時輸出模型瑕疵檢測分類分析及每日模型檢測報告,可大幅減少誤判率,并與制造執行管理系統直接對接。本次試點產線SMT AOI 的EI應用方案如圖6所示。

圖6 EI 2.0在SMT AOI中的應用
通過實施邊緣智腦平臺及相關應用,試點SMT產線智能化取得了如下成效:
(1)實現SMT設備自動化與智能化,減少了30%的人力投入;
(2)運用深度學習等AI手段進行智能分析并優化SMT制程參數,誤報率降低約35%,SPI檢出率提升至98%以上;
(3)實現產線關鍵數據可視化,并進行即時管理與調配,成本降低約20%;
(4)提升產線總體品質管理,降低退料審查(Return Material Authorization,RMA)成本約15%;
(5)人員訓練時間從6個月縮短至3個月,人才培訓速率提升約50%。
本文將EC、AI和工業互聯網進行有機整合,在EI 1.0的基礎上設計出基于EI 2.0的工業互聯網平臺整體架構,理清了工業邊緣云、邊緣網關與終端設備之間的關系,明確了各部分的核心模塊與云邊協同方式,并提出了工業邊緣網關北向、南向及核心層的技術體系,以實現端到端的工業互聯網業務整合。基于此架構,我們對兩條SMT產線進行了試點改造,重點將EI 2.0應用在AOI檢測上,并對SMT制程、產線平衡和SPI檢測等進行智能分析與優化處理,取得了較好的應用效果。同時,在實踐中也發現,雖然現場設備完成了數據采集,但利用率不高,真正能有效利用的只占全部數據的約10%。因此,數據采集只是實現工業互聯網平臺的第一步,如何與生產實際相結合,以及如何發揮出工業大數據的價值,還有待業內不斷研究探索。