王晨 ,宋亮,李少昆
(1. 清華大學大數據系統軟件國家工程實驗室,北京100084;2. 四川省工業大數據創新中心,成都 610041;3. 四川省經濟與信息化委員會,成都 610041)
過去幾十年,互聯網的影響主要在消費領域,屬于“消費互聯網”。我國在消費領域的“互聯網+”已取得長足進展,電子商務等技術和應用已進入世界前列,百度網訊科技有限公司、阿里巴巴網絡技術有限公司和騰訊計算機系統有限公司已經成為世界前十的大型互聯網公司。一段時間以來,由于消費互聯網在中國產生了極大的影響力,使得人們并沒有重視互聯網對產業領域的影響。在德國工業4.0戰略公布后,國人開始密切關注工業領域與信息領域高度融合的急迫性和價值。現在,互聯網正在向產業領域發展,被稱為“產業互聯網”或“工業互聯網”。
工業互聯網是構建現代工業生態系統、實現先進智能化發展的必由之路,是智能制造的關鍵基礎,是充分發揮工業裝備、工藝和材料潛能,提高生產效率,優化資源配置,創造差異化產品和實現服務增值的關鍵[1]。工業互聯網平臺是全要素連接的樞紐,是工業資源配置的核心,呈現出跨領域、跨地區、全周期的新特性。
美國工業知識經驗軟件化、平臺化能力處于全球領先地位,通過強化基于平臺的網絡、數據、軟件、系統集成應用,推動制造與服務的松耦合,催生網絡化、平臺化、虛擬化等制造業新形態,孕育了以GE Predix為代表的工業互聯網平臺。德國工業積淀深厚,以制造業主導互聯網為主流發展路徑,主張利用互聯網推進技術、工藝、流程、設備的效能優化,促進價值鏈體系重構和持續提升,西門子MindSpere工業互聯網平臺是其中的典型代表。我國工業互聯網發展路徑則孕育了眾多商業模式的創新,具有多元化的特色。國內工業互聯網平臺形成了以航天云網為代表的協同制造平臺、以樹根互聯為代表的產品全生命周期管理服務平臺和以海爾為代表的用戶定制化平臺等多類典型平臺。
工業互聯網生態包括:解決誰來用的問題,即業務生態;誰來提供應用服務的問題,即開發者生態;各環節如何打通實現跨界整合的問題,即數據生態。
工業互聯網的生態構建是圍繞工業企業的行業領域所涉及的業務展開的,用戶對于平臺的黏性取決于平臺對于其業務所提供的價值。工業互聯網平臺的用戶可以分為三類:企業內部用戶、產業鏈上的企業與終端用戶、同行業的其他企業。對于企業內部用戶而言,平臺的價值更多在于實現業務本身的提質增效,主要通過平臺上的一系列數據或模型驅動的分析優化類軟件應用來實現,例如,研發效率提升、能耗降低、周轉周期縮短等。對于產業鏈上的企業與終端用戶,平臺的價值通過協同類和服務類的應用來體現,通過研發協同、供應鏈協同優化、制造能力外包、物料集中采購等應用來提升上游供應商的效率并有效降低采購與生產成本,而對于下游的用戶,價值更多體現在基于產品本身的運營維護服務以及圍繞產品的增值類上,如金融服務、內容服務等應用。對于同行業的其他企業,尤其是缺乏信息技術能力和大規模建設資金的中小企業,工業互聯網平臺則更多需要扮演一種工業軟件、制造資源、行業知識等能力輸出的管道。由此可以看出,對于用戶生態的構建,其挑戰更多在于工業軟件即服務(SaaS)的能力。
工業互聯網平臺的另一方則來自于平臺上內容的提供方,既可以是企業內部的業務部門或軟件服務提供商,也可以是第三方獨立的開發者。對于開發者生態的構建,其重點一方面在于平臺本身功能的完整性、開發的易用性、系統的穩定性;另一方面與平臺的用戶生態形成了一種正反饋效應,平臺聚集了越來越多的用戶和不斷涌現的業務需求,這也為開發者提供了更多的市場機會。從能夠開發工業類應用和模型的人才技能角度來看,工業knowhow是核心,但工業領域人才對于信息化技術的掌握通常是一個巨大的挑戰,因此對于現有的稀缺開發者資源的爭奪更成為了建立工業互聯網平臺生態的重中之重。
數據生態的建設是工業互聯網平臺變“活”的關鍵,數據驅動就是要把數據理解為一種自然資源,既然是資源就要想辦法來開采、利用。所以需要梳理清楚平臺的建設者已經擁有什么數據,未來會擁有什么數據,以及未來要擁有什么數據。數據生態建設的第一個層次是數據源的整理,這些數據有些是從企業現有的IT系統中來,有些是從企業的機器中來,有些是從供應鏈上下游來,有些是從互聯網來。數據生態建設的第二個層次是數據源的打通,工業企業大數據具有多數據源特點,就決定了數據會從多個系統采集,需要考慮如何與其他系統同步數據,如何與其他系統交換數據,如何基于行業領域模型和其他系統產生關聯、集成,包括和業務系統產生關聯、集成。數據生態建設的第三個層次是數據集的整理,數據如何從源頭抽取,以何種方式存儲、分類管理,面向應用特點形成多個可用的數據集以及相應的數據資源目錄和規范化接口。再往上一層是數據的治理,工業數據可能由于設備、環境、傳輸等各種環節的原因導致數據缺失、重復、錯誤等各類問題,需要通過應用數據畫像工具了解數據的質量,進而在數據清洗工具的輔助下修正存在質量問題的數據。

圖1 工業互聯網平臺架構
工業互聯網平臺的基礎設施即服務(IaaS)層技術發展成熟度高,更新迭代周期短,短短十幾年的時間,已經成長出亞馬遜AWS、微軟Azure、阿里云、騰訊云和華為云等。當前多數工業平臺即服務(PaaS)在工業know-how和專業技術方面積淀不足,通用PaaS并未針對制造與消費領域之間專業性的巨大差異進行針對性的研發[2]。因而,在現有的通用云計算平臺上直接構建工業SaaS,會導致開發成本高企、易用性差等問題,更容易導致企業對發展工業互聯網戰略方向和實施路徑的誤判。工業PaaS研發與建設的重點應放在面向工業領域的專業性方向。如圖1所示的工業互聯網平臺架構[3]中工業PaaS層的兩大核心部件是工業大數據系統與工業數據建模和分析,這兩方面的技術因符合工業數據的數據特性和應用特點,在整體工業互聯網平臺的技術體系中有著比較大的挑戰[4,5]。
1. 多態性數據的采集技術
工業軟硬件系統是整體性、封閉性極強的復雜系統,數據格式、接口協議等標準體制的差異帶來巨大的技術壁壘,甚至同一工廠生產的同一型號的同一設備也常常因為元件、用材的不同造成其基礎信息或生成信息的內容發生變化。因此,無論對于工業系統的數據采集與解析,還是數據存儲系統對匯聚的數據進行結構化分解,都潛在著巨大的應用挑戰。由于不同經濟實體的本位主義或協議本身的封閉設計,有時甚至無法實現設備數據的采集;即便能夠獲取數據,在一個工業大數據實際項目實施過程中,往往也需要動輒數月的時間與大量人力資源的投入,才能開展對數據格式與字段的整理[5]。更大的挑戰來自于多樣化、高可變的復雜非結構化數據的大量出現。由于工業系統在封閉性、敏感性和安全性等方面有高標準需求,其中的數據通常只有特定的軟件才能兼容或處理,從而導致整體結構化信息工作面臨更多困難。因此,這類挑戰的解決需要借助系統化思路,通過與工業標準化、數據模型智能識別或匹配等大數據管理技術的綜合運用,才能得到解決。
2. 高通量數據的接入技術
海量機器數據,特別是時間序列數據被大量接入工業大數據系統。一般而言,大型制造類企業同時連結、在線接入的設備數量可達數十萬臺,數據的吞吐速率也輕松達到驚人的百萬數據點/s ~千萬數據點/s。面對這樣的應用需求,大數據平臺必須具備與實時數據庫類似的數據接入能力。然而由于大數據平臺需要對數據進行長期、高可靠的存儲,所以,高效的數據壓縮編碼方法以及低成本的分布式擴展能力,也是工業大數據系統面臨的重大挑戰。另外,為了滿足多條件復雜查詢及高性能響應的要求,在數據接入過程中還必須設計完善的數據組織體系和索引結構,能夠實施有效地輔助預處理和計算,針對高通量數據接入,實現讀寫系統的效率優化[5]。
3. 低價值數據的分析技術
大數據技術需要解決的關鍵問題之一就是從體量龐大的低價值數據中提煉高價值的信息,用數量的大規模彌補信息的低密度。由于工業軟硬件系統對應嚴格的機理模型,每個變量的定義均具備明確的物理含義。低質量數據會導致變量間函數關系發生變化,從而對工業大數據的分析帶來災難性的影響。事實上,制造業企業由于歷史、技術和人為等因素,其信息系統的數據質量一直存在大量問題。例如,企業資源計劃(ERP)系統中物料就存在“一物多碼”等問題;物聯網數據質量也不容樂觀,無效、重名的工況數據,時標錯誤或不齊,時序紊亂等數據質量問題在實際應用中的比例可能高達30%以上。這些問題對數據分析的成果和評判造成巨大干擾,因此在數據分析之前必須對一手數據進行有效治理。
工業應用中有各種原因(時間/空間條件制約、物理環境工況惡劣等)導致大量關鍵信息沒有被計量或沒有被充分、精確計量,這就要求分析算法能夠在“非完美”“非精確”的數據基礎上工作。對于這個問題的解決思路,可以大力發揮基于工業大數據分析的“軟測量技術”,即通過大數據分析,建立指標間的關聯關系模型,通過易測、能測的計量參數來測算難以獲取的過程量值,完善、補充生產過程的整體數據基礎[5]。
4. 復雜異構數據的管理技術
工業生產時產生大量多源異構數據,常見的有結構化業務數據、設備檢測產生的時序數據、各類非結構化的工程數據等。每一種類型的數據都需要高效的存儲解決方案和異構的針對性存儲模型。然而,現有的大數據技術還無法滿足全部要求。以非結構化工程數據為例,各種海量計算機輔助設計(CAD)文件,測試仿真文件,圖片、文檔等小文件,需要按產品的生命周期、項目名稱、層次化組織的物料表單(BOM)等不同維度進行高效、靈活、快速的組織與排列,同時需要具備對數據進行批量管理、建模和質控的能力,這些需求對于目前的分布式文件系統和對象存儲系統均存在技術障礙。另外,從方便使用、降低開發與學習難度等角度出發,異構數據的內部處理差異又應當完全透明,確保暴露給用戶的數據模型和查詢接口盡可能統一。例如,在物聯網(IoT)數據分析中,需要處理大量傳感器部署信息等靜態數據,而這一類操作往往需要將時間序列數據與結構化數據進行跨庫映射,以建立連接關系,因此需要圍繞多模態工業大數據提供一體化的查詢協同優化[5]。
1. 強關聯數據的集成技術
工業大數據分析更加依賴數據基礎的“完整性”,而非僅僅是數據規模。由于“信息煙囪”在工業生產中大量存在,導致工業大數據的數據源呈現“空間離散”和“時間異步”兩個特點。工業大數據應用需要實現數據在物理信息、產業鏈、跨領域跨行業三個層次的融合[5]。
物理信息融合:設計研發階段主要管理數字產品,而在制造服務階段主要管理物理產品,因此全生命周期管理需要融合數字產品與物理產品,從而構建工業信息與物理產品融合的系統。
產業鏈融合:在互聯網大數據的背景下,以生產資源重組優化為目標的云制造生產模式得到迅猛發展,智能產業鏈必須打通傳統企業業務范疇與邊界,實現數據驅動的業務協同融合。
跨領域跨行業融合:在“互聯網+”的產業環境中,需要實現上下游、周邊生態等廣域的信息集成。例如,美國一家農用機器公司將氣象動態、水資源分布、種子情況等農資數據與自身農機產品數據進行綜合利用,從而為農場生產提供更加優質、高效、精準的服務。這種融合方式更加復雜精密,因此需要將制造過程、BOM結構、運行環境等多種類型的工業語意信息統籌起來綜合分析,是對工業大數據更高層次的融合集成。
2. 強專業機理的分析技術
機理是現代工業的基本邏輯與運作原理,工業生產過程也是“強機理”的嚴格可控過程,即通過大量相關領域的專業理論模型,形式化描述現實世界中的物理、化學和生物等動態變化過程。另外,還存在大量閉環調節或控制機制,作為參數配置,使得工業生產過程中可能無限逼近甚至超過設計目標。傳統的數據分析基本遵循“你打你的,我打我的”的孤立原則,很少結合機理模型(甚至完全采取數據驅動),也很少考慮閉環控制/調節機制的作用。強機理模型對于數據分析技術的挑戰主要表現在以下三個方面。第一,實現機理模型與數據模型的有機結合。具體來講,如何將機理模型體現在數據模型中(例如,機理模型為分析模型提供關鍵特征、分析模型為機理模型提供后處理支撐或多模型融合預測),又或怎樣把數據模型作為機理模型輸入(即提供parameter calibration)。第二,計算模式融合,機理模型一般對應計算密集型操作(CPU多核協同或計算集群并行化)或內存密集型操作(GPU并行化),而數據分析通常是吞吐密集型操作(采用map-reduce、parameter server等機制)。兩種計算模式針對主要矛盾不同,需要分析算法甚至分析軟件有針對性地應對。第三,與領域專家的知識和經驗的融合方法,彌補當前一線工作人員的知識缺陷,實現過程邏輯的可視化。例如,對于物理變化過程,需要重點針對知識的“自動化”,而非知識的重新“發現”。將不同領域的知識進行系統化處理,基于大數據分析技術開展信息檢索與更新的操作優化;對于相對明確、能夠形式化的領域知識,依托大數據建模工具提供的時空模式描述與解析識別技術,進行建模,通過海量歷史數據開展驗證與提質,不斷提煉專家知識形成人工智能[5]。
工業互聯網平臺是制造業與云計算、大數據、人工智能等新一代信息技術高度融合的產物,也是先進制造業與互聯網結合的新事物,需要廣大科研人員和產業工作者在實踐中一邊摸索一邊突破。作為制造業大國,我國擁有全球最多的工業設備,時刻產生著海量的工業數據,擁有豐富的互聯網生態以及大量的工業與信息化人才。我們應該充分利用這一條件,創新管理思想,重構產業生態,提升中國制造在全球產業鏈分工中的地位。依托工業互聯網平臺,推進工業互聯網的深度應用與制造業轉型升級,力爭在新工業革命時代實現“換道超車”。
[1] 中華人民共和國國務院. 關于深化“互聯網+先進制造業”發展工業互聯網的指導意見 [R]. 北京: 中華人民共和國國務院,2017.The State Council of the PRC. Interpretation of guiding opinions on deepening “Internet + advanced manufacturing” to develop industrial internet [R]. Beijing: The State Council of the PRC, 2017.
[2] 國家工業信息安全研究發展中心. 國內外工業互聯網平臺對比分析研究 [R]. 北京: 國家工業信息安全研究發展中心, 2017.National Industrial Information Security Research and Development Center. Comparative analysis of industrial Internet platform at home and abroad [R]. Beijing: National Industrial Information Security Research and Development Center, 2017.
[3] 工業互聯網產業聯盟. 工業互聯網體系架構白皮書 [R]. 北京:工業互聯網產業聯盟, 2017.Industrial Internet Alliance. Industrial Internet architecture white paper [R]. Beijing: Industrial Internet Alliance, 2017.
[4] 工業互聯網產業聯盟工業大數據特設組.工業大數據技術與應用實踐 [M]. 北京: 電子工業出版社, 2017.Industrial Big Data Special Unit of Industrial Internet Alliance. Industrial big data technology and application practice [M]. Beijing:Publishing House of Electronics Industry, 2017.
[5] 王晨, 郭朝暉, 王建民. 工業大數據及其技術挑戰 [J]. 電信網技術, 2017 (8): 1–4.Wang C, Guo Z H, Wang J M. Industrial big data and its technical challenges [J]. Telecommunications Network Technology, 2017(8): 1–4.