編者按
《從加速數字化轉型,到建設質量強國》一文為宗福季教授2022年5月至7月發表于香港科大內地辦“教授專欄”上的文章。經作者授權,本刊分三期刊載,本期為該文第二部分。
在質量4.0發展下,工業大數據隱含著眾多機遇。我們可以基于數字化轉型趨勢對許多舊方法進行改良。六西格瑪(6 Sigma)是上世紀80年代末進行質量管理的一個常用工具,里面有很多統計方法。雖然它是三四十年前發展出來的工具,但即使在今天仍然非常有效,只是其中有一些方法需要加以更新。
比如,DMAIC方法是六西格瑪管理中流程改善的工具,其中有很多步驟可以根據現代技術的發展加以更新。DMAIC方法主要包含五個階段。
1.定義階段(Define):在該階段定義所需要解決的問題。有時候找出、厘清、確認真正的問題,比如何解決更為重要。
2.測量階段(Measure):在該階段對數據進行收集。在數據收集階段,并不是一開始就直接收集數據,而是需要花費大量精力決定收集什么數據。在大數據時代,我們有很多方法獲得海量且各式各樣的數據,如傳感器數據、不同數據庫的數據等。但是,我們并不是盲目收集所有可以獲得的數據,而是收集那些與目標密切相關的數據。
3.分析階段(Analyze):通過數據分析方法找到影響產品質量的關鍵參數。在質量4.0時代,工具可以隨著機器學習技術的發展而不斷改善升級,比如使用愈發強大的Python和R 軟件。我們可以各取所長,從而使建模方法更加多樣。
4.改善階段(Improvement):尋找優化生產的方法,使得流程缺陷降低到最小程度。在質量4.0下,除了對以前的一些工具進行改善之外,流程的智能化是重點。我們的目標并不在于解決某一個問題,而是當再遇到類似問題時可以做到某種程度的智能化,以減少人的反復參與。這也是目前的一個研究方向。
5.控制階段(Control):使改進后的流程程序化,并通過有效的監測手段(如控制圖等),確保流程改進的結果可持續進行。在質量4.0下,可以在該階段利用許多改進的可視化工具。
采集數據、分析數據并不意味著問題的完全解決,幫助客戶完成決策才是最終目的,為了實現數據的實際應用需要擁有提升質量的創新工具。
一為突破式創新,運用創意解決問題,要求具有同理心、以人為本的設計,通過觀察、采訪等,發現用戶深層次的需求,對問題重新進行深入的定義。同時需要通過發散性思維,提出眾多解決方案,將一個好的創意點子用具體的原型來呈現,將原型通過情景模擬來測試可用性。
二為漸進式創新,運用統計思維解決問題不是從無到有,而是從好到更好;不是從零開始,而是以數據為基礎來創新。根據定義、測量、分析、改善、控制這個流程,以客戶為中心,用嚴謹的數據驅動、系統方法提高績效并減少對客戶而言至關重要的缺陷。
在工業大數據的框架下,依據數據的運用程度可以將工業大數據分析與應用分成9個層次。
· Level 1:不用數據,只依賴經驗,比如制衣行業早期;
· Level 2:收集數據,但只研究數據本身;
· Level 3:將收集的數據用圖表進行展示;
· Level 4:收集普查數據并進行描述性統計分析;
· Level 5:收集抽樣數據并進行描述性統計分析;
· Level 6:收集抽樣數據并進行推斷性統計分析;
· Level 7:收集實時異構傳感器數據并進行描述性統計分析與可視化;
· Level 8:收集實時異構傳感器數據并進行推斷性統計分析,給出決策建議;
· Level 9:使用工業人工智能的自主過程控制,將數據分析階段智能化,減少人為參與。
以上九個層次,需要補充說明幾點。
首先,并不是按照從差到好的順序進行排序的。比如日本的一些百年老店,完全不用數據,而是靠自己的手藝打敗全世界。當然他們不使用數據也有一些缺陷,比如因為沒有數據支撐很難去別的城市開分店。從Level 2到Level 3涉及到數據的可視化,這是一個很大的進步。大家可能覺得單看數據與單看圖是一回事,但其實很不一樣。人的眼睛通常較難接受數據,而較易接受色彩跟圖案。因此,人直接看數字和看一幅圖的記憶點是完全不一樣的。目前數據的可視化已經形成一門學科。由于人只能看到2D的圖表,所以早期的可視化只是畫一些簡單的圖。而大數據時代的數據維度非常高,如何將高維實時數據進行可視化是非常重要的一個課題。
其次,在質量4.0框架下(Level 7~9),可以獲得海量實時異構傳感器數據。這些工業數據往往是基于傳感器的高頻率采樣獲得的,并且形式多樣,不僅包括連續型數據,還包含文字、圖像、聲音等多種類型數據。如何應用實時異構傳感器數據進行統計分析、機器學習、建立模型,并最終給出決策建議,是質量4.0繞不開的一個重要議題。
第三,真正的工業大數據分析,必須要做到統計推斷和統計預測,要建立模型,要能夠預測未來的情況或是進行描述推斷,其中的確定性、不確定性,都要進行分析,因此,描述性統計和推斷性統計處于不同的層面。
第四,隨著大數據時代的到來,采集數據的傳感器價格越來越便宜,快速采集數據不成難事,難的是如何使用實時傳感器數據并進行描述性的總結、可視化,也就是工業大數據的Level 7。目前,大部分企業還停留在Level 7。Level 8是使用實時傳感器數據并建立統計模型,進行推斷、預測并用于決策,這是目前大部分人都希望實現的。對數據運用的最終目的是達到Level 9,即使用工業人工智能的自主過程控制。也就是說,在之前的例子中使用數據分析幫助商業決策還不是終點,而如何在下次進行同樣決策時、在無人力介入的情況下,自動給出智能決策建議才是我們想要達成的目標。
從以上內容中可以發現,在質量4.0時代,我們面臨許多機遇。而工業大數據隱含的機遇具有兩面性:一方面,很多工具已經存在并得到了廣泛應用,由于在數據不復雜時并不需要使用機器學習以及統計建模這些工具,大家對他們并不是很重視。例如,神經網絡雖然很早就被提出,但當時沒有適用的數據。因此,單有方法沒有數據是沒有意義的。另一方面,只有數據沒有方法也不行。現在,我們可以收集到大量實時傳感器數據,但如果沒有方法依然無法分析建模,這些數據仍然不能被完全應用。例如,在前面提到的實例中(見上期“PartⅠ源起”),目前采集到的數據只能做到可視化,并沒有發揮數據的全部作用。當前,我們處于數字化轉型階段,數據能夠被輕易采集,用于分析預測數據的工具也很多。在DMAIC方法中的測量、分析、改善、控制階段,我們可以在如下方面將機器學習與統計建模相結合,對質量數據進行分析建模。
測量階段:利用分布式傳感器系統進行實時數據收集,也包括對機器運行和數據進行維護、環境數據等類型數據的收集、異構數據融合與可視化;基于物聯網的質量數據整合、分析與監控。
分析階段:對數據進行描述、診斷與預測;使用機器學習構建過程變量與產品質量之間的關系;強化隱形因素、關聯性和因果性的挖掘。
改善階段:根據分析結果提出過程實時優化方案;過程變量的智能動態調整;自適應檢測。
控制階段:基于大數據流的實時過程監測、跟蹤、預警;基于人工智能的異常檢測,實現智能決策輔助及反饋閉環。
工業大數據是信息量豐富的資源,同時,分析數據才能指導人們更好地決策。因此,運用數據分析技術統計學習與機器學習很有必要,采集數據并建模,分析哪些特定的預測因子(X)實際影響了回應(Y)、屬于正相關還是負相關關系、簡單的線性關系還是復雜關系等。如今,大數據發展迅猛,傳感器數據到位,系統整合成為可能。系統整合之后才能進行分析,而這些分析又可以借助機器學習。以前做不到數據實時地收集,現在做得到。在數據分析、質量提升、質量控制等方面現在都有提升,以前可能只是停留在學術論文層面,現在技術到位了,以前的學術研究到實踐應用時間周期比較長,而現在這個時間變得比較短了,一些學術研究將可以很快在質量4.0中得到應用。
(部分內容已刊登 Tsung,F.,"The Application of Industrial Big Data in Quality Innovation in the Context of Digital Transformation",Journal of Macro-Quality Research,Vol.9,No.3,2021.)