◆宗福季 / 文
編者按
在2018年中國國際工業博覽會質量創新論壇上,國際質科院副院長、香港科技大學宗福季教授以《質量大數據》為題發表演講,介紹了工業4.0時代下質量、創新與大數據之間的關系,及其對現代產業所帶來的影響,提示人們通過質量創新以及運用大數據分析技術適應并引領工業4.0時代。本文根據現場速記整理。

工業4.0,大家知道來源于德國戰略性方針。這已經不是一個國家的戰略方針問題,德國站出來了,其他國家馬上跟進。日本有日本的工業4.0版本,韓國有韓國的版本,每個國家都有自己的版本,中間重疊的地方挺多,但都是虛實結合。“虛”的是互聯網,把數據連接在一起;“實”的是系統,是工廠里面的各種操作系統,有很多機器。中國也有自己的4.0版本——“中國制造2025”,聽起來很響亮的名字。“中國制造2025”的內容和其他國家的工業4.0有相互重疊的地方,也有獨特之處。創新驅動、質量為先、綠色發展、結構優化、人才為本……“中國制造2025”把創新和質量放在最前面,和其他國家的版本都不一樣。
下面是索尼的一個案例。在很多年前,日本索尼發展到一定程度后,需要國際化,國際化的第一步是在海外設廠,索尼的第一站選在了美國。在美國設廠,生產制作一模一樣的東西,生產線一模一樣,機器設備還更高級,那時各方面的生產數據,包括良品率,確實比日本高。但日本本土制造的就是比美國制造的要貴30%~40%,大家還是買日本制造的。回過來說一說“中國制造2025”。質量是個很重要的點,會影響生存,每個企業都知道。但是不是購買、升極了比日本、德國更先進的機器設備,或通過自我研發跨越了以往存在的一些技術門檻,質量就能提升到更高水平呢?不是那么簡單的。并不是軟硬件完全到位就可以解決問題,如果那樣的話,很多問題就不是問題了。這是我想說的第一點,升級了軟件、硬件,問題還是沒有解決。
接下來再舉兩個例子。案例A,是國內一家在航空航天領域相當成功的企業,主要產品是飛機的導航陀螺儀。陀螺儀其實很好想象,小時候玩過陀螺的人都知道,它可以穩定方向。這家企業的陀螺儀生產線還是相當先進的,各個步驟都有大量的中間生產數據,質量監測也很嚴厲,主要檢查X、Y、Z三個軸的9個重要指標。只要一個指標沒有過關,就要全部返工。雖然擁有大數據平臺,信息系統數據也都有收集,但產品最終好不好還得看最終的檢查結果。結果,檢查出來發現某個批次真的有一些問題,而且是同一個指標都有問題,但要具體追蹤哪一個過程、哪一個工序出了問題,就不知道了。說不知道,可能有點不公平,因為數據是有的。傳統的做法是根據這些數據請專業人士做分析,給專業人士一點時間,寫一份報告當然就出來了。但我要說的是實時傳感器的數據,有問題以后并沒有辦法馬上追蹤,而需要一段時間才能分析出來。所以,雖然企業有信息系統、通訊系統和質量追蹤,但質量的預測沒有辦法到位。
案例B的企業屬于半導體行業,主要生產大面板、大屏幕,工廠在深圳東莞那邊。生產過程也是多過程的,有無數道工序,很復雜。因為現在傳感器的價格降低了,所以該企業也在各道工序里放置了很多傳感器。我拿到的數據有各個階段、各個傳感器出來的60多個參數,而真正的生產線,參數和數據更多。產品出來之后,要測量面板厚度、計算它的均值和面差等。產品最終好不好還是要看質量監測結果,具體到哪一個過程、哪一個傳感器測量是關鍵參數,不知道。以前是知道的,因為參數少,專業人士或老師傅知道,但是現在幾百上千個參數,反而不知道哪一個是關鍵參數了。
所以,軟件、硬件、系統的整合非常重要,要真正解決問題還是需要工具。以前的那些質量工具不能丟掉,包括提升質量的創新工具,只不過應用的場景不同而已。
什么叫創新?一個是突破式創新,一個是漸進式創新。突然有一個很好的想法,可稱之為突破式創新。這種創新比較吸睛,而且容易上報紙,因為大家很喜歡這樣的故事,所以不斷強調突破式創新,但是工廠里面真正有幫助的,其實是漸進式創新。因為完全從無到有的機會,并不是天天都有,大部分是基于已有的產品和服務,要讓它變得更好,每天進行一些小的漸進式創新。有人做過這方面的調研:一個公司要成功的話,漸進式創新比突破式創新的作用大得多。
突破式創新是創意式解決問題的方法,很重要,也有系統的方法,而且這些系統方法實際上不少,比如設計思維。漸進式創新并不是完全從無到有,而是有步驟和方法,且與歷史數據相結合,我稱之為統計思維。統計思維并非要讓人成為一個統計學家,也不是數據的思維,之前有些專家提到的六西格瑪等一些量化的質量方法,實際上是在這個框架下面。這些傳統的質量方法林林總總,很重要,但確實有不足的地方,需要不斷更新、增添。它們大多基于采樣,得到的是部分產品的信息,只能反映局部生產過程;缺少統一的數據與信息平臺,質量數據難以共享與追蹤;工具自動化程度低,依賴質量人員的大量參與與主觀判斷。因為存在不足,和現在講的數字化時代的要求不太能對接上,所以必須有一些更新或變革。
具體來說,現在的大數據有三個原始特性:高容量(High-Volume),指的是數據量;高速度(High-Velocity),指的是收集、獲取、生成、處理數據的速度;多種類(High-Variety),指的是不同的數據類型,如音頻、視頻、圖像數據(主要是非結構化數據)。其中,比較重要的特性是高速度。過去,我們把數據當成金礦,所以盡量存起來,以備后用。但現在發現,數據不是湖或者海的靜態概念,而是數據流,是河流的概念。它有速度的,所以不要打算存起來;它是實時流動的,所以要重點想想怎么做實時分析。
我給大家一個關于大數據的例子,是一封質量人士的情書。
親愛的春嬌:
我們的感情,在組織的親切關懷下、在領導的過問下,一年來正沿著健康的道路蓬勃發展。這主要表現在:
(一)我們共通信121封,平均3.01天一封。其中你給我的信51封,占42.1%;我給你的信70封,占57.9%。每封信平均1502字,最長的達5215字,最短的也有624字。
(二)約會共98次,平均3.7天一次。其中你主動約我38次,占38.7%;我主動約你60次,占61.3%。每次約會平均3.8小時,最長達6.4小時,最短的也有1.6小時。
(三)我到你家看望你父母38次,平均每9.4天一次;你到我家看望我父母36次,平均10天一次。
以上充分證明,通過一年來的交往,我們已形成了戀愛的共識。 我們的愛情是互相了解、互相關心、互相幫助,是平等互利的。
我想問一個問題:這是不是大數據?現在很多人說自己建立了工業大數據平臺,正在實施智 能化,但大家對大數據、智能化的理解真的是高低有別,差異很大。
我前面說的層次之分就是這個意思。工業大數據分析的層次:只考慮經驗,不考慮數據是第一級;第二級是收集數據,但是只看數字;第三級是收集并整理數據,并使用圖表來展示數據。第二階段和第三階段基本上是一樣,只是畫圖和不畫圖的區別,但實際上已經有很大進步了。現在經常提到“可視化”,大部分人對報表不太敏感,但是對圖形很敏感,所以說用圖表示就是大進步。第四級是收集調查數據,并使用描述性統計量;第五級是收集采樣數據,并使用描述性統計量;第六級是收集采樣數據,并使用統計推斷,預測。第四階段和第五階段里面有一個重點:所謂的統計、描述,就是計算均值、最大最小值等,這些都很好,但是還沒有到真的統計分析,那些只是統計綜論或描述,但還沒有比較具體的觀點。真正的統計分析要做建模,要做預測,要做推論。
使用實時的傳感器數據并做可視化的描述總結是第七階段,使用實時的傳感器數據并建立統計模型,進行推斷、預測,并用于決策是第八階段。數據分析之后,要幫助企業做決策,這一點很重要。剛才說的,總結的可視化已經很好了,但畫一些漂亮的圖形只是間接幫助決策,離幫助做出決策還有一段路要走。從大數據到智能化中間,缺的就是第七、八級。
第七、八級上有沒有可用的工具呢?現在的工具確實需要更新,大家都是質量領域的專家或工作者,很清楚數據確實變得復雜了。大家可能覺得這些都跟我沒有關系,我又不是IT專業的,或者我是老總,聘請一位計算機專業的人就可以了。但這些年的調查研究發現,看成功不成功,那種方式并不是一條很好的路,還是應該根據自己的專業,采用自己的方法進行自我提升。總之,最終能解決問題的,還是那些質量方法和工具。
大數據和機器學習結合起來,對我們來說是難得的機遇。現在傳感器便宜了,信息系統技術到位了,工業大數據的收集也基本上能做到了,質量工具和方法剛好處于發展期,軟件可以實現,差不多都是近3~5年發生的事,這些要素對質量有什么影響,確實要仔細想想。比如說在收集數據方面,雖然說六西格瑪有DMAIC,但是收集數據就要占用80%的時間,但是現在收集數據的技術已經到位了。還有以前看不到的東西,現在看的到。分析方面,包括描述、診斷、預測等,以前理論上是可以的,但在數學方面有一些難度,現在也可以做到不同的高度。改善方面,怎么做實時優化、自適應檢測,這些技術升級值得關注。還有對大數據流的控制,以前是控制圖在每個小時過程當中取5個點畫一個圖,現在是無數的傳感器不斷產生實時的數據流,如何監控,這事實上是一個新的問題。這些變化說明,一些工具必須要更新。
回到之前的一些例子,現在很多企業對生產制造過程,比如進廠、加工等每個過程都有進行數據收集,根據自己的行業進行了不同層次的描述、分析、整合,這些都是工業大數據要做的事。但我要說的是,就算軟件、硬件做得比較超前到位,實際上項目并沒有做完,還是需要質量專業的人幫你做分析。這里面牽涉到很多有趣的科研課題,不管是學界還是業界都還沒有結論,包括數據融合、遷移學習、過程監控等,有機會再和大家分享這些成果。
