鄭占高
廣西中煙工業有限責任公司柳州卷煙廠 廣西 柳州 545006
大數據技術是計算機網絡的衍生,是一個數據量大、數據流快、數據類型多的數據集。通過對產品從設計到交付的整個生產周期的數據采集和統計分析,建立數據平臺。結合大數據技術,整合大數據資源,形成有利于質量控制的數據鏈。推廣和實施先進的質量控制技術,保證產品質量,在客戶服務和產品開發中有效發揮產品質量控制的作用。
大數據具有數據量大、速度快、種類多等特點。隨著大數據時代的到來,大數據分析逐漸在商業中應用,如數據庫、數據安全、數據分析、數據挖掘等。
①視覺分析。在大數據分析中,對于普通用戶和專家來說,可視化分析是最基本的前提,更容易被讀者接受。②數據挖掘算法。數據挖掘算法是大數據分析理論的核心,根據不同的數據類型和格式呈現數據特征,更快地處理數據[1]。③預測分析。預測分析是大數據分析的應用領域之一,建立科學模型,引入新數據預測未來數據。對于更深入的大數據分析,有很多典型的、專業的大數據分析方法。
大數據的出現對質量控制產生了巨大而深刻的影響,這里的質量概念是指人們對質量的基本理解,大數據背景下的質量概念關系到我們對質量科學未來發展的基本方向的認識,促使我們反思和完善當前的質量技術。
(1)大數據在質量控制中的應用是以質量為中心的數據,不再局限于隨機抽樣。數理統計方法是質量科學發展的內在動力,隨機抽樣是現代質量管理技術最重要的手段和方法,也是六西格瑪管理和質量改進的重要技術特征。傳統的統計工具和軟件不能用于計算和分析大數據,因此,即使收集了所有的統計數據,也很難完成質量管理和數據分析的任務。這就需要特殊的大數據分析技術和云計算技術。質量數據在理論上可以滿足質量管理的所有需求,但實際上由于數據量大,無法進行定期的統計分析和監測,這就需要大數據分析方法對產品質量進行分析,實現產品質量控制[2]。
(2)大數據是許多計算的標準。精確的建模和計算是統計時代的產物,也是演繹邏輯的頂點,在數據相對稀缺的時代,要求所有的統計數據都是準確的,但在大數據時代,雜亂、不準確的數據不一定是一種劣勢。首先,在數據量增加時通過減少數據來獲得更多信息;其次,數據混合是使用大數據的一種標準方法;最后,使用大數據的簡單算法比使用小數據的復雜算法更有效。
(3)大數據分析更注重相關性而非因果關系。傳統的質量控制方法特別強調因果邏輯,總是試圖通過統計模型來描述事物之間的關系,并得到因果邏輯的支持。許多質量改進技術都涉及因果關系,用準確的數據模擬了實際生產過程,得出了準確的質量結論。然而,大數據分析的主要研究結果相對強調影響邏輯,不考慮這種關系的影響。
隨著經濟的發展,客戶對產品性能和服務的要求也在不斷提高,越來越多的企業開始研究如何不斷提高產品質量控制水平,使客戶對產品質量滿意。大數據在產品質量控制中的應用核心是采用產品從設計到交付的全生命周期,以及故障預測、故障定位、故障處理和產品持續改進的流程。將提取出來的大數據資源進行整合,形成從原始數據采集、識別、存儲到數據處理、挖掘、顯示的智能信息閉環技術鏈,大數據技術的應用可以分為以下幾類:
(1)數據倉庫與挖掘技術的應用。利用數據倉庫進行數據挖掘的目的是為數據分析創造良好的環境,從數據模型的有效數據源中提取數據,通過分析實現數據挖掘的集成。在數據挖掘中,數據是控制產品質量的有效措施,形成數據倉庫的質量控制措施[3]。
(2)數據收集。在提供質量信息時,必須考慮以下幾個方面:一是質量信息的全過程;二是傳統的質量管理;現代生產技術和質量管理是以產品良好的性能和耐久性為基礎的,有效地控制了整個過程。預測性質量信息收集是對每個離散階段收集完整、詳細的質量信息,從而獲得盡可能完整的數據,為未來的統計分析提供足夠的信息;第二,在質量信息處理的背景下,由于采集器的專業能力有限,以及產品測試工具和數據采集傳感器的限制,所收集的產品信息可能超出了質量管理或質量管理的范圍,這就產生了大量低價值的信息。
(3)數據篩選。隨著大數據引入產品質量控制,非結構化產品數據顯著增加。為了解決這個問題,在整個生產周期中會產生大量的信息,并進行必要的篩選,加強對不同類型數據的分類、歸納和分析,及時準確地判斷信息是否與質量控制相關,確定信息的相關性,排除不相關的數據,保持數據與信息之間的密切關系。
(4)數據的使用。①產品故障點預測。在建立產品質量模型的基礎上,確定產品質量薄弱環節,對故障易發部位和操作步驟進行修正,預測故障點。②產品缺陷定位。當產品發生故障時,通過建立產品質量模型,預測產品故障點,可以快速、準確地定位產品故障。③產品故障排除。根據產品質量模型和缺陷定位,對產品缺陷的處理提出合理建議。④產品持續改進。在產品的實際使用中,故障情況復雜,有些故障點是相同的產品有不同的表現形式,產品設計與生產的收集、分析、安排和傳播對于產品的持續改進非常重要。
大數據時代已經到來,關鍵是如何利用大數據產生更好的結果,充分利用大數據中的資源。一方面,要注意建立標準化,包括數據定義、數據分類、數據測量、數據存儲和數據使用的標準化;另一方面,必須注重實施過程的質量控制,包括數據選擇、數據集成和數據分析的標準化。只有做好審計數據的準備,才能提高大數據的容量和應用水平,確保大數據應用的質量。