[摘 要] 可視化數據分析是近幾年出現的一種新的數據分析技術,用它來分析數據不但直觀易懂,且效果較好,目前已在各個學科中得到廣泛的應用。本文探討了可視化數據分析的概念,鑒于數據分析在質量管理中的重要地位及傳統統計分析方法較難的問題,本文將可視化數據分析應用于質量管理中,通過應用實例,說明該方法不但直觀易懂且非常有效。
[關鍵詞] 質量管理 可視化數據分析 JMP
一、引言
目前我國正處于經濟蓬勃發展時期,中國已經成為世界制造業大國,現代服務業也頗規模,但是我國企業也正面臨著嚴峻挑戰,主要是我國大部分的產品的質量還得不到普遍認可,產品質量與美、日、歐相比還有很大的差距。在經濟全球化時代,并且21世紀又是質量世紀,這就大大降級了我國企業在全球市場的競爭力。我們只有不斷的加強創新,不斷改進和采用新的質量管理方法和理念,才能從根本上提高我國企業的質量管理水平,最終提高產品的質量。現在各個領域強調用數據說話,質量管理活動當然也不例外,從過去的統計質量控制到現在六西格瑪管理,質量管理活動都是建立在各種質量數據如不良品數、合格率以及實驗數據等之上的。如何從各種各樣的數據中獲取用于質量改進的信息,從而提高產品的質量?統計技術是一個很好的方法,各種傳統的高級的統計方法,如方差分析,回歸分析等。但是企業很多從事質量管理的工程師,都不是統計專業出身,沒有深厚的統計分析功底,傳統的統計方法的應用將受到很多限制,但是他們確實有對質量數據進行分析的需要。針對這種情況,本文提出了可視化的數據分析方法。
二、可視化數據分析的概念及JMP簡介
在說明什么是可視化數據分析之前,先說明一下可視化的概念。可視化由英文單詞“Visualization”翻譯而來,本意是使某物圖像化、圖形化,從而能夠清晰、直觀地呈現 。事實上,將任何抽象的事務、過程變成圖形圖像的表示都可以稱為可視化。人們用可視化符號展現事物的方法可以追溯到遠古時代,但作為學科術語,“可視化”一詞正式出現于20世紀80年代。1987年2月美國國家科學基金會 (National Science Foundation,NSF)召開的圖形圖像專題研討會上第一次給出了科學計算可視化的定義、覆蓋的領域,并對可視化的需求、近期目標、遠景規劃和應用前景方面作了相應的闡述,這標志著“科學計算可視化”作為一個新的學科在國際范圍內的確立 。隨著社會和計算機技術的發展,到今天,可視化技術的大家庭中不僅僅只有科學計算可視化,它還包括了數據可視化(Data Visualization)、信息可視化(Information Visualization)、 知識可視化(Knowledge Visualization)等一系列的分支 。
可視化數據分析數據可視化的具體應用,是指將數據庫中、科學實驗或工程應用中產生的各種數據用圖形、動畫、報表等可視的方法直觀的展示出來。可視化數據分析的應用十分廣泛,幾乎可以應用于自然科學、工程技術、金融、通信和商業等各種領域。數據可視化有非常重要的意義。它可以大大加快數據的處理速度,使時刻都在產生的海量數據得到有效利用。可以在人與數據、人與人之間實現圖像通信,從而使人們能夠觀察到數據中隱含的現象,為發現和理解科學規律提供有力工具。現代的數據可視化是通過計算機軟件,將數據轉換為圖形或圖像在屏幕上顯示出。JMP就是一款在數據可視化方面功能非常強大的軟件。
JMP是全球統計學軟件領袖SAS公司的重要事業部,致力于幫助企業客戶提升質量管理、優化業務流程和改進產品研發,幫助高校師生及科研人員提高統計學相關課程的教學質量以及科研工作的成效。JMP軟件應用領域包括業務可視化、六西格瑪及持續改善、試驗設計DOE、研發創新、探索發現、教學科研等各個方面。尤其在可視化數據分析和試驗設計方面功能尤為強大。本文的實例分析將基于JMP軟件完成。
三、實例分析
1.問題描述
某電子企業生產一種電子元器件,每天的合格率在87.5%以上的就算正常。最近今幾月以來,合格率的波動較大,不正常的天數很多。企業的QC人員為了找出合格率下降的原因,根據歷史數據和經驗,發現影響的合格率的因素可能有電流的大小、原材料的厚度、設備和工人。為了找出影響合格率的確切因素,以便而取相應措施,提高每天的合格率,QC人員收集了最近50天的數據,數據如下:
2.可視化數據分析
按照傳統的分析思維,要找出影響合格率的因素,一般采用方差分析或者回歸分析的方法,通過P值確定哪個因素對合格率的影響是顯著的。確定和顯著因素之后再對顯著因素采取相關控制措施,從而來提高合格率。這種方法有效,但是需要較好的統計基礎,可能會使那些沒有什么統計基礎的QC技術人員望而卻步。可視化數據分析直觀易懂,不需要多少統計知識,本文借助JMP軟件,采用可視化數據方法來找出影響合格率的顯著因素。首先做出合格率、電流、原材料厚度、設備、工人的分布圖,再借助JMP獨有的動態鏈接功能(利用該功能用戶可作出各個圖形之間、數據表和圖形之間實時動態鏈接,即點擊任何圖形,該圖形在數據表和其他圖形中的相應部分會自動加亮),選中合格率在87.5%及以上的工作日,此時合格率和它的影響因素的分布圖將發生變化,即合格率在87.5%及以上的部分高亮顯示了。此時得到的分布圖如下:
分析以上的分布圖,從電流的那張分布圖看可以看出,合格率大于87.5%的情況都出現在電流大于6時,而在電流小于6時一次都沒出現。由此我們可以初步斷定,電流是影響合格率的重要因素,并且應該控制電流值大于6。再看工人那張分布圖,合格率大于87.5%的情況都出現在工人1和工人2工作操作時,而在工人3那里一次都沒出現。由此也可以得出,工人也是影響合格率的重要因素,還可以看出工人1可能是技術不合格,需采取相應的措施提高他的技能。合格率在原材料厚度和設備的分布圖都很分散,它們可能不是影響合格率的重要因素,可以暫時不需要引起重視。通過以上可視化數據分析,非常快速而直觀的找到了電流和工人是影響合格率的顯著因素,應該對它們采取相應的控制措施,這樣才能提高合格率。
四、結語
可視化數據分析是近幾年出現的一種新技術,應用十分廣泛,幾乎可以應用于自然科學、工程技術、金融、通信和商業等各種領域,它在實際中的應用價值已被工程技術人員所認識。 現在質量管理活動都是基于數據之上的,如何才能更好的挖掘數據背后的信息,傳統的統計分析方法是一個重要的方法。但這一方法需要較好的統計基礎,一般企業可能有很多QC人員用不了。從上面的例子看出,可視化數據分析直觀易懂,不需要較多的統計學知識,借助像JMP這樣的統計軟件很容易就能實現。所以使用可視化數據分析方法來開展質量管理活動,無疑會大大提高工程技術人員的積極性,對提高企業的質量管理水平大有裨益。
參考文獻:
[1] 賀全兵:可視化技術的發展及應用[J]. 中國西部科技,2008年2月(上旬)
[2] 溫慶慶: 可視化技術及其應用初探[J].科技情報開發與經濟,2007,17(28)
[3] 周定照:可視化技術在石油行業的應用[J].2010,65(1)