編者按
根本原因分析(RCA)是人們尋找觀測結果根本原因的過程。在故障分析的背景下,RCA用于尋找經常發生或重大機器故障的根本原因。本文介紹了幾種根本原因分析工具(如5why分析法、魚骨圖、失效模式與影響分析、故障樹分析和帕累托圖等),以及兩個根本原因分析的案例。原文載于2021年5月的《質量文摘》(QualityDigest),作者布萊恩·克里斯蒂安森(Bryan Christiansen)是Limble CMMS公司的創始人和首席執行官。
根本原因分析(RCA)工具為如何進行根本問題調查提供了堅實基礎。每種RCA工具都有自己的優點,不同行業和問題類型需要應用某些特定的工具。每個公司及其管理團隊在進行RCA時可能都有一個需要遵守的規范,不同的公司會偏愛不同的技術工具。在某些情況下,一些公司會引入外部顧問來進行RCA。顧問一般也會使用一種首選的技術工具或技術工具組合。這些就是為什么很難為RCA創建一個人人都能遵循的通用模板的原因之一。
通常情況下,一個公司會有自己首選的RCA技術工具。如果這種技術工具不能給出需要的答案,才會探索其他方法。
“5why”工具是為RCA而開發的,它像一個好奇的孩子一樣,利用問“為什么(why)”來解決問題。當我們詢問為什么會發生現有的問題時,我們可以追蹤其原因。然后,我們就可以對自己剛剛確定的原因問為什么。
這個過程可以一直繼續下去,直到沒有必要再問“為什么”為止。到那時,我們應該已經找到了問題的根本原因。根據經驗,詢問并找到接下來5個“為什么”的答案應該足以揭示大多數問題的根本原因,這也是“5why分析法”名字的由來(例見圖1)。

圖1 旨在發現事件根本原因的問題流
用于RCA的魚骨圖(又名石川圖)方法,源于日本“質量圈”運動的倡導者石川馨在日本造船業中采用的質量控制技術。這種方法所生成的圖形看起來像魚骨,因此也被稱為魚骨圖(見圖2)。魚骨圖基于以下想法:有多重因素(包括被稱為“5M”的5個主要因素)導致了我們正在調查的故障/事件/影響。

圖2 魚骨圖
5M分別是:人員、機器、環境、方法、材料。
在魚骨圖中,問題或故障被寫在圖右端的“魚頭”部位。其原因沿著水平線表示。進一步的結果和它們各自的原因被寫在代表每個5M的魚骨上。這個過程可以一直進行下去,直到團隊找到了根本原因為止。
魚骨圖可作為結構化頭腦風暴會議的視覺輔助工具,同樣的技術也用于產品設計、人體工程學設計和工藝改進等。
失效模式與影響分析(FMEA)是一種主動的RCA方法,可防止機器或系統的潛在故障。它是一種結合了可靠性工程、安全工程和質量控制工作的系統方法,試圖通過分析過去的數據來預測未來的故障和缺陷。
一個多元化的跨職能團隊對于實施FMEA至關重要。對分析的范圍必須進行明確定義,并清楚傳達給所有團隊成員。跨職能團隊應對每個子系統、設計和過程進行仔細審查,對每個系統的目的、需要和功能進行合理質疑,并對潛在的失效模式進行頭腦風暴。跨職能團隊還可以對過去類似的工藝和產品故障進行分析,從而對工藝進行完善。
進行FMEA時,需要評估每種識別出的故障模式可能導致的潛在影響和中斷,并用于計算其風險優先級數(RPN,見圖3)。如果故障模式的RPN高于公司所能接受的值,則必須通過更改一個或多個因素來解決該問題。

圖3 風險優先級數(RPN)
故障樹分析(FTA)是一種利用布爾邏輯找出故障原因的RCA方法。這種方法最初是由貝爾實驗室開發的,用于評估美國空軍的洲際彈道導彈(ICBM)發射控制系統。
故障樹分析試圖映射故障和機器的子系統之間的邏輯關系。我們正在分析的故障位于圖表的頂部,信息通過表示輸入和輸出事件之間關系的各種“門”向下流動(見圖4)。如果兩個原因由一個邏輯或門(OR gate)組合導致結果發生,則將它們與邏輯或運算符組合在一起。例如,如果一臺機器在運行或維護過程中發生故障,這是一個邏輯或關系。

圖4 故障樹
如果兩個原因需要同時發生才能導致故障,則用邏輯與門(AND gate)表示。例如,如果機器只有在操作人員按錯按鈕和繼電器無法激活時才發生故障,這是一個邏輯與關系,使用布爾與符號表示。
在故障樹分析圖中,可使用不同的符號表示不同類型的事件,如圓形用于基本事件、五邊形用于外部事件、菱形用于未探明事件、橢圓用于條件事件、矩形用于中間事件等。
通過分析故障樹,進行可能的改進和風險管理,這是對自動化機器和系統進行RCA的有效工具。
意大利經濟學家維爾弗雷多·帕累托發現,他所能觀察到的幾乎所有頻率分布都有一個共同的主題:在比率和它們所造成的影響之間存在著巨大的不對稱性。根據經驗,他指出,在任何系統中,80%的結果(或故障)是由20%的潛在原因造成的。
這個法則被稱為帕累托法則(有人稱之為“80-20法則”)。從人與人之間的財富分配到機器的故障等,這種因果之間的偏差都明顯存在。
根據帕累托法則,在分析了故障及其可能的原因后,用柱狀圖和線圖表示故障發生的頻率和故障產生的原因(例見圖5)。通過這種圖,我們可以觀察到原因和故障之間的偏差。通常,我們會發現一些小的因素是如何導致大多數故障的。然后,進一步分析導致最多故障的原因,并采取糾正措施以消除最常見的故障。

圖5 帕累托圖——襯衫缺陷
帕累托圖是確定RCA優先級的極佳工具。根據帕累托法則,消除20%最常見的故障原因,可以使故障總數減少80%。根據機器的臨界狀態、特定部件的沖擊故障或兩者的結合,帕累托圖將表明需要進一步調查和解決的最主要故障原因。
RCA是開放式的、在各個行業中擁有許多廣泛使用的工具。除了上面提到的工具,還有還有一些值得注意的RCA其他工具。
·因果圖:魚骨圖是因果圖的一個例子,還有許多類似的工具試圖映射系統中原因和結果之間的關系。
·改善:另一種來自日本的工藝改進工具。它是一種持續的過程改進方法,RCA被嵌入改善的結構。
·障礙分析:這是一種RCA技術,通常用于安全事故分析。它的前提是:人員和潛在危險之間的屏障可以防止大多數安全事故。
·變化分析:當一個潛在事件由于單個因素的變化而發生時,變化分析常被當作RCA技術。
·散點圖:散點圖是一種繪制二維圖表中兩個數據之間關系的統計工具。它也可以作為RCA工具使用。
RCA示例1
注塑機在世界各地被廣泛應用于制造各種形狀的塑料制品。機器生產的塑料制品應符合相同規格,并在允許的公差范圍內。假設有一種塑料制品的次品發生率很高,我們需要弄清楚它的根源。
首先,需要明確界定問題。這包括解釋塑料制品的精確缺陷。通過觀察輸出,我們可以確定是否出現了注塑過程中可能發生的四個主要缺陷之一,如:溢料;充氣和排氣;零件變形;模具缺陷。
我們假設缺陷是零件變形。此時必須清楚地將問題記錄下來,次品問題以百分比的形式體現。一旦完成該步驟,就必須收集所有可用的數據。維護日志可以從計算機維護管理系統(CMMS)中提取,可以查看注塑機制造商的手冊等。
在這個過程中,應收集每一件次品的信息,測量零件與規范的偏差。當產品從模具中取出后,立即獲取其熱特征。料筒中熔融塑料的溫度也要被測量。
我們知道,零件變形幾乎總是由于溫度問題引起的。但我們不能確定溫度問題出現在哪個環節——是在加熱的料筒中,還是在冷卻的模具里。根據收集到的數據,我們可以確定這個問題。
讓我們假設成品的熱特征與預期的不同。這就斷定問題出在冷卻過程中。進一步研究發現,問題的根源在于冷卻液管道的空間布置不當。最后,改變模具中冷卻液管道的位置即可解決零件變形的問題。
RCA示例2
想象一下,對一臺因過載而停止工作的機器進行調查時發現,保險絲熔斷了。調查顯示,這臺機器過載是因為它的一個軸承沒有得到充分潤滑。進一步調查發現,自動潤滑機有一個潤滑泵沒有充分泵送,從而導致缺乏潤滑。對該潤滑泵的調查表明,其有一個傳動軸磨損了。對磨損原因的調查發現:沒有適當的機制來防止金屬碎屑進入潤滑泵,這使得廢料進入潤滑泵并導致其損壞。
問題的根本原因是金屬廢料污染了潤滑系統,解決這個問題應該可以防止一系列事件的再次發生。如果沒有過濾器來防止金屬廢料進入系統,那么真正的根本原因可能是設計問題。或者,如果它的過濾器由于缺乏例行檢查而被阻塞,那么真正的根本原因是維護問題。
與此相比,如果調查沒有找到因果要素,那么整改措施可能是更換保險絲、軸承或潤滑泵,這可能會讓機器重新運行一段時間。但在根本原因得到解決之前,問題可能會再次出現。
RCA是一種復雜的方法,不應一時興起倉促進行,這樣團隊可能會決定抄近路以節省時間并加快流程。如果你想要了解任何復雜事件的真相,匆忙的流程可能會對整個項目不利。如果你有充分的理由進行RCA,那么創建一個可以成功執行該過程的環境將符合你的最佳利益。
