全世界用了60年的FMEA,被首次瞭解的美女找出了三大問題

聰穎過人的VeronicaJessica在和Mr. E 談到風險管理時,

聊到了三個問題


Veronica站在 合理的管理思維提出了第一個問題:

對於風險評估認定嚴重度跟發生頻率,檢測等級似乎沒有其必要性。

可以理解RPN考量風險發生的嚴重度(S)以及可能性(O

可以得到類似風險判定矩陣(嚴重度(S*可能性(O))的東西。

再就各象限的風險來源去檢討「是否需要控管措施」及「需要什麼要的控管措施」,

這裡也就包括能不能偵測度(D)了。

如果先不用這種方式全部投入計算,會不會比較好呢?

 

Mr. E說明:

"風險管理的兩個主要二維的風險分析因子的確是—嚴重度跟發生可能率

偵測度(D)考慮的是偵測能力和偵測時間

當風險屬於無法偵測、不易偵測,不能偵測出潛在原因/機制

就代表無法對風險進行預先管制

 

相反地,如果設計分析與探測能力很強,

透過檢查甚至預先模擬分析,

能夠與實際或預測的操作條件關聯很高。

譬如:經由自動控制主動偵測,讓治工具、機械、零件設計;

異常零件無法被生產,因為於產品/製程中已設計"防錯機制"

一旦偵測到異常就會自動鎖定

能夠立即反應或是預先防範的動作就非常迅速

更理想是有驗證標準的充分預防體系,風險就有機會預防

譬如:新冠疫情的快篩檢測;模擬系統的安排;AI的預先分析機制

都是在偵測度上分數可以降低該風險的方式。"


Jessica一聽完立馬繼續追問第二個問題:

"「偵測」的方法是否反而另一個風險的開始。"

"怎麼說呢?"

"RPN定義來看,數值是01000

代表RPN值越高,組織越先要控管,

但不論是產品或服務,要控管的項目不少,設計要控管、流程也要控管。

若是採用「RPN」計算,是否有可能因為可偵測度高(例如有裝偵測器),

所以RPN值便可降低,但其實偵測器也需要定期檢視是否能運作正常,否則也是紙上作業而已。

有沒有可能因為這樣的計算方式,反而錯估了我們得注意的風險的優先順序

(如:以為有了偵測器,但其實根本沒有定期檢視,還以為風險已經控制或降低?)。"

Mr. E挑了一下眉毛,回應Jessica

你這個問題真是問得太好了!

首先說明,偵測度(D)是在製程步驟中偵測出失效之能力並加以管控,

依照原偵測度設計的配方,有設偵測器的分數並不是最低,

要連結到"設定防錯機制"才能在偵測度這欄拿到更低的分數。

製程失效模式效應分析(PFMEA)
偵測度(D)風險指數
偵測機會判定準準則:偵測性經由製程管制偵測可能性等級
無現行製程管制:無法偵測或分析不可能10
任何階段
不可偵測
失效模式和/或錯誤(原因)不易偵測
(亦即:亂數稽核)
很微小9
後製程問題偵測後製程失效模式偵測,經由操作員之視覺/
觸覺/聽覺的手段
微小8
問題偵查
來源
製程工站失效模式偵測,經由操作員之視覺/觸覺/聽覺的手段,或後製程計數值量測(Go/No-Go,扭力板手…等)很低7
後製程問題偵測後製程失效模式偵測,經由操作員之計量值量測,或製程工站計數值量測(Go/No-Go,扭力板手…等)6
問題偵查來源製程工站偵測,由操作員之計量值量測或製程工站自動控制,當偵測異常零件主動通知操作員(燈號,蜂鳴器…等),治工具之設定和首件檢查(僅針對設定set up)中等5
後製程問題偵測後製程失效模式偵測,經由自動控制主動偵測異常零件自動鎖定於製程工站,防止不良品流入製程中等偏高4
問題偵查來源製程工站錯誤(原因)偵測,經由自動控制主動偵測錯誤異常零件並剔除,防止其流入製程3
錯誤偵測和/或問題預防錯誤(原因)預防經由治工具設計、機械設計、零件設計異常零件無法被生產,因為於產品/製程中已設計防錯機制很高2
不適用偵測;缺失預防由於有了設計方案(已驗證的設計標準)的充分預防,失效無法發生幾乎確定1


另外談一下FMEA發展的故事

FMEA最早來自於美國軍方以及航空業,後被福特汽車引進到汽車行業並發揚光大,

AIAG(美國汽車工業行動小組)發行手冊並在IATF16949質量體系中推薦使用。

這套方法用了60年,中間歷經四次改版,一直是用填表法的方式進行,

雖然各國都一直在使用;其實對於FMEA方法的質疑,幾十年來從來沒有中斷過。

Jessica首次看到這個工具就有這樣的想法真是優秀!

 

其實像德國的VDA (德國汽車工業協會)自己在2019VDA第四卷中用了另外一套FMEA六步法

有發現到Jessica談的問題,就將過去60年來FMEA所用的過程控制「偵測措施」

被「偵測失效原因(FC)」及「故障模式(FM)的現行偵測控制」取代

 

當中就將:嚴重度/頻度/探測度相乘的風險優先級(RPN

變更為嚴重度/頻度/探測度綜合考量的行動優先權(AP值)

AP不是一個「風險」的優先排序,它是行動的優先級,目標是降低預期功能的失效風險

所以,不能因為有了偵測器,就認定風險已經控制或降低


追求真理會打破砂鍋問到底的Jessica又提了第三個問題:

評分主觀且無法窮盡

似乎這樣的方式要仰賴一個領域的成熟,才能越周全列出控管風險。

很多時候我們是輕忽的,像是使用延長線,但不覺得這可能造成什麼火災的風險,

自然有可能錯估風險的嚴重度或可能性。

或甚至不知道那是一種風險,自然也就不可能列出。

RPN用的是「乘積」,但看起來這樣的分數(1-10)只是次序量尺(ordinal scale),

而非等距(interval scale)或比率(ratio scale),RPN200 並非是 RPN100 2 倍風險。

這解讀容易失真,能少一個變數便少一個變數的原因。

 

Mr. E笑著回應:"的確,在過去FMEA衡量有參考配分表

設計失效模式效應分析(DFMEA)
偵測度(D)風險指數
偵測機會判定準準則:
被設計控制偵測到的可能性
偵測可能性等級
非現行控制:無法偵測或未分析
設計控制將不會和(或)不能偵測出潛在原因/機制和隨後的失效模式;或者根本沒有設計管制
不可能10
不容易設計分析與探測能力弱,模擬分析與預期的實做條件無關聯
設計控制幾不可能偵測出潛在原因/機制和隨後的失效模式的機會
很微小9
設計定稿後/設計發布前設計定稿,設計發布前使用GO/NO-GO治具對產品進行確認(接受標準/功能檢查)
設計控制偵測出潛在原因/機制和隨後的失效模式的機會微乎其微
微小8
設計定稿後,設計發布前通過試驗到失效的試驗對產品進行確認(測試持續到洩漏/彎曲/破裂)很低7
設計定稿後,設計發布前通過老化試驗對產品進行確認(數據趨勢/數據前後差異)6
設計定稿前設計定稿,使用GO/NO-GO治具對產品進行確認(接受標準/功能檢查)中等5
設計定稿,通過試驗到失效的試驗對產品進行確認(測試持續到洩漏/彎曲/破裂)中等偏高4
設計定稿,通過老化試驗對產品進行確認(數據趨勢/數據前後差異)3
模擬分析設計分析與探測能力很強,在設計定稿前模擬分析,與實際或預測的操作條件關聯高很高2
不需要由於有了設計方案(已驗證的設計標準)的充分預防,失效無法發生幾乎可確定1

一般來說,偵測度高的都代表有自動化偵測,連動防呆作為的管理機制。


然原版FMEA中備受詬病的RPN,因為其計算方式,經常被批評「評判優先級有失公正」

所以新版FMEA中取而代之的是FMEA新貴「行動優先級AP」,

更強調我們評價改進優先順序時,要統籌考慮「S O D」之間的組合矩陣關係,

即嚴重度、頻度和探測度的組合方法來定義優先順序,分為三個等級:HML

針對不同AP優先級,採取有針對性的措施降低風險級別,也可以判定現有的控制是否充分。"

 

Mr. E最後為討論下了註解:

"FMEA最初是用在國防及工廠生產作業管理

後來也發展到各種以實體為主的產業、醫療業甚至服務業

做為預測可能出現失效與故障的防範措施技術。


問題在分析每個失效的案例時,

要考慮對整體系統運作上可能產生的連動影響,

避免以管理者主觀的意見去定義失效的原因或效應。

 

如有系統性,公正操作並不斷PDCA逐步完善此工具,

確實能使風險管理預防機制發揮最大效益

有興趣的話,也可以試著導入你的團隊喔!"

從風險防範看台鐵史上最嚴重事故,我們可以做甚麼

各種大問題或事故,有些會不斷發生;有些嚴重度不容許發生,

我們可以做的,是想辦法進行預先防範活動,

然而,要如何讓相關人員了解其必要性呢?


2021清明連假首日,台鐵太魯閣號載著大批旅客南下返鄉掃墓,

經花蓮大清水隧道時,

被一輛停車不慎、鐵軌上方邊坡滑落的工程車撞上,

列車失控出軌,多節車廂扭曲變形,

釀成50死、179傷,台鐵史上死傷最多的事故。

目前初步研判工程車未依規定所導致,

也發現到施工延宕3個月,鐵軌周邊並未有護欄保護。


當發生重大問題、事故後,常聽到這樣的後悔心聲。

如果事先有ⅩⅩ就好了。這種事件發生原因之一,

是事故發生相關周邊人員,對該現象所造成的影響程度的認知不足,

面對此問題,除了為亡者哀悼外,

我們也必須思考從過去案例學習借鏡到甚麼。

 

1.  問題事故在表面展現出來只是冰山一角,水面下還有許多問題,

海因利奇調查職場裡死亡、骨折、擦傷比例,導出1:29:300法則,


已發生的重大問題事故固然要深入分析,

然眾多尚未變成問題及事故的近似差錯案例,

也須進行橫剖面的分析,對預先防範有很大的助益。

蒐集過去所有案例,讓大家實際感受問題、事故的嚴重性,

了解預先防範的重要,不被事過境遷而淡忘,有效傳承此經驗。

 


2.  或許有與自己職場無關的狀況,仍須透過數據及事實,

讓大家知道其實都有可能發生,風險發生,

依照影響嚴重程度、發生機率高低,是否不易被偵測這三項,

可評估出風險優先指數(RPN: Risk Priority Number)

    (1)嚴重程度(S):依據功能需求及其影響來確定所有的失效模式。

    失效影響的例子:性能下降、噪聲,甚至是對於用戶的傷害。

    每種影響,都給個值為1(無危險)~10(危重)間的嚴重程度值。

     此類數值有助於排定失效模式及其影響的輕重緩急次序。

     如嚴重程度值為910,則應當考慮採取行動措施,

      儘可能通過消除該失效模式,或保護客戶免受其影響。


      (2)出現頻率;發生度(O):考慮失效的原因及出現的頻數。

      每種失效模式賦予一個範圍為110的概率值(O)。

      如出現頻度高,就需要確定出行動措施。

 

     (3)發現指數;偵測度(D):測試檢查工作在發現失效模式的能力。

      測試它們的效能、設計驗證、選擇合適的檢查方法。

      可針對當前採取的控制措施,防止失效發生殃及客戶前發現。

      重點在發現失效問題的測試、分析、監控以及其他技術方法。

      根據這些措施,可以了解失效問題能得以發現的可能性有多大。

      這概念就像家裡有裝煙霧偵測及溫度感應器,能有效偵測高溫或濃煙,

      再連動自動灑水或警報器的話,就可以將風險及早處置

      所以透過高偵測力;有合適的檢查方法,也是降低風險的手段

      在管理上,這種能力就是PDCA當中的C

將事件發生的嚴重度(S)、發生度(O)、偵測度(D)等級三者乘積,

就是風險優先級數(英文:Risk Priority NumbersRPN

用來衡量可能的風險,以便採取可能的預防措施。

分數越高代表風險指數越高,要優先採取對策,直到數據降下為止。

  
   這樣的工具,稱為:失效模式與影響分析
 (英文:Failure mode and effects analysisFMEA

FMEA工作表示例
功能失效模式影響S
(嚴重程度分級)
原因O
(出現頻度分級)
當前的控制措施D
(檢查分級)
CRIT
(關鍵特性)
RPN
(風險優先級數)
行動措施建議目標完成日期已採取的措施
填充浴盆高水位傳感器出現差錯液體濺灑到客戶的地板上8水位傳感器已斷開2根據填充到低水位傳感器所需的時間,填充超時5N80針對在高低水位傳感器之間中途額外增加傳感器,進行成本分析

3.  用圖表方式,不斷在儀表板上出現訊息,

是否還有哪些高風險的指數需要被關注,

讓大家感受到各種問題可能會發生。

有時候,人為疏失或機件故障也會受到周邊環境影響,

這時可畫出進行活動或使用物品所在的問題。


風險評估不只用在安全方面,

也可將類似手法用在品質、環境、生產力,客戶抱怨,服務指標等,

把其當成預先防範的基礎,若能落實執行,可大幅減少管理不良。


我們衷心地期盼類似台鐵事件不會再發生,台灣國泰民安。