2021年4月17日 星期六

Accident Analysis and Risk Management

 品質與系統角度看事故原因與分類

從戴明系統運作與品質管理的角度來看,缺失與不良品可以歸類為兩種狀況

  • 一種是隨機出現、無法預測的不良品(outlier )
  • 另一種是系統不穩定(variance & trend),隨時間的長期趨勢;可以經由持續改善,提高系統穩定度與良率(或者隨著時間過去,機器設備老化而越來越不穩定)




借用以上品質系統管理的觀點來看事故的發生,也可以將事故區分為兩種狀況
  • 一種是意外:陰錯陽差與上帝的旨意=>無法預料≒難以避免
  • 另一種是意料之中的溫水煮青蛙(drift to failure),可以預防與避免,只不過通常因為集體鄉愿或者難以抗拒熱力學二定律,導致許多意外(Accident)的發生經常是合情合理的





而出了人命上了法庭的時候,法官通常也只能依據common sense 來推論這些意外事故都是由於過失所造成,因此某些人要被推出來當戰犯,肩負業務過失(應為能為而不為)致人於死的刑責





說不清楚因果關聯乃至於各項contributory factors的貢獻度(effective size)大小,所以只能使用"比例原則"



從風險管理的角度來看(以上兩種類型)事故的預防
首先要搞清楚
 這個意外到底是不是意外?




第一種(無法預料的)意外
1.最簡單的對策是認命+拜拜

2.然後再來是保險與互助

3.更進階的是- 設法理解不確定性(把未知轉化為機率分配)



第二種 (可以預料與管理的)意外事故
1. 建立制度與管理
1.1各種危害情境的分析與風險評估


1.2保護層與硬體設施

1.3管理制度與系統


2. 系統性思考(不要讓各種規章制度成為形式主義)
2.1 沒有問題才是大問題


2.2不要窮得只剩錢與KPI (誘因制度的誤導)

2.3 管理者要能意識與看見系統的動態均衡與擺盪



3.持續改善
(抗拒熱力學第二定律的最佳方式就是定期自我迭代)與韌性工程



結論與建議
從事故的分析與事發因果關係探討
  • 必要條件(event view):火災三要素,當事人犯錯+某個關鍵元件或功能失效
  • 充分條件(Systemic and Organizational view):不安全的行為、不安全的環境、不當的管理、為了短期績效而賭一把
  • 下醫醫病(修理犯錯的人與故障的設備)、中醫醫人(改變觀念建立組織安全文化)、上醫醫國(讓組織改善體質與持續改善)

如何分類事故與定義風險,決定了風險管理的格局與水準
  1. 98%都是人為疏失=>發展出各種行為安全的管控作法
  2. 人會犯錯/設備會故障=>發展出保護層與可靠度工程的觀點
  3. 機器設備是死的,人會受各種壓力與誘因影響,各種因素交互影響=>組織安全文化/人因工程/ Swiss Cheese/ Complexity System
  4. Normal Accident vs High Reliability Organization=>Resilience Engineering and 迭代持續改善  

風險管理人員或專家是人不是神或神棍,也不應該是神或神棍
  • 無法預料事故發生的5W1H
  • 風險管理不是Silver Bullet- 作了OOXX就可以確保永保安康
  • 風險就是無法被管理:本質(本體論)上的不確定性、認識(論)上的認知偏誤與扭曲+ 風險是眾人之事,眾人之事=政治(風險評估的方法論可以非常”科學”,但科學無法決定政治 e.g., 核電安不安全?萊豬能不能吃) 


---------------------番外篇 業界所謂的All Risk Management---------------------------


Risk Management. Benchmark-

第一個層次的『全』=可謂依據FEMA All Hazard Approach跨不同災害類型,用同一套指揮系統與架構來因應
以台積的管理架構,這個「全」≒「缺」=>(侷限)在廠長的層次與水準,因應各種危害:地震、火災、水災、化災,乃至於地震引發的次生災害;相對的,從BCP在供應鍊管理、公關與財務的部份或許是相對較弱的環節,乃於資安等風險類型難以涵括在內

第二個層次的『全』,大概可謂是
1.內部「緊急應變」(各廠層級)=>「營運持續」(公司層級)的整合
2.外部支援單位,如消防單位與醫療體系間的整合(林金宏與石富元幫忙顧問捉刀)
3.透過不同單位間的沙盤推演來建立合作默契,乃至於驗證各種規劃的可行性可用性
對照姚博的架構,罩門會在「危機管理」,乃至於單師所提的:真的狀況發生,是醫院消防隊應變對聽台積的,還是台積聽消防隊應變隊與醫院?

第三個層次的『全』,可謂是認識災害的複雜不確定與未知因素
猜測是透過內部的技術委員會,進行以上腳本與情境的知識管理與經驗擴散
知識管理其實台積隱性的可怕能耐與競爭優勢,越多廠+越多情境,可以累積的知識與經驗就更多=工安與風險管理的馬太效應
然而弔詭的是:由於資安的考量,各廠之間的資訊其實不相流通的(只有透過TB)- 新竹不知道台中或台南的事故.....



沒有留言: