品質與系統角度看事故原因與分類
從戴明系統運作與品質管理的角度來看,缺失與不良品可以歸類為兩種狀況
- 一種是隨機出現、無法預測的不良品(outlier )
- 另一種是系統不穩定(variance & trend),隨時間的長期趨勢;可以經由持續改善,提高系統穩定度與良率(或者隨著時間過去,機器設備老化而越來越不穩定)
借用以上品質系統管理的觀點來看事故的發生,也可以將事故區分為兩種狀況
- 一種是意外:陰錯陽差與上帝的旨意=>無法預料≒難以避免
- 另一種是意料之中的溫水煮青蛙(drift to failure),可以預防與避免,只不過通常因為集體鄉愿或者難以抗拒熱力學二定律,導致許多意外(Accident)的發生經常是合情合理的
而出了人命上了法庭的時候,法官通常也只能依據common sense 來推論這些意外事故都是由於過失所造成,因此某些人要被推出來當戰犯,肩負業務過失(應為能為而不為)致人於死的刑責
從風險管理的角度來看(以上兩種類型)事故的預防
首先要搞清楚
這個意外到底是不是意外?
第一種(無法預料的)意外
1.最簡單的對策是認命+拜拜
第二種 (可以預料與管理的)意外事故
1. 建立制度與管理
1.1各種危害情境的分析與風險評估
2. 系統性思考(不要讓各種規章制度成為形式主義)
2.1 沒有問題才是大問題
(抗拒熱力學第二定律的最佳方式就是定期自我迭代)與韌性工程
結論與建議
從事故的分析與事發因果關係探討
- 必要條件(event view):火災三要素,當事人犯錯+某個關鍵元件或功能失效
- 充分條件(Systemic and Organizational view):不安全的行為、不安全的環境、不當的管理、為了短期績效而賭一把
- 下醫醫病(修理犯錯的人與故障的設備)、中醫醫人(改變觀念建立組織安全文化)、上醫醫國(讓組織改善體質與持續改善)
如何分類事故與定義風險,決定了風險管理的格局與水準
- 98%都是人為疏失=>發展出各種行為安全的管控作法
- 人會犯錯/設備會故障=>發展出保護層與可靠度工程的觀點
- 機器設備是死的,人會受各種壓力與誘因影響,各種因素交互影響=>組織安全文化/人因工程/ Swiss Cheese/ Complexity System
- Normal Accident vs High Reliability Organization=>Resilience Engineering and 迭代持續改善
風險管理人員或專家是人不是神或神棍,也不應該是神或神棍
- 無法預料事故發生的5W1H
- 風險管理不是Silver Bullet- 作了OO或XX就可以確保永保安康
- 風險就是無法被管理:本質(本體論)上的不確定性、認識(論)上的認知偏誤與扭曲+ 風險是眾人之事,眾人之事=政治(風險評估的方法論可以非常”科學”,但科學無法決定政治 e.g., 核電安不安全?萊豬能不能吃)
---------------------番外篇 業界所謂的All Risk Management---------------------------
Risk Management. Benchmark-
第一個層次的『全』=可謂依據FEMA All Hazard Approach跨不同災害類型,用同一套指揮系統與架構來因應
以台積的管理架構,這個「全」≒「缺」=>(侷限)在廠長的層次與水準,因應各種危害:地震、火災、水災、化災,乃至於地震引發的次生災害;相對的,從BCP在供應鍊管理、公關與財務的部份或許是相對較弱的環節,乃於資安等風險類型難以涵括在內
第二個層次的『全』,大概可謂是
1.內部「緊急應變」(各廠層級)=>「營運持續」(公司層級)的整合
2.外部支援單位,如消防單位與醫療體系間的整合(林金宏與石富元幫忙顧問捉刀)
3.透過不同單位間的沙盤推演來建立合作默契,乃至於驗證各種規劃的可行性可用性
對照姚博的架構,罩門會在「危機管理」,乃至於單師所提的:真的狀況發生,是醫院消防隊應變對聽台積的,還是台積聽消防隊應變隊與醫院?
第三個層次的『全』,可謂是認識災害的複雜不確定與未知因素
猜測是透過內部的技術委員會,進行以上腳本與情境的知識管理與經驗擴散
知識管理其實台積隱性的可怕能耐與競爭優勢,越多廠+越多情境,可以累積的知識與經驗就更多=工安與風險管理的馬太效應
然而弔詭的是:由於資安的考量,各廠之間的資訊其實不相流通的(只有透過TB)- 新竹不知道台中或台南的事故.....
沒有留言:
張貼留言