2022年9月3日 星期六

雜訊(5)

雜訊:人類判斷的缺陷

Noise: A Flaw in Human Judgment

https://www.books.com.tw/products/0010893007

 

 

 

22 醫療診斷指引

 

白袍恐懼的血壓上升被診斷為高血壓

第一位醫師開了利尿劑,沒有效果

第二位醫師開了鈣離子阻滯劑,沒有效果

第三位醫師叫當事人買血壓計,量了才發現其實是誤診(多吃很多傷身體的藥)

 

 

醫療雜訊概觀

放射科和病理科深知雜訊的存在=>只不過是相對會留下紀錄

 

醫師診斷的醫療雜訊,只能透兩兩比對=>評分者間的信度(inter-rater reliability)

https://en.wikipedia.org/wiki/Inter-rater_reliability

kappa statistic 來衡量

https://en.wikipedia.org/wiki/Cohen%27s_kappa

kappa=1 意見完全吻合

kappa=0 意見散亂

 

很多腎臟科醫師判讀病患的檢測數據結果時,往往有輕度到中度的意見吻合

 

在美國心臟疾病是男女頭號死因,冠狀動脈攝影攝影是檢查心臟疾病的主要方法,如有一條或多條血管出現70%以上阻塞時,就會建議進行治療(安裝心血管支架)

然而對於主血管是否阻塞超過70%,在30%以上的案例會出現歧見

 

子宮內膜異位透過腹腔鏡診斷,然而讓108位婦科外科醫師看3名病患的腹腔鏡影像(其中兩位有子宮內膜異位,另一位沒有),結果這108位的意見紛歧,診斷的位置和病灶數量都低度相關(=不知該相信誰、沒有可信度)

 

結核病診斷透過胸部X光看肺部空棟部位進行診斷,醫師們診斷判定的一致性只有中度與一般

 

高風險黑色素瘤(皮膚癌)的病理切片診斷,其準確度也只有約60+%

乳房攝影判斷是否有乳癌的偽陰或偽陽的誤判機率都很高

 

因果革命當中的說明

https://eshmanager.blogspot.com/2020/06/24.html

 

WTF…難怪黑天鵝的作者一再提醒讀者注意不要過度醫療(當你年紀不大時,過度醫療其實減損你的壽命)

看到這章,想起公司安排的高階健檢,謎之聲

1.公司認為的福利,對我來說是受罪(不如折現,我期待的只有護士服...)

2.檢查項目越多,越容易找到健康疑慮(造成不要的恐慌+有利於醫院鼓吹當事人極早治療=增加收入)

3.醫院推出(優惠價格)的高階健檢,其實是高明的行銷與詐財:透過各種精密科學儀器檢查+醫師 專業診斷儀式後,有多少高階主管/高薪人士(迷信專業與所謂科學、統計忘光光和貪生怕死的肥貓)能夠逃出白色巨塔的暗黑術式與掌心呢?

4.當想著如何增加自己的韌性、身體健康延年益壽、生涯規劃、財富風險管理時;你/妳其實是脆弱的

5.當你/妳認清死亡是必然,只不過時間早晚與死法不確定,擁抱無常與把所能可能遭遇的不幸當成命運與必然時;你/妳才是自由(掌控自己的人生)與堅不可摧的(敢於付出終極代價做出取捨)

 

 

怎麼樣才能減少醫療雜訊(誤診)

1.尋求第二或第三意見(老人家多跑幾家醫院/浪費醫療資源的智慧XD)

 

2.借助各種深度學習或人工智慧等演算法的判讀(輔助看似專業卻不見得可信的醫師人肉經驗判斷)

 

3.傳統的診斷指引,建立各種評估指標與給分基準

減少主觀判斷的干擾雜訊

 

 

信效度最差的精神病診斷

1964年,一項涵蓋91名病患與10具經驗的精神科醫師,兩個診斷意見一致的可能性只有57%,其餘類似研究的結果也約在50+% (只比亂猜好一點點)

造成精神病診斷雜訊的因素:

醫師不同的思想學派、不同的訓練、不同的臨床經驗、不同的問診風格、對於病患性格行為表現的模糊描述(沒有清晰定義)

 

欸,精神病的診斷是偽科學與偽學科

 

這一章打臉醫界,以下兩章打臉人力資源

那些年我學的HRM人力資源管理

HRM Architecture (1)

https://eshmanager.blogspot.com/2015/10/papers-of-hr-architecture.html

HRM Architecture (2)

https://eshmanager.blogspot.com/2015/10/hrm-architecture-2.html

人資政策與組織權力結構

https://eshmanager.blogspot.com/2016/11/blog-post_19.html#more

 

 

 

23 績效評鑑量表的制定

 

績效評估的結果就是晉升或獎金分配

同一個人或主管,在一家強調合群和諧(每個人薪資差異不大)或在另一家強調競爭/成敗論英雄(薪資差異大),其評比他人或被他人評比的結果會有所不同嗎?(廢話,當然差異十萬八千里)

 

 

Hint

根據Peter Drucker 的觀點,晉升與獎金分配是兩回事

依表現與潛能晉升

依工作份量與難度給薪(獎金)

 

績效評核是判斷工作

1.人人都討厭績效評比(不論是被評比或去評比他人)

2.人人都知道績效評比受到偏誤與雜訊的影響(不客觀公正、不具信效度)

3.人人都知道績效評估沒有單一客觀指標,特別是間接單位、非以量評價的職務

 

績效考核的結果(信效度)20-30%是訊號(當事人的績效變異)70-80%是雜訊(各種偏誤成見、與組織/系統性因素)

=>工作表現和績效評鑑之間知有薄弱的相關性,甚至相關性不足

(e.g., 為了擺脫績效低落的成員,故意給他打好績效,以讓他轉調其他部門)

 

另外想起就Deming系統的觀點,員工對於其產出與績效通常只有6%的影響(work in the system個人變異),而組織文化與各種慣例(system系統變異)的影響卻高達94%

 

 

早就被發現卻沒有解決的問題

HRM1993出版360度回饋制度

https://ctee.com.tw/bookstore/selection/473328.html

優點:

1.超越主管的視野,大幅拓展衡量的範圍,對你的績效評鑑發表意見的人不只是你的主管,還有你的同儕和部屬(當事人只讓自己的主管爽+印象好沒用)

2.評鑑中看重的重點跟著改,滿足組織流動性、專案導向的發展趨勢。(團隊合作>搶績效)

3.意外的好處:取幾個評鑑者的評分計算平均值,儘管有助於減少系統雜訊

 

缺點

1. 回饋制度中增加更多評鑑問題,許多回饋問卷也變得複雜到令人咋舌。為了減少雜訊所付出的成本或許並不划算(時間心力浪費在績效考核上,而非實際的作業與工作上)

2.評量項目太廣太複雜(反而信效度更不彰,大家評比他人回歸第一印象);。部門主管與少數明星員工憑藉光環效應與好印象總是獲得好績效

3. 360度回饋制度也無法倖免於所有績效衡量制度幾乎都有的問題:集體鄉愿。有一家大型企業發現,它有98%的主管都被評為「完全符合預期」。要是幾乎每個人都得到最高評等,那麼我們對這些評等的價值有疑慮也相當合理。(每個人都必須戴上面具,不敢得罪他人,never say no

 

 

為什麼360度績效回饋變得不公平?實施前該思考的三件事

摘錄:

1.360度績效回饋重點,是回饋 (feedback),不是評核

2.參與人的成熟度夠嗎?能否客觀的提供資訊?

3.組織的文化適合實施嗎?是否有信任的組織文化?

https://blog.104.com.tw/why-is-360-degree-performance-feedback-unfair-three-things-to-think-about-before-implementing/

 

 

 

 

改善方式- 相對判斷與排序而非絕對分數

不要用李克特氏1-51-7的量表

e.g., 1-非常差,7-非常好

 

1.結構化(避免光環效應)改用不同構面=>

e.g., 安全意識、助人和群、工作量、工作品質

 

2.相對值與排序(但非強制排序,強制排序其實增加雜訊)

相較於公司平均值

 

3.提供參考框架與評價標準

行為定錨的評量表



 

 

 

24 人員招募結構化

 

召募面試通常只是一種儀式,說穿了只是看對不對眼=依賴直覺判斷

 

 

面試的風險

錄取之後的工作表現通常跟面試的表現關聯性不彰

典型工作面試成績vs 工作績效考核成績 相關係數約在0.2-0.3之間

(和諧率約為56-60%)

以社會科學的標準來看,這種相關性還不錯

但是以決策來看,這樣的結果不理想(只比丟硬幣好一點)

 

 

面試的雜訊

參見Ch.11 客觀的無知

 

公司找人有特定偏見:種族、性別、年齡、學經歷、外貌談吐、地域、宗教

備註:

Google發現一個人大學畢業兩、三年後,學歷與工作表現已沒有直接相關,因此除了社會新鮮人之外,已不再要求檢附成績單。

 

面試者也會做功課,以求通過面試(裝出誠懇、符合公司期待人格特質)

 

不同面試官針對相同面試者的回答作出不同的判讀詮釋(不同面試官判斷的相關係數約為0.37-0.44,和諧率約為62-65%;如果面試人數越多,相關係數與和諧率越差)

e.g., 求職者針對未滿一年的工作經驗,回答的解釋與理由是:發現主管不夠integrity

有的面試官給予這個答案肯定的答案

有的面試官認為這反映出當事人不夠成熟

 

場合雜訊:面試時的氣氛營造與第一印象+握手的手感

 

 

日後的不確定因素

1.適應新職位的速度有多快

2.組織環境如何影響他的工作

3.他自己各種生活事件

 

 

面試官心理學

為何第一印象反而主導了面試的結果與判斷?

e.g.,

看來羞澀與拘謹的求職者,面試官反會更嚴謹的詢問過去經歷(傾向於排除這位候選人)

看來大方和群的求職者,面試官詢問別的重點(傾向於推銷公司、把這人招募進來)=>導致收集的證據不相同

 

第一印象甚至在閱讀書面履歷時就已存在=>面試官對於求職者已經有些自己的解讀與穿鑿附會的想像

 

更糟糕的是,有的公司主管或人事單位,還會自作聰明,設計小測驗(腦筋急轉彎的問題)或現場實作

e.g., 「要用幾顆高爾夫球才能塞滿一輛校車?」、當場簡報或示範教學

=>這讓面試成敗取決於當下的臨場表現與機智問答,否定了當事人過去的長期傑出表現

 

用人公司企圖透過面試過程來「解讀」求職者

其實求職場也透過面試過程來「解讀」這家公司,面試的設計安排反映出這家公司的人資觀念+薪資水準(水準高,才能夠任性地玩弄求職者=>有沒有本事與本錢寧可錯失許多優秀員工,也不希望錄取到的人是庸才亦或寧爛勿缺)

面試就如同人生,充滿各種雜訊與運氣,不需要太在意一時的成敗,要在意長期的努力

 

 

結構化面試流程,以提升篩選品質

Google 超級用人學

https://www.books.com.tw/products/0010799886

 

超級用人學的導讀

https://www.slideshare.net/leechiu3/google-71364935

 

Google的小秘訣+

1.要求面試者在集體溝通與討論前,先個別獨自與獨立評分

2.結構化行為面試 (想清楚該職缺需要的技能面向、人格特質,蒐集相關客觀證據或經歷)

https://baike.baidu.hk/item/%E7%B5%90%E6%A7%8B%E5%8C%96%E8%A1%8C%E7%82%BA%E9%9D%A2%E8%A9%A6/20223542

https://www.kamo.com.tw/%E5%A6%82%E4%BD%95%E5%BB%BA%E7%AB%8B%E3%80%8E%E7%B5%90%E6%A7%8B%E5%8C%96%E9%9D%A2%E8%A9%A6%E3%80%8F%EF%BC%8C%E7%82%BA%E5%85%AC%E5%8F%B8%E5%B8%B6%E4%BE%86%E5%BC%B7%E5%A4%A7%E5%9C%98%E9%9A%8A%EF%BC%9F/

https://mymkc.com/article/content/22969

3.延遲作出判斷決策 (避免第一印象的衝擊+倉促衝動決定)

 

 

 

25 中介評估法

 

專家的直覺與經驗判斷很重要,但不要一開始就用

等到確定相關構面因素+分別收集客觀事實與數據之後

大家進行幾個回和的討論

最後才是依直覺與經驗的判斷



 

沒有留言: