工作的關係,常接觸風險與統計數字(閱讀不少關於風險評估的報告),意識到清楚風險、機率與不確定性其實是三回事(只是絕大多數同行雞同鴨講以訛傳訛與自愚愚人),但遠不到可以清楚跟別人講述解釋這三者的差別
(從費曼學習法的觀點而言,就是自己還沒有搞清楚;想起當年部門的陳博士進行Wet Bench機台的風險評估,看似也是評估發生機率與嚴重度,但他用的表述是:risk priority number (RPN)而不是風險高中低,精準的用詞不愧是博士的水準與格調)
資料來源
The Art Of Uncertainty – David Spiegelhalter’s Guide To Risk And Luck
https://www.youtube.com/watch?v=WYZ46U_vd_A
Why Understanding Statistics Is a Fundamental Part of Life feat. David Spiegelhalter
https://www.youtube.com/watch?v=QNjlnNQQQYo
Chance, luck, and ignorance: how to put our uncertainty into numbers - David Spiegelhalter
https://www.youtube.com/watch?v=Cybnip2Kyw0
Disclaimer: 資料代勞整理NotebookLM
看待統計和機率數字的心態與哲學思維:
- 機率的本質:機率並非事物固有的屬性,而是人類發明的概念,用來理解和結構化我們對隨機性、機會和可能性的認知。它不是一個可以直接測量的物理量,而是一種評估和判斷。
- 機率(預測)帶有主觀性,是基於個人知識和信念所做的判斷,人們發明用來表達不確定性的。不同的人可能因為掌握的資訊不同,對同一事件的機率有不同的評估。對於基於機率的主張應保持謹慎。由於人類直覺在機率判斷上存在偏差,因此需要透過冷靜、理性的分析來思考,避免快速、直觀的判斷。
- 機率在實際應用中的價值:在某些控制良好的情況下,例如賭博、保險和年金,機率可以有效地運作。在這些情況下,機率可以被用來建模和預測群體的行為,但無法具體預測個體的結果。
- 機率是對個人無知的表達:機率反映的是個人對於未來、現在或過去事件的無知程度。這種無知是個人與外部世界之間的一種關係,而不是外部世界本身的屬性。每個人對同一件事的機率評估可能不同。
- 機率是基於判斷和假設的建構:即使是看似客觀的機率評估,例如投擲硬幣出現正面的機率是 50%,也是基於「硬幣是均勻的」這個假設。所有機率都是建構出來的,並非真實存在。
- 貝氏思維:貝氏思維將機率應用於個人的無知,體現在我們談論胎兒是男性或女性的機率時。刮刮樂也是認知上的不確定性例子,因為中獎與否已成定局,只是尚未揭露。
區分不同類型的不確定性:
- Aleatory 不確定性(機會):事件在發生前,結果是隨機的、無法預測的。例如,投擲硬幣前,我們無法知道硬幣會是正面還是反面。
- Epistemic 不確定性(認知):事件已經發生,但我們因為知識不足而無法確定結果。例如,硬幣已經被投擲並遮蓋,我們不知道是正面還是反面。
拆解不確定性:要將不確定性化為數字,需要對不確定性進行分析,更深入地思考「不知道」的原因,而不是簡單地說「我不知道」。也就是說要慢慢思考,不要倉促決定。
使用適當的評分規則:可以使用評分規則(例如 Brier 評分規則)來評估機率預測的準確性。評分規則可以鼓勵誠實的機率表達,避免過度自信或不足。
Brier 分數的範圍是 0 到 1,其中 0 分表示預測非常準確,1 分表示預測非常糟糕。實際上,Brier 分數為 0.25 可能表明預測結果僅比隨機猜測略好,而分數接近 0 則表示預測準確度較高。這個範圍使得 Brier 分數成為比較不同模型或預測方法的有用工具,因為它提供了標準化的性能衡量標準。
運氣、巧合與創造好運
運氣有三種:
- 構成性運氣(Constitutive luck):指出生時所擁有的條件,如時代、國家、階級、家庭、基因等,這些是個人無法控制的,但對其未來有極大的影響。
- 環境運氣(Circumstantial luck):在正確或錯誤的時間出現在正確或錯誤的地點。
- 結果運氣(Outcome luck):在特定情況下,最終結果如何。
巧合的本質(=以上運氣的組成):巧合是意料之外的事件的幸運組合。
人們傾向於將巧合歸因於外部力量,如命運或神的旨意。
但作者認為巧合更多地與個人的觀察力和行為有關。e.g.,
- 「我認為,在某種程度上,我們創造了自己的運氣和巧合。」
- 「重要的不是發生了多少巧合,而是有多少潛在的巧合沒有被注意到。」
隨機性:隨機事件傾向於聚集(接二連三),而不是均勻分佈。
創造自己的幸運
作者引用心理學家 Richard Wiseman 的研究,認為幸運的人通常有更積極的態度、更開放的心態、更勇於冒險。
「承擔一些風險是很好的,但不要魯莽,不要做你輸不起的事情。」
風險的溝通與表述
風險溝通:在風險溝通中,區分相對風險和絕對風險至關重要,相對風險和絕對風險是兩種不同的風險概念,它們之間的差異在風險溝通中非常重要:
相對風險 (Relative Risk):相對風險是指一個群體相對於另一個群體,發生特定事件(例如疾病)的風險程度。它通常表示為兩個群體風險的比率。e.g., 觀看盒裝影集(box set)可能會增加肺栓塞的「風險」。這是一個相對風險的例子,但實際上,研究顯示需要每晚觀看 5 小時的電視,持續 19,000 年才可能發生肺栓塞。
絕對風險 (Absolute Risk):是指在特定時間段內,特定群體中發生特定事件的實際機率。它直接表示事件發生的可能性大小。e.g.,在特定人群中,每年發生肺栓塞的絕對風險是多少?這會直接給出一個具體的機率,例如「每年每 10 萬人中有 X 人發生肺栓塞」。
兩者差異:
- 表示方式:相對風險表示一個群體相對於另一個群體的風險倍數,而絕對風險則表示特定群體在特定時間內發生事件的實際機率。
- 資訊量:相對風險可以誇大風險的感知,因為即使絕對風險很小,相對風險的增加也可能看起來很大。絕對風險則提供更全面的資訊,幫助人們了解實際的風險大小。
- 應用:在政策制定和個人決策中,了解絕對風險通常更為重要,因為它有助於評估干預措施的實際效果。相對風險可能在研究中用於比較不同風險因素的影響,但需要結合絕對風險來解釋結果。
很常在健康食品廣告或流行病研究報告中看到以上issue
統計、因果與法律判決
統計與因果關係:統計學在因果關係的判斷中扮演重要角色。
在法律和氣候變遷等領域,人們使用流行病學證據來發展「因果關係的機率」(probability of causation),以評估特定因素是否導致特定結果。
概率的因果關係並非要證明絕對的因果關係,而是要評估特定因素導致特定結果的可能性。
這種方法適用於難以確定直接因果關係的情況,例如涉及多種潛在因素的複雜情境。
統計學可用於評估的因果關係,但需要謹慎使用,並結合其他證據來進行綜合判斷。
因果關係區分為"一般因果關係”和”特定因果關係”時。
一般因果關係(General Causation):
這指的是「特定因素是否普遍會導致特定損害」。例如,研究戴奧辛是否會導致癌症,或飲食習慣是否影響健康。
統計學家會使用流行病學研究、臨床試驗和觀察性研究來評估一般因果關係。這些研究旨在確定"暴露於特定因素與特定結果之間是否存在統計上的關聯性"。
這些研究通常會計算風險比(Risk Ratio)、勝算比(Odds Ratio)和信賴區間(Confidence Interval),以量化暴露與結果之間的關聯程度。
如果研究結果顯示,暴露於特定因素會顯著增加特定結果的風險,則可以初步認定該因素具有一般因果關係。
特定因果關係(Specific Causation):
這指的是在特定個案中,特定因素是否確實導致了特定損害。例如,確認某化學工廠的致癌物,是否導致在該工廠工作的某人罹患癌症。
確定特定因果關係比確定一般因果關係更具挑戰性。統計學家需要結合流行病學證據、臨床證據和個案的具體情況來進行評估。
評估特定因果關係時,需要考慮"其他可能的致病因素"及"個案的個人風險因素"。
在民事案件中,原告通常需要證明「因果關係的可能性大於一半(a probability of causation was greater than a half)」。換句話說,原告需要證明,特定因素導致損害的可能性高於 50%。
評估方法:
- 流行病學研究:使用流行病學研究的數據,評估暴露於特定因素與特定結果之間的關聯性。
- 風險比(Risk Ratio):計算暴露組與未暴露組之間,特定結果發生的風險比率。如果風險比大於 2,則通常認為因果關係成立的可能性較高。
- 勝算比(Odds Ratio):計算暴露組與未暴露組之間,特定結果發生的勝算比率。
- 統計模型:使用統計模型來調整其他潛在的干擾因素,更準確地評估特定因素的影響。
- 歸因研究(Attribution studies):這是一種新興的研究領域,旨在評估特定事件(例如極端天氣事件)與特定因素(例如人為氣候變遷)之間的因果關係。幫助確定特定事件在多大程度上是由人為因素造成的
- 使用"模型"和"統計分析"來評估,在沒有人為氣候變遷的情況下,特定事件發生的機率有多大。
- 氣候模型:使用氣候模型來模擬在不同情境下,特定事件發生的機率。例如,模擬在沒有人為氣候變遷的情況下,特定熱浪發生的機率有多大。
- 統計分析:使用統計分析來比較不同情境下,特定事件發生的機率。例如,比較在有人為氣候變遷和沒有人為氣候變遷的情況下,特定熱浪發生的機率。
- 歸因研究的結果可以試圖回答以下問題:
- 在多大程度上,特定事件是由特定因素造成的?
- 特定因素在多大程度上,改變了特定事件發生的機率?
因果革命
https://eshmanager.blogspot.com/2020/06/34.html
統計證據的局限性:
- 統計證據只能提供因果關係的"間接證據(相關性)",而"不能證明絕對的因果關係"。
- 相關性不等於因果關係。即使在統計上存在顯著的關聯性,也不能斷定特定因素就是導致特定結果的原因。
- 統計證據容易受到誤(Bias)、混淆因素(Confounding Factors)和隨機變異(Random Variation)的影響。
- 在法律上使用統計證據時,需要非常謹慎,並結合其他證據來進行綜合判斷。
法律上的應用:
在法律背景下,這通常意味著要確定,"特定行為或暴露" 是否 有可能導致了某人的"損害或傷害"。
- 在民事訴訟中,原告通常需要證明「因果關係的可能性大於一半」,才能勝訴。
- 這意味著,原告需要提出足夠的證據,使法官或陪審團相信,特定因素導致損害的可能性,高於 50%。
- 在某些情況下,法律可能會規定,如果風險比大於 2,則推定因果關係成立。
- 概率的因果關係強調的是可能性,而不是確定性。
- 在法律和科學領域中,這只不過是一種在不確定性的情況下,做出合理的判斷和決策的方法(簡易法門)。
如何看待各項風險與機率數字報導
- 驗證資訊來源
- 為什麼我會被告知這些? 了解資訊背後的動機。
- 這個資訊來源值得信任嗎? 評估資訊來源的可信度。
- 這個數字值得信任嗎? 判斷數字是否真實可靠。
- 這個詮釋值得信任嗎? 判斷資訊提供者對數字的詮釋是否合理
- AI 的不確定性:在人工智慧(AI)領域,特別是大型語言模型。目前的 AI 系統傾向於以絕對的自信表達,即使它們的結論可能不正確。因此,開發能夠提供良好校準的信心陳述(well-calibrated confidence statement)的 AI 系統至關重要。
David Spiegelhalter對於風險、機率與不確定性的結論與建議:
- 對機率的主張保持謹慎。由於人類的直覺在機率判斷上常常不準確,因此面對任何基於機率的說法時,務必保持懷疑和批判的態度。作者強調,機率並非事物固有的屬性,而是一種人為建構的概念。因此,需要透過冷靜、理性的分析來思考,避免快速、直觀的判斷。
- 理解相對風險與絕對風險的差異:媒體報導中經常混淆相對風險和絕對風險,導致公眾對風險產生誤解。在評估風險時,應關注絕對風險,了解事件在特定人群中發生的實際機率,而不是僅僅關注風險的相對增加。
- 檢視資訊來源的可信度:在接收到任何資訊時,應首先評估資訊來源的可信度。思考資訊的目的: 捫心自問:「我為什麼會被告知這些?」。了解資訊背後的動機,以及誰希望你接收到這些資訊。
- 評估資訊來源: 檢視資訊的來源是否值得信賴。例如,某些研究報告可能來自特定利益團體,這可能會影響研究結果的客觀性。
- 判斷詮釋是否合理: 即使數字本身是正確的,也要判斷資訊提供者對數字的詮釋是否合理。他們是否將相關性誤解為因果關係?他們是否誇大了問題的嚴重性?
- 擁抱不確定性:不確定性是生活中的一部分,我們應該學會接受並享受它。過度追求確定性可能會導致生活變得乏味。
- 積極創造自己的幸運:雖然許多事情是機運使然,但我們也可以透過積極的態度和行為來創造自己的幸運。
- 抱持積極的態度,尋找機會。保持開放的心態,勇於冒險。敢於探索,並從經驗中學習。
- 認識到運氣的重要性: 承認運氣在生活中扮演的重要角色。這包括構成性運氣(出生時的條件)、環境運氣(在正確的時間出現在正確的地點)和結果運氣(事件的最終結果)。
- 對AI 保持戒心: 人工智慧在許多情況下會被誤用和濫用,以避免過度自信和錯誤的資訊傳播。
![]() |
面對無常與不確定,保持心平氣和與接受壞運是優雅的修練 |
沒有留言:
張貼留言