2011年12月10日 星期六

相關性不等於因果關係(舊文翻新)

是說 看到以下聳動的標題文章
http://shuchuan7.blogspot.com/2011/11/pm25.html

這篇文章其背後有待科學證明的命題是=>PM2.5是造成國人肺腺癌的主因
有趣的是,發表看法的是一位眼科醫師(而非肺癌專科醫師)

想起統計大師Fisher是個老菸槍,然而他卻質疑吸菸造成肺癌的統計推論:
他的邏輯是:
根據臨床調查,得肺癌的人,有七成的人有抽菸的習慣;那如果說得肺癌的人,有八成已經結婚;是否我們可以推論說=>結婚導致肺癌

而這個梗的關鍵在於:如何釐清相關現象背後真的存在有因果關聯?

只是通常把相關性錯誤解讀詮釋為因果關係的情形太多了。
以下舊文大家可以參考賞味一下


2010-11-12 中國時報 【單厚之/台北報導】
     針對八輕興建問題,環保署長沈世宏昨天在立法院提出「生命品質指標」的概念,強調六輕存在十年來,雲林人壽命都增長,每人的生命增加兩百多天,任何的政策都可能減少人的生命,但也同時增長人的壽命,應該要綜合考量。

     沈世宏答詢時表示,一個開發案應該要綜合考量整體的利弊,國外的環評是開發單位去做,可以做綜合考量,而我們的環評是環保署做,只能考量環境,即便綜合考量是有利的,也不能考慮環境以外的其他因素,「這是環保署為難的地方」。

     對於有學者指出八輕運轉將使國人平均壽命減少二十三天,沈世宏表示,如果只看這個因素,當然不應該蓋,但也必須要回頭想想,「有沒有什麼是因為它的存在而讓民眾活更久的?」

     沈世宏指出,六輕興建十年來,雲林人的壽命還是增長,每人增加兩百多天的生命,並沒有因為六輕的存在而減少。他表示,任何生產活動會讓民眾的壽命簡短,但帶來的經濟利益,也會讓壽命增長,加加減減之後,還是變長命,這叫「生命品質指標」。

     沈世宏語出驚人的說,學者講的是事實,但雲林人壽命變長也是事實,「只是死的方法不同而已」,過去很多人因為生物性(指一般疾病)死掉,現在這些都治好了,只有癌症比較難治。他強調,人的壽命越來越長,與經濟變好有關,應該要綜合考量這些事情;雖然他沒有最終答案,但大家應該應該要坐下來討論此事。

     劉建國相當不滿的當場反問沈世宏,是否敢保證如果國光石化通過環評營運,國人的「生命品質指標」會朝正向發展?沈世宏則說「我不敢講」,所以才要討論會是朝正向還是負向發展,把縮短壽命和增長壽命的影響加總,最後是環評委員要去審查的事情。


評論:
就以上這個例子來說,
甲說:因為蓋了工廠,提高了當地局民的收入與改善生活水準,所以居民的平均壽命提高(可以多活200天)
乙說:因為 蓋了工廠,排放的污染衝擊當地居民的健康,所以居民的平均壽命會將低(會少活OO天、罹病機率增加XX%)

我說:甲和乙都是嘴砲,因為邏輯都合理,只有做實驗或實證才有辦法證明誰說的比較合理。

先前轉載文章-專家才是最大的災難當中,指出環安的議題其實具備社會科學的特質,例如:
無法做實驗
有許多干擾變數
涉及個人的價值判斷,觀念無法放諸四海皆準
 以上述這個Case為例,從自然科學的角度與研究方法而言,實驗設計與迴歸方程式都很"單純":
一個被解釋變數/應變數=>居民壽民/存活天數
解釋變數/自變數有兩個=>生活水準/收入差異和是否有附近工廠
實驗組:工廠附近的居民
對照組:工廠以外的居民
 選取樣本時候,只要留意兩個族群的年齡與收入不應有顯著的差異或random即可,如果有需要可以在加作另一組工廠設置前後paired的比較

看出問題了沒?

所以
在釐清什麼是影響居民壽命的關鍵因素之前,甲跟乙都只是在打嘴砲,然而卻又不可能做實驗對照。
說不定生活水準與環境污染對於居民壽命的解釋力比不上居民的生活習慣差異(例如是否抽菸喝酒吃檳榔...)
換言之,結果可能不具代表性。

另外
甲跟乙兩人的科學唬爛、數字說服和辯論技巧都太差

甲君沈兄斷章取義,說因為建了工廠,所以經過十年,居民的平均壽命增加多活了兩百天
乙君劉兄怎麼沒去比較整個台灣地區或其他縣市居民在同樣的十年當中的壽命增加幅度?會不會經過十年來的經濟發展,對照組的其他縣市居民,平均壽命增加了500天(數字僅為舉例),反而意味與顯示實驗組的居民在同樣生活水平提升的過程中,受到一些因素的傷害,所以壽命增加幅度低於"平均值"......
反過來,甲君怎麼沒直接反駁乙君劉兄說:實證顯示,生活水準與人民壽命相關,而且是呈現統計學上的"顯著"正相關........

欸,
懂的看門道,不懂的看熱鬧
各大專院校的環安衛系所都有教統計 雖然真正聽懂與會用的人還是不多
關心環安事務的兩造雙方捧油們,大家能不能基於事實與數據來一同努力?

沒有留言: