網頁

2011年12月11日 星期日

書評筆記:統計,改變了世界(3)

書評筆記:統計,改變了世界(3

這部分最後會提到費雪反對抽菸與肺癌間有因果關係的理由,也讓人意識到統計背後其實有很深的科學哲學和邏輯義涵...




第十三章 貝氏異論
貝氏(Reverebd Thomas Bayers, 1702-1761)發現可以計算後面事件已發生的條件下,前面事件發生的機率。
第八世紀的威尼斯共和國的「元老」選舉,以候選人用的蠟球抽籤模式來說明「條件機率」。
一些條件機率的論文被發現,對後續研究的影響深遠=>用案例對照的方式來計算某種治療法或條件下罹患疾病的機率。
而貝氏異論,更勁爆的用法,則是用來倒推估計參數
貝氏階層模型
EX:如何判定不同文章的作者為AB
看用字遣詞的形態是是比較接近AB
然而問題在於有爭議的那篇文章,是否剛好有用到那些足以釐清AB兩者文筆差異的關鍵字詞…=>如果沒有,則一樣無法判定
主觀機率
Probability=>描述主觀的不確定感
世界上並沒有已被證明的科學事實”=>相同命題對於不同人有著不同的信仰程度
事前(信仰)機率=>所見的數據/事實=>事後機率
EX:三浬島核電廠操作人員,相信所有警告訊號都是誤警報(即便有再多訊號/事實,也無法改變其事前的認知)


第十四章 數學界的莫札特
俄國數學家柯莫格洛夫 (Andrei N. Kolomogorov, 1903-1987)
柯莫格洛夫解決的第一個理論問題是:機率真正的數學基礎是什麼?
找出一個事件的機率,就像是找一個不規則形狀的面積
機率論的公理化
第二個問題是:面對長時間收集來的數據,我們可以做什麼?       
擲骰子,因骰子是沒有記憶的,所以每次數據是獨立的,然而更多時候,數據間有前因後果的關連性,因此不是獨立,稱作「隨機過程」
最後一個更重要的問題是:
在現實生活中,機率的意義是什麼?
如何把抽象的公理和現實狀況融為一體?(靠,這部份,本書的作者在page 165第七行 竟然是『把機率視為……』)
備註:這個部份敝人的理解是=>外部效度的詛咒,科學研究,我們永遠只能說:在此一研究的抽樣範圍與時空情境下,我們得到OO推論結果,而此一OO結論,無法外推一般化,推論在XX情境下時也成立!

第十五章 F. N. 大衛
Florence Nightingale David, 1909-1993(書上,誤植為1995)
她想當個保險精算師,但當時這個行業只招男生。
. . 大衛是南丁格爾世交的女兒,在第十五章談到她的故事,她想當個保險精算師,但當時這個行業只招男生,所以她去幫皮爾生工作,還照顧皮爾生的晚年。最後到了美國加州柏克萊大學分校,繼承尼曼成為系主任。她著有《組合機遇》(Combinational Chance) 是關於組合數學( combinatorics) 的經典作品


第十六章 無母數方法
Frank Wilcoxon1892-1965
威爾考克森用t-test發現離群點會使t檢定結果變小,然而又不應該刪除離群點(因為沒把握至這些點真的是所謂「異常」、「離群」)
於是發現與開啟了無母數檢定這扇窗=>不需假設參數型態,只要把觀測數據的分散情況和純隨機分布的預期狀況相比較。
無母數方法和常態分布間的關連性:
1.      如果數據有已知的參數分布,那改用無母數方法來分析,情況會有多糟?
2.      如果數據不符合有參數的統計模型,那數據要偏離多遠,才知道適合用無母數方法來分析?
以上問題突破來自於E. J. G. Pitman(1897-1993)
第一題答案是:沒差,只是檢定力會比較小
第二題比較嚴肅:如果離群值很少、而且來自於「錯誤」的觀測值,則使用無母數方法可以減少其對結果的影響;然而如果離群值本身就是系統的因素,則改用無母數方法可能會使情況更糟!

第十七章 當部分優於全體
我們可以用一種隨機化的機制,由大母體當中選取出個體。
當部分優於全體,是關於印度馬哈拉諾比斯的隨機樣本理論。1920 年代馬哈拉諾比斯曾到英國唸研究所,同時受皮爾生與費雪的指導。他研究要怎麼取得具有適度代表性的數據樣本,推論可以用一種隨機化的機制,由大母體當中選取出個體,也就是隨機樣本 (random sample)
隨機樣本比判斷樣本好、也比便利樣本好
主要是隨機樣本能夠計算出一個範圍,正確答案落在這個範圍的機率很高


第十八章 抽菸會致癌嗎?
費雪是在處理一個深層的哲學問題:「因果關係」代表的意義究竟是什麼?
費雪是個老煙槍,他堅決主張這些抽菸會導致肺癌的數據都是有瑕疵的
備註:
費雪的觀點應該是說,這些證據只有相關性,而無因果關係,換言之都只是歸納與推理,其背後真正的因果尚不可知(他懷疑得肺癌是基於某些基因的影響,而在這些研究中,沒有random,所以推論效力讓人懷疑!)

沒有留言:

張貼留言