2011年12月17日 星期六

書評筆記:統計,改變了世界(4)

書評筆記:統計,改變了世界(4
從這部份開始Cox Wilks等對敝人而言,不再是一些檢定方法的名稱,而是一些活生生的人物;還有這些大人物之間竟然都有關係。
這部份也是小格針對這本書筆記的完結篇,對於統計有fu的朋友們,可以看看最後的結論,應該會有些收獲與震撼。


第十九章 若您要的是最佳人選……
George W. Snedecor1881-1974
在愛阿華州立大學成立全美第一個統計系(1930年代?)
從斯內德克推薦科克斯開始,「最佳人選」經常是位女士。
Gertrude Cox, 1900-1978

第二十章 威爾克斯:一個樸實的農家小孩
統計是數學的一個分支,同樣面臨應用或理論的分歧爭議,他使盡全力,讓數理統計成為一種實用的工具。
Samuel S. Wilks 1906-1964
逐次分析 sequential method(現在已經沒有機密可言)

第二十一章 家裡的天才
迪亞科尼斯一生的經歷與I.J.古德大不相同,但兩人從小都很喜歡數學謎題。
這章,我只看得懂投影和轉軸的部分概念

第二十二章 杜奇,統計學界的畢卡索
對正確的問題有個近似的答案,勝過對錯的問題有精確的答案。
John Tukey, 1915-2000
普林斯頓統計系創系主任,他的名言就是「對正確的問題有個近似的答案,勝過對錯的問題有精確的答案」是來自於他的工作經驗。他長期身兼兩份工作,一是在大學教書,另一份則是在貝爾實驗室,他提出交互作用一維自由度、快速傅立葉變換 (FFT, fast Fourier transformation)
、杜奇簡易檢定 (Tukey’s quick test)、杜奇引理、(Tukey’s lemma)、探索資料分析 (exploratory data analysis),可以檢視電話線路的數百萬筆隨機誤差和問題和處理天文數百萬筆數據資料。自創平方根圖 (root gram)、盒狀圖(box plot)…等圖形和記號,也創造今天我們廣為使用的兩個英文單字「bitbinary digit(位元) 和「software(軟體)

第二十三章 處理有瑕疵的數據
把這些看似有問題的數據剔除,只會使結論產生偏差。
任何一個有格調的科學家,都不應該丟棄那些看起來有問題的數據!
。博克斯是費雪的女婿,他對統計學的貢獻之一,就是創出了「穩健」這個術語
box and cox transformation


第二十四章 改造產業界的人
戴明認為顧客要的,並不是「完美」的產品,而是「可靠」的產品。
他認為發現AB兩者間的處理差異是否顯著並不重要,重要的是差異的「程度」
統計學家要對實際問題感到興趣,必須學會統計推論與了解其極限,越暸解一個推論的極限,這個推論越有用!
善哉斯言。

第二十五章 黑衣女士的忠告
坎利芙認為,統計學家的工作之一就是要告訴大眾,數字是很有趣的,應該留辛哪些有趣的發現。(另外也要審閱各種數字,質疑它們看起來為什麼是這個樣子)
Stella Cunliffe
人是最大的變異來源,不可能沒有偏好、沒有成見….政府官員做決策時,很少仔細檢驗手邊現有的數據
是平賭序列 (martingale) 的發展歷史。長期以來,醫學界一直在尋求對疾病有效的治療法,但要量測什麼數據?要如何整理這些進進出出醫院的病人資料? 這一章提到許多統計學家的研究與努力。由拉維、阿倫、安德生、基爾、奧爾森、到魏立人,這是跨越很多國家的研究。

第二十六章 平賭序列的進展
奧斯陸大學的阿倫瞭解到,臨床試驗病人的反應方式就是一種平賭序列。
充血性心臟衰竭
平賭序列martingale

第二十七章 臨床研究與統計分析
找不出差異,並不代表兩種療法的效果一樣。
這章作者才真正掀開了底牌,告訴大家有關看待P值的正確觀念(學校統計交待這部分的觀念可謂使亂終棄
Hint P值是研究人員事前給定的門檻,判定兩種方法是否有顯著差異應該視情況而定(所以至少90%的碩博士、學術界人士都誤用了P-Value與統計檢定)
戴明等人反對統計檢定的理由:真正應該估計的是參數分布的形態,藉由P值等假設來進行分析,都只是間接處理這些參數,是沒有意義的!

第二十八章 電腦萬能
這種以「基里文柯—坎特里引理」為基礎的新統計方法,只存在於高速電腦的世界裡。
談到幾個統計理論與電腦運算功能之間的關係。如以「基里文柯—坎特里引理」為基礎的新統計方法,只存在於高速電腦的世界裡。另外,艾夫隆創造出一種「拔靴帶」(boot strap) 的方法,計算過程中,數據會被自己的結構一個一個引出來,好像皮靴的帶子一排排地鬆開,電腦可以快速處理這些數據。作者也提到重抽樣 (resampling) 及其他電腦密集法 (computer-intensive methods)

第二十九章 期待下一場科學革命
在進入二十一世紀時,統計革命已在科學界取得勝利,統計觀點已經擊敗了決定論。
哲學探討的內容其實是日常文化、觀念和行動背後的基本假設條件,我們從教育、日常生活乃至於宗教文化中學習到我們的世界觀,這些世界觀其實受到許多隱晦的假設所控制,只有極少人才能察覺這些假設。哲學與科學研究讓我們揭開這些假設檢驗它們的存在理由與正當性!
最後作者的三個大哉問
1.      我們能用統計模型做決策嗎?
=>邏輯與機率推論檢定往往相互矛盾!
2.      機率在現實生活中的意義是什麼?
=>所謂事件空間往往很不容易確定!
3.你我真的了解機率嗎?
每個人對於機率值的認識(主觀偏見?)、用途(義涵)

下一個科學革命或許就是要格統計的命,讓我們的心靈和科學觀念不要囿限於機率與參數估計。

延伸閱讀資料
現代統計學的發展:

沒有留言: