2011年11月19日 星期六

書評筆記:統計,改變了世界(1)

書評筆記:統計,改變了世界(1

這本書讓修了六學分統計的我,自覺其實自己的水準只能拿來唬外行人。
以下為個人不負責任的摘要筆記,並附贈延伸資料的Google連結。

圖片資料來源:清大工工系 桑慧敏老師


與統計革命的幕後功臣相遇

風險=不利事件發生的機率
不確定性:不知道某一事件的發生機率=無法預測

從隨機到統計分配
對於一般大眾而言,隨機(randomness)=不可預測
而統計界數學模式,描述隨機事件的結構(probability distribution),以提供做為某種程度的預測

第一章 淑女與下午茶
費雪考慮了各種實驗方法,來測試那位女士是否能分辨不同的茶。
費雪與實驗設計
Ronald A. Fisher1890-1962
20世紀初任職於農業試驗所(Rothamsted Agriculture Experimental Station ),研究肥料實驗數據,先前90多年的收穫量研究數據,運用「肥力(fertility index)」表達和調整不同土地先天肥沃程度的差異,費雪發現:
1.      肥力的調整,不足以代表不同土地在收成上的差異
2.      降雨量對於生成的影響,遠大於肥料對產量的影響(這點才是農試所人員關切的)
3.      由於「各年度氣候差異」、「各年度的肥料類型不同」+(土壤肥沃度的差異)都會影想當年度作物產量(甚至變因之間可能存在交互作用),所以根本無法推論判斷,哪一種肥料的效果最好!
引此費雪開始思考實驗與實驗設計問題,然而他提出的方法牽涉到非常複雜的數學,大部份科學家無法自行設計實驗
Wiki百科上的實驗設計資料

Randomization
Random assignment is the process of assigning individuals at random to groups or to different groups in an experiment. The random assignment of individuals to groups (or conditions within a group) distinguishes a rigorous, "true" experiment from an adequate, but less-than-rigorous, "quasi-experiment".[12]
There is an extensive body of mathematical theory that explores the consequences of making the allocation of units to treatments by means of some random mechanism such as tables of random numbers, or the use of randomization devices such as playing cards or dice. Provided the sample size is adequate, the risks associated with random allocation (such as failing to obtain a representative sample in a survey, or having a serious imbalance in a key characteristic between a treatment group and a control group) are calculable and hence can be managed down to an acceptable level. Random does not mean haphazard, and great care must be taken that appropriate random methods are used.
Replication
Measurements are usually subject to variation and uncertainty. Measurements are repeated and full experiments are replicated to help identify the sources of variation, to better estimate the true effects of treatments, to further strengthen the experiment's reliability and validity, and to add to the existing knowledge of about the topic. [13] However, certain conditions must be met before the replication of the experiment is commenced: the original research question has been published in a peer-reviewed journal or widely cited, the researcher is independent of the original experiment, the researcher must first try to replicate the original findings using the original data, and the write-up should state that the study conducted is a replication study that tried to follow the original study as strictly as possible. [14]
Blocking
Blocking is the arrangement of experimental units into groups (blocks) consisting of units that are similar to one another. Blocking reduces known but irrelevant sources of variation between units and thus allows greater precision in the estimation of the source of variation under study.
Orthogonality
Example of orthogonal factorial design Orthogonality concerns the forms of comparison (contrasts) that can be legitimately and efficiently carried out. Contrasts can be represented by vectors and sets of orthogonal contrasts are uncorrelated and independently distributed if the data are normal. Because of this independence, each orthogonal treatment provides different information to the others. If there are T treatments and T – 1 orthogonal contrasts, all the information that can be captured from the experiment is obtainable from the set of contrasts.
Factorial experiments
Use of factorial experiments instead of the one-factor-at-a-time method. These are efficient at evaluating the effects and possible interactions of several factors (independent variables).
Analysis of the design of experiments was built on the foundation of the analysis of variance, a collection of models in which the observed variance is partitioned into components due to different factors which are estimated and/or tested.
PS:文章開頭提到的那位女士,她真能夠分辨出加奶先後順序的味道差別(而當時是1920年代,然而90年後,還是可以看到一些鄉民爭論此一問題)

第二章 偏斜分布
皮爾生聲稱這組分布函數,可描述數據的任何一種散布形式。
發現指紋的優生遺傳學家高騰(Francis Galton,1822-1911
在倫敦成立生物統計實驗室(Biometrical Laboratory),測量身高、體重、特定骨頭長度等數據(最早的人因數據!?)
高騰發現:
1.      向平均數回歸(regression to the mean):非常高父母生的孩子,往往比父母矮;非常矮父母生的孩子,往往比父母高
2.      利用「相關係數(co-efficient of correlation)」來測量上述關係
高騰的弟子卡爾皮爾生(Karl Pearson, 1857-1936
把以上觀念進一步衍伸
1.      測量的真值與誤差:實驗/觀察到的數據可能是散亂、隨機的,然而整合所有的數據以後,就可以拿來估計真正的數值
2.      觀測值/誤差值的分布型態,往往是所謂「鐘型曲線」或「常態分布」
3.      發現偏斜分布(Skew Distribution)。描述分布的數值稱為參數 (parameter) — 能夠用來描述分配型態的四個參數為平均數 (mean)、標準差(SD)、對稱 (symmetry)、峰度 (kurtosis)
在皮爾生之前,科學處理的事物是真實而容易查覺,但以上參數背後的科學研究的主體轉變為=>不是那些能夠觀測或掌握的實際事物,而是上述四個描述觀測隨機性的參數;然而我們永遠無法真正找到(母體)參數,只能利用(樣本)數據來估計,這種想法最後成為二十世紀科學的主流(由確定/機械式的哲學觀,轉變為隨機/分布函數的觀點)。
高騰、皮爾生、維爾頓共創《生物統計》期刊,也試圖證明達爾文「適者生存、天澤」的理論。
維爾頓(Raphael Weldon, 1860-1906)=>捉了數百隻螃蟹,一半用乾淨的水養、一半用較髒的水養,結果如達爾文的預測,生活在較髒水里螃蟹的分布參數發生了變化。

第三章 那位親愛的戈斯特先生
隨著「學生」t檢定的發展,統計分布理論悄悄在科學界擴展開來。
戈斯特(William Sealy Gosset, 1876-1937)
在釀酒廠工作研究釀酒發酵要放入多少數量的酵母菌才能得到正確口感的啤酒,而大家想知道的是瓶子當中的酵母菌濃度,然而酵母菌是活的,會不斷分裂複製,所以瓶子中的酵母濃度是不斷變動的,他研究後認為酵母細胞的數目是只有一個參數的卜瓦松分布,不屬於四個參數的皮爾生偏斜分布。
後來開始以匿名「學生」發表論文(以避免被任職公司開除,他死後該公司才恍然大悟)。
發明了很有名、大家學過、很好用的Student T test
在此之前Pearson往往用上千筆數據估算該變數分布的四個參數,而Gosset想的則是:「如果樣本很小,情況會變成如何?」
因此他不斷取出一小組數據,算出它們的平均數與標準差,再把這兩個值相除作圖。結果這個比值和Pearson的四個參數有關,也符合Pearson的偏斜分配=>Chi-Square Distribution
t 檢定解決小樣本的問題,等於間接確認此一小樣本的結果,能否合理代表所欲推估”population參數,也引發假設檢定與顯著性檢定等更深一層的問題。(會做統計檢定、使用t-test的人很多,但是真正了解它的很少=>如果沒有t-test,統計分析必須使用樣本觀測數據的四個參數,去估計population四個參數的估計值,然後在一直估計下去,根本不可能得到真實的四個參數估計值!

同時Gosset也成為兩個敵對天才費雪和皮爾生之間的居間者。
備註:
1.Pearson看不懂fisher更深奧但簡明的數學證明,沒有展現出一個一流期刊主編應有的氣度;另外也由於fisher逐漸把Pearson的研究成果推翻。
2.Fishern 思想右傾、關心優生學;Pearson則鍾情於社會和共產主義

第四章 在肥料堆裡搜覓
第五章 作物收成變化研究
農業試驗所(Rothamsted Agriculture Experimental Station )所長羅素(John Russell)聘請費雪來看看這些堆積如山的數據,針對這些數據做一次統計審查。
Fisher的分析方法
1.      時間序列分析(分解成長波與短波)
小麥生成隨時間的變化趨勢(y=土壤逐漸劣化所導致的整體產量穩定下降(x1+每階段數年的週期緩賣改變(x2)+每年氣候變化(x3)
備註:
一些週期變化現象不過是外部因素引起(EX:當年度是否有學童幫忙除草)
2.      隨機化控制實驗
這個部份已經是現代統計觀念的基礎,抵銷不同土壤肥力差異的影響
3.      變異數分析(ANOVA)與共變數分析(Analysis of covariance)
感謝現代統計軟體,讓我這個數學不好的老粗可以逕行感受分析結果的fu….

費雪的研究成果與數學論文對農業與生物界的科學研究影響甚遠
Fisher的大作Statistical Methods for Research Workers
一個也是讓人搞不清楚的抽象概念:自由度(背後是多維空間幾何的觀念)

沒有留言: