此書以由簡入深的方式,起初先介紹平均數、中位數、離群值、變異數、標準差等基本統計知識,還有直方圖、莖葉圖等讓人能從簡易圖形中看出數據所代表的意義,讓初學者不會對統計感到害怕或陌生。在第三章的機率中,最令我印象深刻的即為「貝氏定理」,也就是條件機率,記得高三在準備機率這單元時,就是因為貝式定理而深深覺得此章節相當有趣,因為此章節能讓我們更釐清在資訊不完整,且有實際風險的情況下,如何利用所學的這些抽象觀念去做出明智的決定。
不過本書雖然是以漫畫方式呈現,但依舊有我看完後未能理解的內容,例如隨機變數章節中,為何隨機連續變數中,所有結果的機率都是零?雖然此書仍有不懂之處,但就像書中舉例一個人拿六塊錢出來賭,如果擲出正面可以賺十元,擲出反面就全賠,乍聽之下往往會讓人覺得好像還頗公平,殊不知在經過機率求證後,期望值竟然是五元,代表賭的人在賭之前即已期望虧錢。從這個例子中也更讓人得知若懂得善用機率,就能避掉諸多較容易輸的賭注。
在雙分佈記的單元中也介紹了耳熟能詳的伯努力實驗和棣美佛-拉普拉斯定理中的常態分佈鐘型理論。在信賴區間中,介紹了在製做選舉民調時,可利用增加抽樣樣本,以達到增加信賴區間,但就算已有九十九趴信心水準,依舊會發生落選的可能,因為其中可能也包含了回應誤差、不回應誤差和實際投票者,也就是實際上估計的比例應等於真正比例加偏差加隨機抽樣誤差,或是其他因素,例如民調調查經費有限無法全面調查而對結果有影響,因此實際上我認為民調主要做為參考即可,勿過度相信較佳。
在假設檢定中,透過法律例子「選擇陪審團時的種族偏見問題」,證明為何合格公民中有一半是非洲裔,但陪審團八十名中卻只有四名為非洲裔,證實了陪審團名單並不利於隨機選擇這項假設的強烈證據,而陪審團例子只是一般性問題的一個特例。而「母體平均數的大樣本檢定」和「母體平均數的小樣本檢定」則可以檢定出麥片和車子等商品出產物的優良率,減輕將物體一項一項檢測所消耗的極大耗時成本,卻檢測出一樣效力的成果。在決策理論中,則是論述假設檢定中最常出現的第一型誤差和第二型誤差,其中犯第一型誤差的影響往往比第二型誤差大,但是基本上在假設研究中,誤差還是越小越好。
在實驗設計中,所包括的要素含實驗個體與分配給各個體的處理,所有設計的目的都是要對處理進行比較,任何一項實驗設計皆有三項基本原則,分別是:重複、隨機化和局部控制,以這三點原則為主,所設計出的實驗設計也才能避掉更多誤差。在書末也有介紹線性回歸和ANOVA變異數分析,由於最近我們系也需完成問卷調查的工作,在跑統計時也有參考上述兩種分析去驗證我們的問卷結果,不過書中所寫的內容過於簡略,雖然協助了我們對統計基本面的認識,但若想更了解深不可測的統計世界,還得需更精進自己腦袋的理解力和專業知識,未來才有能力去挑戰高等統計啊!
留言列表