記得大一時剛上系上所開立的統計學,便深覺統記真是門可愛又好玩的科目,如果能對統計之事詳加了解並運用得當,統計上的應用還能拿來騙人,不論是從抽樣上的問卷調查去做調整,更可以從後來統計出的數字做手腳,雖然這樣似乎不是件好事,但也正因如此讓人感受到懂得並善用統計,原來會是件這麼有趣的利器。帶著對統計的熱愛翻開了這本書《統計,讓數字說話》,我覺得這本書的厲害之處在於,它用許多淺顯易懂的文字和生活周遭的實際案例,讓人更能深入了解統計背後的意義。

 

  而且這本書完全不強調複雜的數學計算,是一本提供統計初學者瞭解統計的好書,畢竟統計本身就不是數學上的測試,只是數字上的活用,很喜歡這本書讓統計變得更為活用有意義,在讀完這本書後能發現,其實我們的生活周遭,都存在許多和統計數據相關的連結,但其中的真實性呢?客觀性呢?正確性呢?統計是一種數字的呈現,而解釋數據的往往是懂得善用統計資料的專家,看完這本書後也可以讓我多去提醒自己,再看到許多和數據相關的解釋時,可以多去思考其來源、如何抽樣、如何解釋、統計目的等,避免自己去被動接受某些可能已被操縱的呈現資料。

 

  本書分成三大部分,分別是:「產生數據」、「解釋數據」、「根據資料做結論」

 

,而從這三大類中又再詳分為:「樣本、實驗、量度、描述分布、了解關連的意義、消費者物價指數及它的鄰居、機率、推論」。每讀完一部分,就等於是再感受一次統計好玩的地方。在樣本這單元中,我覺得其中一句話很有意思,他說一個好的抽樣,會比你普查還要有準確性,因為你可能在一個一個調查的過程中,因為越來越累而失去嚴謹調查的態度,我覺得這就還蠻值得人思考,我們以前可能會覺得一個一個清點,準確度較高,但事實上則不然。另外,還有在抽樣時可用樣本大小來控制結果的精確度,以及注意去避免題目中引導或傾向性的字眼,除非你是為了故意做出操縱性的抽樣結果。

 

  在實驗這單元中,令我印象深刻的則是安慰劑效應,雖然以前在上社會心理學時也有聽過,但是像書中提到的胃冷凍實驗,真是太令人震驚,如果沒有做胃冷凍和安慰劑的比較實驗,那想必胃冷凍實驗還會繼續存在於胃潰瘍的治療上,這不禁讓人意識到做實驗的重要性,否則還要吞汽球在胃中,光是想到那個畫面,就令人不舒服,這證實好的實驗的確能減輕和驗證許多療程是否真如假設或眾人所述般有效,而且不只是針對療程就連公共政策的推行,也能一併運用於實驗過程中做檢視。

 

  在量度這單元內,最令我感興趣的則是那句:數字可以怎樣「詐」我們,書中也提到很多事情是事實,但不是全部的事實,像書中有一篇舉例美國醫學協會計算醫師收入的調查,就將自行開業、仍在訓練中、替政府工作的醫師合併一起計算,讓醫師看起來不像在壓榨美國,雖然這個方法看起來十分卑鄙,但它的確是項沒有錯誤的調查,而且這種作法,至少與直接放假數據相比還較光明磊落。只能說我們再檢視資料的當下,就應該戴著一顆時常懷疑的腦袋去思考。

 

  在描述分佈上,我覺得除了單純數據的資料呈現,若將數據轉換成圖形,不論是直方圖、圓餅圖,甚至是書中的象形圖,都還更令人易於了解。雖然象形圖容易讓人產生誤導,但其實只要多注意,我覺得用象形圖做呈現,還蠻有趣不枯燥。至於莖葉圖,以前其實較少看過這種呈現方式,因此原先覺得莖葉圖把數字羅列的密密麻麻,看起來十分複雜,但詳讀後才發現原來莖葉圖是保留原本的觀察值,著實相當方便,不過果然僅限於小樣本,否則葉子長太多也就失去方便觀察的美意了。

 

  在了解關聯的意義中,最有趣的地方我覺得是「辛卜森詭論」,我覺得還蠻厲害之處在於它不是從樣本中的抽樣做手腳,而是透過那些已呈現的數據去做合併或調整,雖然這樣等於又用人造方式去操作結果,但這也代表能活用此理論者,勢必對統計等分析十分熟悉。不過「交絡」影響真的是在探討關聯時的難題,由於我在大三時才修習研究法,我們的研究法老師要求我們自己找一個調查主題,之後再實際發問卷,將調查付諸行動,像我們這組原先想探討「休閒活動多寡對O大學生課業成績」之影響,但光休閒活動的類別就是個變數,此外關於會影響學生課業成就這部分,影響的變因便不只有一項如此單純,學生父母要求和學生自律程度,也都是影響時的變相,這也就代表我們研究中的變因諸多,要如何避免受變因干擾,達到我們當初訂立的研究目的,便是另我們這組十分煩惱的挑戰。

 

  另外,還有從散佈圖去剖析相關分析和迴歸線分析,關於這部分因為高中時曾經學過,令人有種回憶湧現的親切。此外更可從迴歸分析中學到預測等方法。在消費者物價指數那部分,最令我感到好笑之處在於那句「每月失業率,可以決定尋求連任總統的命運」,雖然在台灣的確亦是如此,但看到還是想讓人會心一笑。果然每一筆統計的分析資料都相當重要,一個數值被放對地方便有可能左右社會的趨勢和脈動。

 

  機率部份我也覺得很有趣,我認為喜歡賭博的人應該要來看看,否則有許多人常在開始下注後,因為連輸的緣故,而自我幻想之後中獎的機率會逐漸提高,但其實真正理解機率的人都知道機率是相同不變的,畢竟骰子和硬幣本身都沒有記憶,如果讓賭徒們了解機率,可能就有助於擊破賭徒們執迷不悟的執著。同樣的如果讓賭徒們了解期望值,相對可能還比較有意義。最後的推論部分,我贊同不要忽略沒有統計性的結果,因為每個數值的呈現,背後都有它的意義,你在這個測試中沒有顯著,但卻是個經驗,就像書中所述你在做醫學實驗時,可能發現某些治療是確定無效,而這個無效的結果若公布,其實還能為某些極想把病情治好,而盲目投醫的患者省錢。

 

  徹底讀完此書後,我真心認為機率與某些遙不可及的推論或交由上天決定的命運相比,還要有根據和說服力,不過值得注意的是若懂得善用機率和統計者,將其才能用於鑽取數據漏洞,製作假數據、假資料時,我們若沒有警覺的好奇心,也等於是讓自己暴露於危險中!畢竟一個錯誤的假數據,可能就很容易造成醫學上的重大缺失,或是錯誤深信的價值觀,實在令人須多加留心注意!

arrow
arrow

    Azumin 發表在 痞客邦 留言(0) 人氣()