學會提問（原書第10版）：樣本能夠代表整體嗎_M·尼爾·布朗

作者或演說者通常拿研究報告來支撐他們的概括性結論，也就是關於一般性事件（events in general）的斷言。比如，「在本研究中，此例藥物對75%的癌症患者治療效果明顯」並不是一個概括性的結論，而「此例藥物可治癒胰腺癌」才是概括性的結論。我們對見到的很多公開發表的概括總結都需要做進一步的檢查，看看有沒有可能是過度概括（overgeneralizing）。下面讓我們來看看是為什麼。

首先，我們抽取樣本的方式對判斷我們能在多大範圍內進行概括至關重要。能否從研究結果中進行概括主要取決於科研人員所研究的事件或人群的樣本數量、覆蓋範圍和抽取的隨機性。選取事件或人群進行研究的過程就叫做抽樣（sampling）。

因為研究人員永遠不可能對他們想概括的所有事件或人群無一例外地進行研究，他們必須要選擇一些樣本來做研究，但是有些抽樣的方法比其他抽樣方法更加可取。在你評價研究樣本的時候，有幾個重要的考慮因素必須要銘記在心。

（1）樣本的覆蓋率必須要大到足以產生概括或得出結論的程度。多數情況下，研究人員觀察的事件或人群越多，他們得出的結論也就越可靠。如果我們要對「大學生在做學期論文時從別人那裡獲得幫助的頻率有多高」這一課題概括出一般性的看法，我們研究1 000名大學生比只研究100名大學生自然會更有說服力。

（2）對研究者將要從中得出結論的所有事件的類型，樣本必須覆蓋足夠的範圍或者說包含足夠的多樣性。例如，如果研究者想要歸納出大學生一般的飲酒習慣，那麼他們的證據必須要建立在從各種不同類型的大學的各種不同類型的學生中進行抽樣的基礎之上。

（3）樣本的隨機性越大越好。如果研究者隨機取樣的話，他們就在盡量保證想要概括的所有事件都有同等的機會得到抽樣，同時也在竭力避免片面的取樣。大型的民意調查，像蓋洛普民意測驗，常常都盡量隨機地抽取樣本，這樣可避免特定類型的有片面特徵的事件或人群局限了樣本範圍。你能不能看出以下每個樣本具有什麼片面特徵？

（1）自願報名接受訪談，討論他們性行為的頻率的一群人。

（2）只有有線電話的一群人。

（3）一堂心理學導論課上的學生。

（4）特定電視網的觀眾，比如說福克斯電視網（FOX）或者是微軟全國有線廣播電視公司（MSNBC）。

因此，我們就要對所有的研究問一問，「他們抽樣的事件或人群有多少，樣本的覆蓋率有多大，樣本的隨機性怎麼樣？」

沒有致力於搜集足夠樣本進行研究所導致的就是研究結果的過度概括，所表述的概括性結論遠遠超過此項研究所能保證的範圍。在第7章裡，我們已經提到過以偏概全這樣過度概括的謬誤。現在我們來仔細看看一項過度概括的研究：

參加在線約會的人極有可能成功找到自己的佳偶。有一項針對229人的在線調查，對象是年齡在18~65歲有過互聯網在線約會經歷的人，調查詢問他們在網上的主要人際關係。調查結果顯示：接受調查的人當中有94%的人在第一次見過他們的網絡伴侶之後會再次約會，這種網絡情緣平均持續時間至少可達到七個月。

抽樣的程序不允許這樣一個寬泛的概括結論。此項研究的報告暗示這一結論可以推廣到「所有」使用在線約會服務的人，而研究本身卻只針對一個在線網站和229人這樣一個小群體，而且研究並沒有交代樣本是如何選取的，因此，網站的隨機性和覆蓋率也無從得知。例如，也很有可能那些自願參加調查的人都是那些成功找到佳偶的春風得意的人們。因此研究報告有瑕疵，因為它過度概括的程度太大。

小貼士：只有和我們研究過的人群或事件類似的或相同的情況我們才能加以概括。