讀古今文學網 > 學會提問(原書第10版) > 省略數據也是欺騙 >

省略數據也是欺騙

統計數據經常因為不完整而欺騙我們。因此,另一個在數據推理中找到缺陷非常有用的策略就是問一問:「在你判斷數據的影響力之前還需要哪些進一步的信息?」讓我們先看看下面的例子,詮釋一下這個問題所派的用場。

(1)大公司正在將市中心地帶的小鎮氣息破壞殆盡。就在去年,城裡的大公司的數目增長了75%。

(2)儘管大家都挺害怕,但跳傘運動其實比其他活動比如說駕駛汽車要安全得多。拿某一個月的時間來做比較,這段時間裡,洛杉磯有176人死於車禍,而死於跳傘事故的卻只有3人。

(3)艾滋病預防項目需要較大的資金投入。2009年,有54 000人飽受艾滋病的折磨。

第一個例子當中,75%這個數字顯得很吸引眼球。但是缺少了一些東西:這一百分比所依據的絕對數值。假如我們知道這種增長是從4家增長到7家,而不是從12家增長到21家,我們還會覺得如此驚訝嗎?在第二個例子裡,我們倒是有數字了,但是卻不知道比率。難道我們不需要知道這些數字對參加這兩種活動的人數的百分比而言有什麼意義嗎?不管怎樣,參加跳傘活動的總人數比起駕車的總人數而言簡直是微不足道。

第三個例子展示了我們社會當中常見的一個事實,通過聚焦全國範圍內受病痛折磨的總人數來企圖引起公眾對某個社會問題的關注。儘管這顯然是個亟待解決的問題,但當我們將54 000除以美國的大概總人口數3億,我們只得到一個大概2%的數值。

當你遇到聽起來讓人動心的數字或者百分比,一定要當心!你可能需要其他信息來判定這些數字到底有多讓人動心!當只有絕對數值擺在眼前的時候,問一問百分比是不是有可能幫你做出更好的判斷;當只有百分比出現在眼前的時候,問一問是不是絕對數值會豐富它們的含義。

另一個重要的有可能缺失掉的信息類型是相對比較(relevant comparisons)。問一下這個問題常常很管用:「這是和……相比較?」

下面每個陳述都展現了要求做比較會給統計數據帶來的好處。

·美杜莎發膠,現在效果要好50%。

·運動型轎車很危險,不該讓它們上路行駛。2006年,有4 650名車主死於運動型轎車事故。很顯然,應該採取行動才行。

·電影預算這些年簡直是駭人聽聞。看看《哈利·波特與火焰杯》:這部電影的預算是308 000 000美元!

·我們的文化正在日益向弱智化靠攏,更多的證據包含在以下事實當中:最近《紐約時報》一篇文章說接受採訪的年輕人中知道美國內戰哪一年開始的人還不到一半。

說到第一個表述,我們難道不需要問一問:「比什麼要好50%?」是其他沒效果的發膠?還是美杜莎以前的發膠產品?第二個例子,難道你不想知道如果不涉及運動型轎車,這些死亡數字中本可以避免掉的有多少,其他不含運動型轎車的機動車惡性事故又有多少,和它們涉及的死亡數字相比上路行駛的運動型轎車到底有多少,和運動型轎車發生的死亡數字比較運動型轎車行駛的里程數有多少?談到第三個例子,一部電影的預算和其他電影的預算之間有怎樣的聯繫,是這部電影特別不同尋常,還是它代表了整個的電影產業?談到美國內戰的日期方面的知識,這樣的調查結果和20年前類似的調查得出的結果比起來又怎麼樣?

當你遇到數據的時候,一定要問一句:「有什麼相關的信息缺失了?」