Wednesday, May 31, 2006

統計騙局

由於工作的關係,經常會與朋友分享統計學的應用。善於應用統計,可以為我們找出事情的因果關係,尋得改善的方法。但是,如果有意識地利用統計技術,也可以成為騙人的技倆。

正如其他發達地方,香港各界也很喜歡利用統計數字以支持不同的論據,但是,當中到底有幾多真的可信?

Darrell Huff 於 1954 年出版的 How to Lie With Statistics 是很多做研究的朋友都有看過的書,當中談過不少統計的騙人手法,其中不少在現時香港也十分常見。

比較常見的騙人手法是隱瞞大量的不成功數據。在香港,不同形式的民意調查差不多每天都有,筆者曾經看過不少這些調查報告,發覺很少提及問卷的成功回覆率,很辛苦地找到一份某政黨在 2005 年做的《市民對普選遊行的意見調查》,發現其成功回收率只有4.8%,那麼這超過95%的「沉默的大多數」的意見到底是甚麼是沒有定論,更難以利用4.8%的意見去推論可以代表其他的95%。因此,以這樣低回收率的調查去下結論,實際上是毫無意義的。

最近亦有機構做過一個有關年青人犯罪行為的調查,得出有超過一半年青人曾在過去一年有犯罪行為的驚人結論。但是,如果再詳細看報告,發現有關機構沒有詳細交代取樣的方法,只簡單提及樣本取自14家學校,但是,究竟這些學校來自那些區域、那些組別,都會對結論造成根本性的影響。

因此,我們在理解統計數字時切忌斷章取義,而要作更詳細的分析方可。

No comments: