開場白
古代中國人,認為日蝕現像是「天狗吃日」做成。天狗吃日時,人們會敲鑼打鼓放鞭炮,嚇得天狗把太陽吐出來。打鑼打鼓後,太陽的確回來了。
問題
提問者不明,答問者不清。
- 蒙提霍爾悖論,亦稱為蒙特霍悖論、山羊悖論或三門悖論
- 柏克森悖論
能否提出正確的問題,對於尋找答案來說,事半功倍。
問題:
- 兩件事 A 和 B,先後發生,它們有甚麼關系?
- 兩件事 A 和 B,同時發生,它們有甚麼關系?
- 甚麼是因果關系?
- 甚麼是相關關系?
- 因果關系是相關關系的子集嗎?
- 如何證明因果關系?
- 如何證明相關關系?
- 如何否證因果關系?
- 如何否證相關關系?
現象中到底有沒有因果關系是科學語言,目的是:
- 更清晰地描述,我們到底要估計的 (estimate) 是什麼。
- 更徹底地強調,因果推斷結論背後的統計學前提和假設。
- 建立在前兩條前提的基礎上,我們使用專門爲統計推斷設計的技巧,達到爲因果推斷提供證據的目的。
討論樣本時,需考慮下面幾個問題:
- 樣本是否具有代表性?
- 「人羣」被準確定義了嗎?
- 我們感興趣的「人羣」是否可以是無限大 (多) 的?
- 我們研究的樣本,是僅僅用來觀察,或是計劃對之進行某種干預呢?
- 我們從所有可能的「人羣」中抽了樣嗎?
因果推斷包括三個部分:
- 清晰描述因果關系概念的正式科學語言 (causal language)。
- 因果關系示意圖 (causal diagram)
- 清晰地展示研究者對變量之間存在的所有可能因果關系的假設,這是在實驗設計,和數據分析兩個階段都需要用到。
- 因果關系統計學方法 (causal inference methods)
- 從獲得的數據中,用和傳統方法不同的假設,作出因果關系的推斷。
研究治療的問題通常是:
- 這個治療方案有沒有效果?
- 暴露在某種可能有害的因素中,到底有沒有危險?
- 提出的新的衛生政策,到底能不能解決實際的醫療問題?
這個世界最不欠的是,不確定性。
收場白
所有的模型都是錯誤的,但有些模型是有用的。
參考:
- 大自然不會被嘲笑。
- 大自然不會被嘲笑(II)。
- 亞歷山大·戴維德。 “概率,因果關系和經驗世界:貝葉斯-德·芬內蒂-珀珀-博雷爾的綜合”。 統計科學 19(1) 44-57,2004 年 2 月。
- 朱迪亞·珀爾,達納·麥肯齊。 《為什麼:關於因果關系的新科學》。2018。