草稿:因果推斷

维基百科,自由的百科全书
跳到导航 跳到搜索

 

因果推斷是在一個較大系統內部確定指定現象的實際、獨立效果的過程。因果推斷和相關性推斷的主要區別是前者分析結果變量在其原因變量變化時發生的回應。[1][2] 研究事物起因的科學則稱作原因論。因果推斷可給出因果關係推理英语Causal reasoning建立出的因果關係模型的證據。

因果推斷在所有科學中都得到了廣泛研究。近幾十年來,旨在確定因果關係的方法論中出現了多項創新發展和應用。在許多科學問題中,常常出現難以或不可能進行實驗的情況,這時因果推斷仍然特別困難。

因果推斷廣泛適用於所有類型的科學學科,而且許多針對特定學科設計的因果推斷方法也可應用到其他學科。本文概述了因果推斷的基本步驟,並詳細介紹不同學科中使用的傳統測試方法;這不意味着那些方法只適用於特定學科,這只表示它們是該學科中最常用的。

因果推斷很難執行。科學家就確定因果關係的正確方法存在重大爭論。儘管可能有其他創新,科學家仍可能誤將相關性判斷為因果關係,亦可能使用了不正確的統計方法,甚至故意操縱分析結果以獲得統計上顯著的估計值,這是令人擔憂的。這種問題在回歸模型,尤其是線性回歸模型的使用上更為明顯。

定義[编辑]

推斷原因的過程可描述為:

  • 「……通過推理總結出某事是,或很可能是,其他事的原因。」 [3]
  • 「通過建立原因和結果之間的協變、時序關係,以及通過排除可能的替代原因,識別出現象的一個或多個原因的過程。」 [4]

方法論[编辑]

通用方法[编辑]

當系統的一個變量可能影響另一個變量時,可以進行因果推斷。因果推理是根據科學方法進行的。因果推斷的第一步是制定一個可證偽的虛無假設,隨後用統計方法對其進行檢驗。頻率學派統計推斷利用統計方法確定數據在零假設下偶然出現的概率:貝葉斯推斷用於確定自變量的影響。一般而言,統計推斷可用於區分出原始數據變量的變化是出自隨機浮動或明確的因果機制的影響。[5]注意,相關不蘊涵因果,因此對因果關係的研究,以及對潛在因果機制(例如中介變項的存在性)的研究,都需要同樣關注數據之間的變化。[來源請求] 因果推斷中一個經常被追捧的標準是維持其他混雜因素不變的情況下的隨機對照試驗。因果推斷中最消耗精力的部分往往在於試圖複製實驗條件。

流行病學研究採用不同的流行病學方法英语Epidemiological method來收集和測量危險因子和結果的數據,以及使用不同方法刻劃這種關聯性。 2020年一份對因果推斷方法的回顧發現,要將現有文獻用於臨床培訓將會很有挑戰性。這是因為這些已發表的文章通常預設了進階的技術背景,它們可能囊括了統計學、流行病學、計算機科學或哲學的方面;而且各種不同方法論的方法繼續迅速擴展;此外,因果推斷的許多角度在文獻中篇幅有限。 [6]

因果推理的常见框架是結構方程模型英语Structural equation modelling鲁宾因果模型[來源請求]

實驗性方法[编辑]

 

實驗方法可以對因果機制進行驗證。實驗的主要目的是有目的地操縱感興趣的變量,同時保持其他實驗變量不變。僅操縱某變量的情況下,實驗結果若產生了統計上顯著的影響,則有理由相信該變量具有引發了一定的因果效應(但需同時假設實驗設計同時滿足了一定的標準)。

準實驗方法[编辑]

當傳統的實驗方法不可用時,可以對因果機制進行準實驗驗證。這可能是由於實驗的成本過高,或者本身實驗就不可能進行,例如大型系統(如與選舉制度相關的經濟學),或可能對測試對象造成危害的試驗。出於法律原因,信息不足的情況下,也可能進行準實驗。

流行病学方法[编辑]

流行病學研究特定生物群體的健康和疾病模式,以推斷起因和結果。假定的危險因子與疾病之間的相關性可能提示了因果,但並不等同於因果,因為相關不蘊涵因果。從歷史上看,柯霍氏法則自 19 世紀以來一直被用於確定微生物是否是疾病的起因。在 20 世紀,1965 年總結出的希爾判則英语Bradford Hill Criteria[7]則早已被用於評估微生物學以外的因果關係,但這些標準也不是確定因果關係的唯一方法。

分子流行病學英语Molecular Epidemiology中,研究對象處於分子生物學水平。其中遺傳學層面的生物標記可以是因果關係的證據。

最近的趨勢[何时?]是在新興的分子病理流行病學英语Molecular pathological epidemiology(MPE)的跨學科領域中,在分子病理學英语Molecular pathology層面上確定風險因子對於患病組織或細胞的影響的證據。將因子與疾病的分子病理特徵聯繫起來可以幫助評估因果關係。[需要第三方來源]研究特定疾病內部的異質性,獨特的疾病原理、疾病表型和亞型,是生物醫學和公共衛生科學的趨勢,亦體現在個體化醫療英语Personalized medecine精準醫學上。[需要第三方來源]

計算機科學方法[编辑]

對某些模型而言,從兩個時間獨立變量(例如 X 和 Y)的聯合觀測數據中,可以根據X → Y和 Y → X兩個方向的數據之間的不對稱性確定其因果關係。主要方法基於算法信息論模型和噪聲模型。 [來源請求]

噪聲模型[编辑]

在模型中加入一個獨立的噪聲項來比較兩個方向的數據。

以下是在假設 Y → X 下,引入噪聲 E 的一些噪聲模型:

  • 加性噪聲: [8]
  • 線性噪聲: [9]
  • 後非線性噪聲: [10]
  • 異方差噪聲:
  • 函數噪聲: [11]

這些模型中的共同假設是:

  • 不存在Y的其他原因(前置項)。
  • X和E没有共同的原因。
  • 原因的分布獨立於因果機制。

直觀的想法是,將聯合分布 P(原因, 結果) 分解為 P(原因)*P(結果 | 原因) 的總複雜度通常會低於分解為 P(結果)*P 的模型(原因 | 效果)。儘管此處「複雜性」的概念在直覺上很有吸引力,應該如何精確定義它卻不明顯。[11] 另一系列的方法則試圖從大量標記數據中發現因果「足跡」,從而預測更靈活的因果關係。 [12]

社會科學方法[编辑]

 

社會科學[编辑]

總體上,社會科學越來越傾於在因果評估中引入定量框架。很多這樣的研究為社會科學方法論提供了更嚴格的手段。 1994 年 Gary King、Robert Keohane 和 Sidney Verba出版的《社會研究的設計英语Designing Social Inquiry》對政治學產生了重大影響。 King、Keohane 和 Verba 建議研究人員同時應用定量和定性方法,並採用統計推斷的語言來更清楚地瞭解他們感興趣的主題和分析單位。 [13] [14]定量方法的支持者也越來越多地採用由唐納德.魯賓英语Donald Rubin開發的潛在結果模型作為推斷因果關係的標準。 [來源請求]

儘管社會科學仍然大部分着重於在潛在結果框架中進行統計推斷,方法論者已開發了新工具來使用定性和定量方法進行因果推斷,有時稱為「混合方法」方法。 [15] [16]使用多元方法的倡導者認為,不同的方法論適用於不同研究主題。社會學家 Herbert Smith 和政治學家 James Mahoney 和 Gary Goertz 引用了統計學家 Paul Holland 的觀察(他是 1986 年文章「統計和因果推斷」的作者):統計推斷最適合評估「原因的影響」而不是「影響的原因」。 [17] [18]定性方法論者認為,因果關係的形式化模型,包括過程追蹤英语Process Tracing模糊集理論,通過案例研究中的關鍵因素的識別或通過幾個案例研究的比較,提供了推斷因果的機會。 [14]在可觀察量有限,或存在混雜變量的情況下,統計推斷的的適用性有所限制,但這些方法也很有價值。[來源請求] 

經濟學和政治科學[编辑]

經濟學政治科學中,由於現實世界中經濟和政治的複雜性,以及許多大規模現象無法在受控實驗中重現,因果推斷通常很困難。由於社會科學家可用技術水平的提高、社會科學家和研究數量的增加以及社會科學中因果推理方法的普遍改進,經濟和政治科學中的因果推理在方法論和嚴謹性方面繼續得到改進。 [19]

儘管確定經濟系統中的因果關係本質上很困難,在這些領域中存在幾種廣泛採用的方法。

理论方法[编辑]

理論方法經濟學家和政治學家可以使用理論(通常在理論驅動的計量經濟學)來估計在他們認為存在因果關係的情況下,所謂的因果關係的大小。 [20]理論家可以預設一個因果機制,並使用數據分析來描述其影響,以證明他們提出的理論是合理的。例如,理論家可以使用邏輯來構建模型,例如假說降雨會導致經濟生產力波動,但反之則不然。 [21]然而,不提供任何預測見解的純理論主張被稱為「前科學」,因為没有方法預測假定的因果關係的影響。 [22]值得重申的是,社會科學中的回歸分析本質上並不意味著因果關係,因為許多現象可能在短期或特定數據集中相關,但在其他時間段或其他數據集中沒有相關性。因此,在沒有明確定義和合理的因果機制的情況下,將因果屬性歸因於相關屬性還為時過早。

輔助變量[编辑]

輔助變量(IV)技術是一種確定因果關係的方法。該方法可以消除模型內某解釋變量與模型的誤差項之間的相關性。這是基於以下原理:如果模型的誤差項與另一個變量的變化密切相關,則模型的誤差項可能是該解釋變量變化的影響。通過引入新的工具變量來消除這種相關性,從而減少了整個模型中存在的誤差。 [23]

模型指定[编辑]

模型指定即是選擇用於數據分析的模型。社會科學家(實際上,所有科學家)必須正確地選用模型,因為不同的模型擅長估計不同的關係。 [24]

指定特定模型可用於確定緩慢出現的因果關係,其中一個時期內某項行動的結果只能在以後的時期出現。值得記住的是,相關性僅衡量兩個變量是否具有相似的變化,而不是它們是否在特定方向上相互影響;因此,不能僅根據相關性來確定因果關係的方向。因為相信先有因再有果,社會科學家會用模型來專門尋找一段時間內一個變量對另一個變量的影響。這導致計量經濟學中,較早發生的現象的變量被視為治理手段(treatment),計量測試則用於尋找數據中此類治理導致的後期變化。若數據中,前期治理手段中有意義的區別緊接着後期結果的有意義的區別,則可能表明治理和變化之間的因果關係(例如,格蘭傑因果檢驗)。此類研究是時間序列分析的示例。 [25]

敏感度分析[编辑]

在不同的同一模型的各種實現中,其他變量,或回歸分析中的回歸量被包含或排除,以確保可以更獨立地研究不同的變化來源。這是敏感性分析的一種形式:它研究模型的實現對於添加一個或多個新變量的敏感性。 [26]

使用敏感性分析的一個主要動機是尋求發現干擾因子。干擾因子對統計檢驗結果有很大影響,但不是因果推斷試圖研究的變量。干擾因子可能會導致回歸量在一個實現中顯得很重要,但在另一種實現中則不然。

多重共線性[编辑]

另一使用敏感性分析的原因是用於楨測多重共線性是指兩個變量的相關性非常高的現象。兩變量間的高度相關性可以劇烈地影響統計分析的結果——高度相關的數據中,細小的變化可能將某個變量的正面影響反轉成負面影響,反之亦然。 這是變化測試的內禀性質。在敏感性分析中,發現多重共線性是有用的,因為通過在不同的模型實現中刪去高度相關變量,可以避免這些變量帶來的劇烈變化.[27]

然而,敏感性分析防止多重共線性的有害影響的能力是有限的,尤其是在系統複雜的社會科學中。因為理論上不可能在一個足夠複雜的系統中考慮,甚至測量所有乾擾因子,所以計量經濟學模型容易出現共因謬誤,即總結出錯誤的變量因果關係,而正確的變量(共因)則沒有在原始數據被考慮。这是一個未能考慮干擾因子的例子。 [28]

基於設計的計量經濟學[编辑]

最近,基於設計的計量經濟學的改進方法普及了自然實驗和準實驗研究設計在識別因果機制中的應用。 [29]

因果推斷的不端行為[编辑]

儘管用於確定因果關係的方法的發展取得了進步,但這些方法仍然存在重大缺陷。這些弱點一方面源於確定複雜系統中因果關係的內禀困難,另一方面則源於科學不端行為事件。

撇開因果推斷的困難,在一些大的社會科學家群體中,存在大量社会科學家从事非科學的方法論。在經濟學和社會學領域內,不乏對於科學家將描述性研究冒充成因果研究的批評。 [22]

科學不端和有缺陷的方法論[编辑]

在這些科學領域,尤其是社會科學,學者們擔心科學不端行為廣泛存在。 因為科學研究有廣泛的主題,即使不是研究者的過錯,理論上仍有無限的方式去推翻一個因果關係。但是,科學家仍然疑慮,可能有很多研究者在因果關係中沒有履行基本職責,或實踐足夠多元的方法。[30][31][32] [33]

常見的非因果方法的一個突出例子是將相關屬性錯誤地假設為因果屬性。相關現象中不必然有內在的因果關係。回歸模型旨在測量數據中相對於理論模型的變化:高水平協方差的數據不能被認為具有任何有意義的關係(除非同時提出的具有預測特性的因果機制或隨機分配治理)。缺陷方法的使用被認為是普遍存在的,這種不當行為的常見例子是過度使用相關模型,尤其是過度使用回歸模型,特別地,線性回歸模型。 [22]兩個相關現象具有內在相關性的假設是一種稱為虛假相關性的邏輯謬誤。一些社會科學家聲稱,廣泛地使用將虛假相關性視為因果的方法論將不利於社會科學健全,不過由更好的方法帶來的改進已經被注意到。 [29]

將相關性與因果關係錯誤地混為一談的科學研究的潛在影響是,無法被第三方無法結果科學發現增多。這種不可重復性是可預見的,因為相關性只是因為被暫時過度概括為沒有內在關係的機制,而新數據不包含之前原始數據的特殊相關性。有關不端行為及因果推斷的固有困難的影響的爭論仍進行中。 [34]批評這些被廣泛使用的方法論的人認為,研究人員在發表文章時進行了統計操作,這些文章據稱證明瞭因果關係,但實際上是虛假相關被吹捧為因果關係證據的例子:這種行為被稱為P-hacking英语Data dredging[35]為了防止這種情況,一些人主張研究人員在進行研究之前預先註冊他們的研究設計,這樣他們就不會無意中過分強調一些不是最初的調查主題,但在數據分析過程中被發現具有統計意義的發現,這些發現往往不可重復。 [36]

參見[编辑]

參考資料[编辑]

  1. ^ Pearl, Judea. Causal inference in statistics: An overview (PDF). Statistics Surveys. 1 January 2009, 3: 96–146. doi:10.1214/09-SS057可免费使用. 
  2. ^ Morgan, Stephen; Winship, Chris. Counterfactuals and Causal inference. Cambridge University Press. 2007. ISBN 978-0-521-67193-4. 
  3. ^ causal inference. Encyclopædia Britannica, Inc. [24 August 2014]. 
  4. ^ John Shaughnessy; Eugene Zechmeister; Jeanne Zechmeister. Research Methods in Psychology. McGraw-Hill Humanities/Social Sciences/Languages. 2000: Chapter 1 : Introduction [24 August 2014]. ISBN 978-0077825362. (原始内容存档于15 October 2014). 
  5. ^ Schrodt, Philip A. Seven deadly sins of contemporary quantitative political analysis. Journal of Peace Research. 2014-03-01, 51 (2): 287–300. ISSN 0022-3433. S2CID 197658213. doi:10.1177/0022343313499597 (英语). 
  6. ^ Landsittel, Douglas; Srivastava, Avantika; Kropf, Kristin. A Narrative Review of Methods for Causal Inference and Associated Educational Resources. Quality Management in Health Care. 2020, 29 (4): 260–269. ISSN 1063-8628. PMID 32991545. S2CID 222146291. doi:10.1097/QMH.0000000000000276 (英语). 
  7. ^ Hill, Austin Bradford. The Environment and Disease: Association or Causation?. Proceedings of the Royal Society of Medicine. 1965, 58 (5): 295–300. PMC 1898525. PMID 14283879. doi:10.1177/003591576505800503. 
  8. ^ Hoyer, Patrik O., et al. "Nonlinear causal discovery with additive noise models." NIPS. Vol. 21. 2008.
  9. ^ Shimizu, Shohei; 等. DirectLiNGAM: A direct method for learning a linear non-Gaussian structural equation model (PDF). The Journal of Machine Learning Research. 2011, 12: 1225–1248. arXiv:1101.2489. 
  10. ^ Zhang, Kun, and Aapo Hyvärinen. "On the identifiability of the post-nonlinear causal model." Proceedings of the Twenty-Fifth Conference on Uncertainty in Artificial Intelligence. AUAI Press, 2009.
  11. ^ 11.0 11.1 Mooij, Joris M., et al. "Probabilistic latent variable models for distinguishing between cause and effect." NIPS. 2010.
  12. ^ Lopez-Paz, David, et al. "Towards a learning theory of cause-effect inference" ICML. 2015
  13. ^ King, Gary. Designing social inquiry : scientific inference in qualitative research. Princeton Univ. Press. 2012. ISBN 978-0691034713. OCLC 754613241. 
  14. ^ 14.0 14.1 Mahoney, James. After KKV. World Politics. January 2010, 62 (1): 120–147. JSTOR 40646193. doi:10.1017/S0043887109990220. 
  15. ^ Creswell, John W.; Clark, Vicki L. Plano. Designing and Conducting Mixed Methods Research. SAGE Publications. 2011. ISBN 9781412975179 (英语). 
  16. ^ Seawright, Jason. Multi-Method Social Science by Jason Seawright. Cambridge Core. September 2016 [2019-04-18]. ISBN 9781316160831. doi:10.1017/CBO9781316160831 (英语). 
  17. ^ Smith, Herbert L. Effects of Causes and Causes of Effects: Some Remarks from the Sociological Side. Sociological Methods and Research. 10 February 2014, 43 (3): 406–415. PMC 4251584. PMID 25477697. doi:10.1177/0049124114521149. 
  18. ^ Goertz, Gary; Mahoney, James. A Tale of Two Cultures: Contrasting Quantitative and Qualitative Research. Political Analysis. 2006, 14 (3): 227–249. ISSN 1047-1987. doi:10.1093/pan/mpj017 (英语). 
  19. ^ Angrist, Joshua D.; Pischke, Jörn-Steffen. The Credibility Revolution in Empirical Economics: How Better Research Design Is Taking the Con out of Econometrics. Journal of Economic Perspectives. June 2010, 24 (2): 3–30. ISSN 0895-3309. doi:10.1257/jep.24.2.3 (英语).  无效|subscription=free (帮助)
  20. ^ University, Carnegie Mellon. Theory of Causation - Department of Philosophy - Dietrich College of Humanities and Social Sciences - Carnegie Mellon University. www.cmu.edu. [2021-02-16] (英语). 
  21. ^ Simon, Herbert. Models of Discovery. Dordrecht: Springer. 1977: 52. 
  22. ^ 22.0 22.1 22.2 Schrodt, Philip A. Seven deadly sins of contemporary quantitative political analysis. Journal of Peace Research. 2014-03-01, 51 (2): 287–300. ISSN 0022-3433. doi:10.1177/0022343313499597 (英语). 
  23. ^ Angrist, Joshua D.; Krueger, Alan B. Instrumental Variables and the Search for Identification: From Supply and Demand to Natural Experiments. Journal of Economic Perspectives. 2001, 15 (4): 69–85. doi:10.1257/jep.15.4.69.  无效|subscription=free (帮助)
  24. ^ Allen, Michael Patrick (编), Model specification in regression analysis, Understanding Regression Analysis (Boston, MA: Springer US), 1997: 166–170 [2021-02-16], ISBN 978-0-585-25657-3, doi:10.1007/978-0-585-25657-3_35 (英语) 
  25. ^ Maziarz, Mariusz. The Philosophy of Causality in Economics: Causal Inferences and Policy Proposals. New York: Routledge. 2020. 
  26. ^ Salciccioli, Justin D.; Crutain, Yves; Komorowski, Matthieu; Marshall, Dominic C., MIT Critical Data , 编, Sensitivity Analysis and Model Validation, Secondary Analysis of Electronic Health Records (Cham: Springer International Publishing), 2016: 263–271, ISBN 978-3-319-43742-2, PMID 31314264, doi:10.1007/978-3-319-43742-2_17 (英语) 
  27. ^ Illowsky, Barbara. Introductory Statistics. openstax.org. 2013 [2021-02-16]. 
  28. ^ Henschen, Tobias. The in-principle inconclusiveness of causal evidence in macroeconomics. European Journal for Philosophy of Science. 2018, 8 (3): 709–733. doi:10.1007/s13194-018-0207-7. 
  29. ^ 29.0 29.1 Angrist Joshua & Pischke Jörn-Steffen. Mostly Harmless Econometrics: An Empiricist's Companion. Princeton: Princeton University Press. 2008. 
  30. ^ Achen, Christopher H. Toward a new political methodology: Microfoundations and ART. Annual Review of Political Science. June 2002, 5 (1): 423–450. ISSN 1094-2939. doi:10.1146/annurev.polisci.5.112801.080943 (英语).  无效|subscription=free (帮助)
  31. ^ Angrist, Joshua D.; Pischke, Jörn-Steffen. The Credibility Revolution in Empirical Economics: How Better Research Design Is Taking the Con out of Econometrics. Journal of Economic Perspectives. June 2010, 24 (2): 3–30. ISSN 0895-3309. doi:10.1257/jep.24.2.3 (英语).  无效|subscription=free (帮助)
  32. ^ Dawes, Robyn M. The robust beauty of improper linear models in decision making. American Psychologist. 1979, 34 (7): 571–582. doi:10.1037/0003-066X.34.7.571. 
  33. ^ Vandenbroucke, Jan P; Broadbent, Alex; Pearce, Neil. Causality and causal inference in epidemiology: the need for a pluralistic approach. International Journal of Epidemiology. December 2016, 45 (6): 1776–1786. ISSN 0300-5771. PMC 5841832. PMID 26800751. doi:10.1093/ije/dyv341. 
  34. ^ Greenland, Sander. For and Against Methodologies: Some Perspectives on Recent Causal and Statistical Inference Debates. European Journal of Epidemiology. January 2017, 32 (1): 3–20. ISSN 1573-7284. PMID 28220361. doi:10.1007/s10654-017-0230-6. 
  35. ^ Dominus, Susan. When the Revolution Came for Amy Cuddy. The New York Times. 18 October 2017 [2019-03-02]. ISSN 0362-4331 (美国英语). 
  36. ^ The Statistical Crisis in Science. American Scientist. 6 February 2017 [2019-04-18] (英语). 

參考書目[编辑]

外部鏈接[编辑]