刊期:《數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究》2025年第2期
原標(biāo)題:因果中介分析的理論進(jìn)展及其應(yīng)用
作者簡介:
趙西亮,廈門大學(xué)宏觀經(jīng)濟(jì)研究中心、廈門大學(xué)經(jīng)濟(jì)學(xué)院和王亞南經(jīng)濟(jì)研究院教授。研究方向勞動(dòng)經(jīng)濟(jì)學(xué)和應(yīng)用微觀計(jì)量經(jīng)濟(jì)學(xué)。編著暢銷教材《基本有用的計(jì)量經(jīng)濟(jì)學(xué)》,被京東評為“十大構(gòu)思細(xì)膩的大學(xué)教材”之一。
主持國家社會(huì)科學(xué)基金、教育部人文社會(huì)科學(xué)基金等項(xiàng)目6項(xiàng)。
在《經(jīng)濟(jì)研究》《數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究》《經(jīng)濟(jì)學(xué)(季刊)》、China Economic Review等期刊發(fā)表論文30余篇,擔(dān)任《經(jīng)濟(jì)研究》《管理世界》《數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究》、China Economic Review等期刊匿名審稿人。
研究背景:
最近二十多年來,因果中介分析方法作為一種重要的機(jī)制分析工具取得了重要的發(fā)展,它完善了傳統(tǒng)的中介分析方法,使機(jī)制分析更加可信。該方法已經(jīng)廣泛應(yīng)用于社會(huì)學(xué)、流行病學(xué)和生物統(tǒng)計(jì)學(xué)等領(lǐng)域,然而,國內(nèi)鮮有文獻(xiàn)介紹因果中介分析,本文試圖將這一重要方法介紹給國內(nèi)用戶。
主要結(jié)論:
我們首先簡單介紹傳統(tǒng)中介分析方法并討論其局限,傳統(tǒng)方法依賴于線性結(jié)構(gòu)模型和三步回歸方法。第一步,結(jié)果變量對解釋變量回歸,得到總效應(yīng)的估計(jì);第二步,中介變量對解釋變量回歸得到對中介變量影響的估計(jì);第三步,結(jié)果變量對解釋變量和中介變量回歸,得到控制解釋變量后中介變量對結(jié)果變量影響的估計(jì)。第三步估計(jì)中解釋變量的系數(shù)為直接效應(yīng),第二步回歸系數(shù)和第三步中介變量的系數(shù)乘積,反映了解釋變量通過中介變量對結(jié)果的影響程度,是間接效應(yīng)或中介效應(yīng)。然而,這種方法假設(shè)模型設(shè)定是正確的。如果原因變量或中介變量是內(nèi)生的,則估計(jì)結(jié)果將會(huì)有偏差。另外,傳統(tǒng)中介分析方法沒有考慮不同干預(yù)狀態(tài)下的中介效應(yīng)異質(zhì)性,從而降低了確定因果機(jī)制的可信性。
因果中介分析通過提供更靈活、更穩(wěn)健的因果推斷框架來解決這些局限性。本文側(cè)重于兩個(gè)關(guān)鍵參數(shù):自然間接效應(yīng)(NIE)和自然直接效應(yīng)(NDE)。自然間接效應(yīng)度量當(dāng)個(gè)體維持干預(yù)狀態(tài)不變而中介變量由控制狀態(tài)轉(zhuǎn)向干預(yù)狀態(tài)時(shí)取值的變化對潛在結(jié)果的影響。自然直接效應(yīng)則是維持中介變量取值不變,僅由干預(yù)狀態(tài)的變化所造成的潛在結(jié)果的變化。識(shí)別這些效應(yīng)的核心假設(shè)是序貫可忽略性(Sequential Ignorability),這個(gè)假設(shè)要求在控制協(xié)變量的情況下,干預(yù)分配是近似隨機(jī)化的,并且在已知干預(yù)狀態(tài)和協(xié)變量的情況下,中介變量也是近似隨機(jī)化的。盡管這一假設(shè)很強(qiáng),但它允許對直接和間接效應(yīng)進(jìn)行因果識(shí)別。我們還討論了中介效應(yīng)的各種估計(jì)方法,以及處理違反序貫可忽略性假設(shè)時(shí)的方法。當(dāng)干預(yù)和/或中介變量內(nèi)生時(shí),可以利用工具變量法(IV)或雙重差分法(DID),解決干預(yù)和中介的內(nèi)生性問題,提高估計(jì)的可信性,本文對如何利用工具變量解決中介變量的內(nèi)生性問題,以及同時(shí)解決干預(yù)和中介的內(nèi)生問題進(jìn)行了詳細(xì)討論。
最后,我們利用2018年中國居民收入調(diào)查項(xiàng)目(CHIP)城鎮(zhèn)居民數(shù)據(jù),利用本文介紹的因果中介方法評估了教育通過職業(yè)渠道影響收入的程度,發(fā)現(xiàn)大學(xué)教育可以通過職業(yè)渠道顯著提升居民收入,職業(yè)渠道可以解釋大學(xué)教育回報(bào)的45%左右,而對僅完成高中教育的個(gè)體,職業(yè)渠道對收入的影響較小,僅11%左右。利用配偶教育、父母職業(yè)分別作教育和職業(yè)的工具變量處理干預(yù)和中介變量的內(nèi)生性問題后,得到的結(jié)果基本一致。
政策啟示:
本文表明,因果中介分析可以用于機(jī)制分析,了解因果效應(yīng)產(chǎn)生的渠道以及具體渠道在解釋總效應(yīng)時(shí)的解釋力的大小,F(xiàn)有經(jīng)濟(jì)學(xué)實(shí)證研究中,機(jī)制分析部分往往根據(jù)經(jīng)濟(jì)學(xué)理論或研究者的直觀理解進(jìn)行回歸檢驗(yàn),通常是用中介變量對干預(yù)變量的回歸分析得到,而中介對結(jié)果的影響往往不再考察。這種方法只能證明這一渠道可能存在,但并不能說明這一渠道的重要性,也許這一渠道對總效應(yīng)的解釋微乎其微,因而,需要將干預(yù)影響中介及中介影響結(jié)果的渠道進(jìn)行完整的分析,估計(jì)出中介效應(yīng),才能更好的說明中介變量在解釋渠道中所起的作用。
趙西亮老師獨(dú)家‘因果推斷’專場課程
當(dāng)因果推斷遇見DDML和DeepSeek
基于設(shè)計(jì)的計(jì)量經(jīng)濟(jì)學(xué)
2025年5月全面升級(jí)
新增了:
1. 高維協(xié)變量下的統(tǒng)計(jì)推斷和因果推斷方法
這在大數(shù)據(jù)時(shí)代尤為重要,因?yàn)楹芏鄷r(shí)候我們面臨的解釋變量個(gè)數(shù)甚至多于樣本量
2. 平行趨勢假設(shè)檢驗(yàn)方法及平行趨勢假設(shè)不滿足時(shí)的敏感性分析方法
這對于雙重差分等研究設(shè)計(jì)來說,是至關(guān)重要的檢驗(yàn)環(huán)節(jié)
3. 因果中介分析的理論和應(yīng)用介紹也被納入其中
幫助我們更好地理解因果作用的傳遞機(jī)制
4. 將結(jié)合deepseek/Grok + Stata數(shù)據(jù)處理
借助最新人工智能大模型的力量,為科研助力,讓數(shù)據(jù)處理和分析變得更加高效、智能
開課信息:
培訓(xùn)時(shí)間:2025年5月1-4日(四天)
培訓(xùn)安排:上午9:00-12:00;下午14:00-17:00;課后答疑
培訓(xùn)方式:
線上:騰訊會(huì)議同步直播參會(huì)備注:
參加現(xiàn)場提供交通住宿指南,會(huì)議酒店住宿提供協(xié)議價(jià)(含早);
現(xiàn)場班根據(jù)繳費(fèi)順序安排座位,現(xiàn)場名額限30人。
*現(xiàn)場與遠(yuǎn)程均提供錄播回放,趙西亮老師親自答疑。
*授課過程涉及實(shí)操,參加現(xiàn)場需攜帶電腦。
課程亮點(diǎn):
1. 前沿理論與方法的深度剖析
深入學(xué)習(xí)統(tǒng)計(jì)推斷的基本內(nèi)容,從線性回歸、飽和模型、二元選擇模型,到帶懲罰項(xiàng)的線性回歸,如Lasso、嶺回歸等,再到Neyman正交、Double Lasso等前沿方法,讓我們對參數(shù)估計(jì)方法有全面而深刻的理解。
同時(shí),詳細(xì)講解潛在結(jié)果框架、因果圖等理論基礎(chǔ),幫助我們構(gòu)建堅(jiān)實(shí)的因果推斷理論體系。
2. 因果推斷全流程的系統(tǒng)講解
課程涵蓋了因果推斷的整個(gè)流程,從定義因果效應(yīng)參數(shù),到選擇合適的識(shí)別策略,再到估計(jì)統(tǒng)計(jì)參數(shù),每一步都詳細(xì)講解,讓學(xué)員能夠清晰地掌握因果推斷的邏輯框架。
無論是隨機(jī)化實(shí)驗(yàn)、非混雜性條件下的因果效應(yīng)估計(jì),還是工具變量法、固定效應(yīng)方法、雙重差分法等具體方法的應(yīng)用,都有詳盡的案例分析和實(shí)操指導(dǎo)。
3. 高維數(shù)據(jù)與因果推斷的緊密結(jié)合
隨著大數(shù)據(jù)時(shí)代的到來,高維數(shù)據(jù)成為了我們研究中常見的挑戰(zhàn)。課程新增的高維協(xié)變量下的統(tǒng)計(jì)推斷和因果推斷方法,將幫助我們更好地應(yīng)對這一挑戰(zhàn)。通過學(xué)習(xí)Chernozhukov等人發(fā)展的理論,包括雙重Lasso和雙重機(jī)器學(xué)習(xí)等方法,學(xué)員能夠掌握在高維數(shù)據(jù)環(huán)境下進(jìn)行因果推斷的有效途徑。
4. 人工智能大模型的助力
結(jié)合DeepSeek/Grok + Stata數(shù)據(jù)處理,是本次課程的一大亮點(diǎn)。借助人工智能大模型的力量,我們可以更高效地進(jìn)行數(shù)據(jù)編程和學(xué)術(shù)研究。這不僅能夠提高數(shù)據(jù)處理的效率,還能為研究提供新的思路和方法,讓學(xué)員在科研工作中如虎添翼。
5. 實(shí)戰(zhàn)案例與實(shí)操指導(dǎo)
課程中將通過大量的實(shí)戰(zhàn)案例,幫助學(xué)員更好地理解和應(yīng)用所學(xué)知識(shí)。從班級(jí)規(guī)模與學(xué)習(xí)成績的研究,到種族與就業(yè)歧視的分析,再到移民沖擊和工資的影響等,這些案例覆蓋了學(xué)術(shù)研究的多個(gè)領(lǐng)域,讓學(xué)員能夠?qū)⒗碚撆c實(shí)際相結(jié)合,提升解決實(shí)際問題的能力。同時(shí),課程還提供實(shí)操指導(dǎo),讓學(xué)員在實(shí)踐中掌握各種方法的應(yīng)用技巧。
培訓(xùn)大綱
第1講 統(tǒng)計(jì)推斷
1) 線性回歸、飽和模型、二元選擇模型、方差估計(jì)
2) 帶懲罰項(xiàng)的線性回歸:偏差—方差權(quán)衡、交叉驗(yàn)證法、自助法(bootstrap)
3) Lasso、嶺回歸、Neyman正交、Double Lasso
第2講 潛在結(jié)果框架
1) RCM(Rubin Causal Model)
2) 潛在結(jié)果
3) 分配機(jī)制(treatment assignment)
4) 因果效應(yīng)參數(shù)(causal estimand)
5) 因果識(shí)別
6) 回歸和因果識(shí)別
第3講 因果圖
1) 三種基本結(jié)構(gòu)
2) 后門標(biāo)準(zhǔn)
3) 混雜偏差和樣本選擇偏差
4) 什么是好的控制變量和壞的控制變量
*前門標(biāo)準(zhǔn)
第4講 隨機(jī)化實(shí)驗(yàn)
1) 隨機(jī)化實(shí)驗(yàn)的作用
2) 隨機(jī)化實(shí)驗(yàn)為什么是黃金標(biāo)準(zhǔn)?
3) 隨機(jī)化實(shí)驗(yàn)的分析
4) Design-based和sampling-based方差
案例:
① 班級(jí)規(guī)模與學(xué)習(xí)成績(Krueger,1999)
② 種族與就業(yè)歧視(Bertrand and Mullainathan, 2004)
③ 競選中名字在選票中的位置優(yōu)勢(Ho and Imai, 2006)
④ 媒體的影響(Chen and Yang,2019)
第5講 非混雜性條件下的因果效應(yīng)估計(jì)
最基本的識(shí)別條件是非混雜性(unconfoundedness),也稱為條件獨(dú)立性假設(shè)(CIA, Angristand Pischke 2009),或根據(jù)觀測變量進(jìn)行的選擇(selection on theobservables)或可忽略性(ignorablity),是最基礎(chǔ)的分配機(jī)制。這類策略的關(guān)鍵是通過(匹配)設(shè)計(jì),模擬隨機(jī)化實(shí)驗(yàn)。
1) 匹配、傾向指數(shù)匹配(PSM, Rosenbaum and Rubin, 1983; Abadie and Imbens, 2006)
2) 逆概率加權(quán)(Inverse probability weighting, IPW)
3) 回歸調(diào)整(regression adjustment)
4) 雙重穩(wěn)健估計(jì)(double robust estimator)
5) 雙重機(jī)器學(xué)習(xí)(double/debiased machine learning)
案例:
⑤ 培訓(xùn)的效果(Dehejiaand Wahba, 1999)
⑥ 精英大學(xué)的作用(Dale and Kreuger, 2002)
第6講 工具變量法
工具變量法在模擬非依從的隨機(jī)化實(shí)驗(yàn)。
1) 工具變量法的起源和基本思想
2) 工具變量法的基本識(shí)別條件
3) 如何選擇工具變量,如何討論工具變量的外生性條件?
4) 工具變量法的選擇和說服審稿人的辦法
5) 異質(zhì)性因果效應(yīng)下的工具變量法——LATE(Imbens and Angrist, 1994: Angrist, Imbens and Rubin, 1996)
6) 工具變量法和非依從的隨機(jī)化實(shí)驗(yàn)(noncompliance RE)
7) 基于選擇的工具變量法——Heckman兩步法
8) *未觀測因素為基礎(chǔ)的選擇MTE——邊際干預(yù)效應(yīng)框架(Heckman and Vytlacil, 1999;2005)
案例:
⑦ 出生季度和教育回報(bào) (Angristand Krueger, 1991)
⑧ 參軍與收入 (Angrist,1990)
⑨ 家庭規(guī)模和父母勞動(dòng)供給 (Angrist and Lavy, 1998)
⑩ 美國的教育回報(bào)(Carneiro etal., 2011)
⑪ 全民兒童照護(hù)服務(wù)的收益 (Cornelissen, Dustmann andSchonbrg, 2018)。
第7講 固定效應(yīng)方法
1) 隨機(jī)效應(yīng)模型
2) 固定效應(yīng)模型
3) Hausman檢驗(yàn)
4) 固定效應(yīng)是什么
5) 組內(nèi)回歸(within regression)和虛擬變量回歸(LSDV)
6) Stata命令reg、xtreg、areg、reghdfe的關(guān)系
案例:
⑫ 雙胞胎數(shù)據(jù)估計(jì)中國教育回報(bào)(Li, Liu and Zhang, 2012)
第8講 經(jīng)典雙重差分法
雙重差分法在模擬增量上的隨機(jī)化實(shí)驗(yàn),在線性假設(shè)下,屬于固定效應(yīng)模型。
1) 共同/平行趨勢假設(shè)(Parallel/Common Trend Assumption)、無預(yù)期假設(shè)(no anticipation assumption)、無溢出效應(yīng)假設(shè)(nospillover effects assumption)、共同區(qū)間假設(shè)(overlapassumption)
2) 經(jīng)典DID的因果識(shí)別
3) 經(jīng)典DID的參數(shù)估計(jì):回歸方法、PSM-DID(Heckman et al. 1997, 1998)、逆概率加權(quán)估計(jì)量(Abadie,2005)、雙重穩(wěn)健估計(jì)量(Sant’Anna and Zhao, 2020)
4) 如何在回歸模型中引入不時(shí)變的協(xié)變量Xi和時(shí)變協(xié)變量Xit?
案例:
⑬ 移民沖擊和工資(Card,1990)
⑭ 最低工資調(diào)整和就業(yè)(Card and Krueger, 1994)
⑮ 911事件對美國辦公樓的影響(Abadie and Dermisi, 2008)
⑯ 大學(xué)擴(kuò)招和大學(xué)生失業(yè)(邢春冰和李實(shí),2011)
第9講 多期單一政策DID
經(jīng)典DID的擴(kuò)展,擴(kuò)展到多期,仍然只有一個(gè)干預(yù)組和一個(gè)控制組
1) 基本識(shí)別條件:平行趨勢假設(shè)、無預(yù)期假設(shè)和無溢出效應(yīng)假設(shè)的重新表述。
2) 平行趨勢假設(shè)檢驗(yàn)和動(dòng)態(tài)模型構(gòu)造(事件研究法設(shè)計(jì))
3) 平行趨勢檢驗(yàn)方法和敏感性分析
4) 以個(gè)體出生年份(cohort)構(gòu)成的DID,有時(shí)也稱為cohortDID,并不是一種新的設(shè)計(jì)
案例:
⑰ 茶葉價(jià)格和消失的女性 (Qian,2008)
⑱ 土豆和人口及城市化 (Nunn and Qian, 2011)
第10講 DID-IV設(shè)計(jì)
1) DID和IV的結(jié)合:不滿足平行趨勢時(shí)的新設(shè)計(jì)
2) 基本識(shí)別條件、因果識(shí)別過程
3) 三重差分法(DDD):一種特殊的工具變量法
4) 基本識(shí)別條件、因果識(shí)別過程
案例:
⑲ 印尼建校項(xiàng)目對教育回報(bào)的影響 (Duflo, 2001)
⑳ 強(qiáng)制福利對勞動(dòng)力市場的影響 (Gruber, 1994)
第11講 交錯(cuò)DID(staggered DID)
個(gè)體是逐漸受到政策影響的,不再只有單純的干預(yù)組和控制組兩組,而是有很多的干預(yù)組和控制組,而干預(yù)組被干預(yù)的時(shí)點(diǎn)不同,用這樣的數(shù)據(jù)估計(jì)政策影響時(shí),早期文獻(xiàn)仍然沿用第10講多期單一政策時(shí)的設(shè)計(jì)方法,采用雙向固定效應(yīng)模型(TWFE)估計(jì),但最新的文獻(xiàn)發(fā)現(xiàn),在交錯(cuò)政策時(shí),如果存在組間異質(zhì)性(Goodman-Bacon, 2021)和時(shí)間上異質(zhì)性(Sun andAbraham, 2021)時(shí),TWFE估計(jì)量存在著偏差,事件研究法存在著污染偏差(Contamination bias)。
1) 基本識(shí)別條件的討論
2) TWFE估計(jì)量在估計(jì)什么(Goodman-Bacon,2021; de Chaisemartin and D'Haultfoeuille, 2020)
· Goodman-Bacon分解
3) 事件研究法存在的偏差(Sun and Abraham, 2021)
4) 如果正確的估計(jì)因果效應(yīng):
· Callaway and Santa’Anna(2021)非參數(shù)估計(jì)量
· Wooldridge(2021)回歸估計(jì)量
案例:
㉑ 大而壞的銀行:放松管制與收入分配(Beck et al., 2010; Baker et al., 2022)
第12講 缺失值填補(bǔ)方法
1) 缺失值填補(bǔ)(Borusyak et al., 2021; Liu et al., 2021)
2) 合成控制法(Abadie et al., 2010)
3) 合成雙重差分法(Arkhangelsky et al., 2021)
4) 廣義合成控制法(Xu, 2017)
案例:
㉒ 加州控?zé)煼ò傅男Ч?Abadieet al., 2010)
㉓ 德國統(tǒng)一的經(jīng)濟(jì)影響(Abadie et al., 2015)
第13講 斷點(diǎn)回歸設(shè)計(jì)
最接近于完全隨機(jī)化實(shí)驗(yàn)的研究設(shè)計(jì),教育學(xué)家發(fā)明(Thistlethwaite and Compbell, 1960),作者認(rèn)為價(jià)值不大,但被經(jīng)濟(jì)學(xué)家挖掘出來,煥發(fā)異彩(Hahn et al. 2001)。本章討論RDD、Fuzzy RDD、Kink RDD的基本識(shí)別條件、估計(jì)方法、帶寬選擇方法等。
1) 精確斷點(diǎn)回歸設(shè)計(jì):局部隨機(jī)化假設(shè)、連續(xù)性假設(shè)
2) 模糊斷點(diǎn)回歸設(shè)計(jì):工具變量法
3) 彎折斷點(diǎn)回歸設(shè)計(jì):導(dǎo)數(shù)上的斷點(diǎn)
案例:
㉔ 美國政黨的在位優(yōu)勢 (Lee,2008)
㉕ 空氣污染和壽命 (Chen et al., 2013;Ebenstein et al., 2017)
㉖ 學(xué)區(qū)房的價(jià)值 (Black, 1999)
㉗ 戶口的價(jià)值(Chen et al., 2019)
第14講 因果中介分析
1) 傳統(tǒng)中介分析理論
2) 自然間接效應(yīng)(中介效應(yīng))、自然直接效應(yīng)、控制直接效應(yīng)
3) 因果中介效應(yīng)的基本識(shí)別條件:序貫可忽略性
4) 工具變量因果中介模型
案例:
㉘ 教育通過職業(yè)影響收入的因果中介分析
獲取培訓(xùn)通知、會(huì)議邀請聯(lián)系人:
JG學(xué)術(shù)劉老師
TEL:18600257362
WX:jgzjwanzi
