阅读分享|《异质性分析!异质性分析!》

时间:2023-06-12

2023年6月6日,由西南财经大学社会发展研究院人口研究所、四川省人口与发展数据实验室联合开展的2023年第七期师生阅读分享活动在通博楼A509顺利举行。

本次阅读分享活动由2021级人口学博士研究生刘庆昇介绍发表连享会20234月17日文《异质性分析!异质性分析!》(作者:陈波,暨南大学)。

该文介绍了当下论文中异质性分析存在的问题。如今研究者习惯做异质性分析,但是在研究设计阶段很少问为什么要做异质性分析。也许因果效应的异质性本身就是重要的。例如,在教育回报率的研究中,除了得到一个全样本的估计之外,研究者可能还会关心女性的教育回报率是否显著地高于或者低于男性,由此得出不同的政策含义。想要将因果效应的异质性本身作为文章的主要“卖点”,势必要求这种异质性的对比十分鲜明。比方说,因果效应在全样本中是显著的,但这种显著性只在其中一个子样本中继续存在,在另一个子样本中则不存在。例如,研究小额信贷(D)对家庭财务状况(Y)的影响,可能发现总体上两者呈现出反直觉的负相关——借了钱的家庭反而更容易陷入窘境;但对家庭按理财素养(M)进行分组后发现,这个负面效应只在理财素养低的家庭中存在,在理财素养高的家庭中并不存在。这样的结果既在意料之外,又在情理之中。但在一些文献中,研究者往往只是出于扩充文章篇幅的需要,在基准回归之外,出于某种“八股本能”,按地区、规模、所有制等进行一些异质性分析。反正这样做很安全,不管系数是否有差异,不管差异的方向是正是反,都有话可说。例如,某种效应如果在东部地区比较显著,可以解释为东部地区的市场化程度较高;如果在西部地区比较显著,则可以解释为西部地区受到国家优惠政策的倾斜更大。再比如,某种效应如果对非国有企业比较显著,可以解释为非国有企业的经济激励更强;如果对国有企业比较显著,则可以解释为国有企业的非经济激励更强。这种缺乏事前理论分析与预期,完全根据事后估计结果强行附会理论解释的做法,无异于数据挖掘。同时从辛普森悖论和没有普适的政策两点来阐明为何要做异质性分析,并通过一系列经典文献总结说明了什么样的分析才是好的异质性分析。具体包括强化因果关系、呼应经典文献、具有政策含义和紧扣核心变量四个方面。

对于这篇文章,刘庆昇同学分享了自己的学习体会,认为该篇推文具有较高的分享价值与启示意义,同意异质性分析不是用来凑篇幅的,应该做有意义的异质性这一观点。同时表示同学们在日常论文写作中,也需要注意异质性分析等相应问题,不能为做异质性而做异质性,重要的是与论文本身相契合,贵在言之有物。而且异质性分析也并非文章所必须。目前也有越来越多的文章不做异质性分析,转为将精力放到更具深度的进一步分析,试图拓展文章的纵深,挖掘出更有价值的信息。此外,刘庆昇同学也就异质性分析和自己的论文中相应的问题与在座的老师和同学进行了讨论。

2021级博士研究生陈芊扦同学对在异质性分析时何时使用分组回归、何时使用交互项回归进行提问,刘庆昇同学及在座师生对该问题进行了讨论并回答。

2020级博士研究生陈广坤同学对异质性分析中有关控制变量的应用提出了困惑。例如,“性别”通常在基准回归中作为控制变量,但如果需要以“性别”作为分组变量进行异质性分析,在分组回归中是否需要删除控制变量中的“性别”,删除的话会导致分组回归和基准回归中的控制变量不一致情况,不删除的话“性别”既作为控制变量又作为分组变量,似乎存在矛盾。刘庆昇同学认为,异质性分析的时候,如果以某个控制变量分组进行分组回归,不需要控制这个变量,如果用交互项检验异质性的话就还需要控制这个控制变量和其与解释变量的交互项。

刘芹老师认为,庆昇同学以详实的文献为支撑,重点介绍了有关异质性分析的知识,尤其是对于“异质性分析为何重要”以及“如何才是有意义的异质性分析”这两个问题进行了解答和分享。根据其阐释,刘芹老师以刘庆昇同学的工作论文《非认知能力与居民生育意愿》为基础,对文中的异质性分析内容进行了讨论。针对刘庆昇同学提出的“如何才是有意义的异质性分析”的问题,对该论文中所使用的相关变量进行了讨论,包括有无子女、性别、户口、受教育年限、认知能力和身体健康。

师生阅读分享活动旨在提升研究生在基础知识、方法理论、学术演讲等方面的能力,为研究生开阔学术视角、加强问题意识与学术积累提供了良好的学术场景与环境。同时,也向所选读专著或论文作者的学术贡献表示感谢。