陈玉宇等人2013年7月8日发表于《美国国家科学院院刊》(PNAS)的论文[1]研究了中国空气污染对健康的影响。文章通过断点回归模型估计了空气污染和预期寿命的因果关系。文章认为中央集中供暖导致了淮河以北的城市的总悬浮颗粒物浓度极大提高和预期寿命显著减少,这项政策使北方人平均寿命减少5.5年。该研究总结,中央集中供暖政策对人的健康有灾难性的影响(原文”disastrous consequences”)。

  这篇文章发表后在国内外受到广泛关注。在几天内,《自然》杂志,《纽约时报》,《洛杉矶时报》,《华盛顿邮报》,《卫报》,《Fox新闻》,《CNN》,《路透社》,以及其他200多家国际主要媒体报道了文章的研究成果。在中国,关于这篇文章的讨论几乎可以在所有主要媒体和社交网络上找到。

  然而,这篇文章存在几个较为严重的数据和方法上的问题,导致结果并不可信。文章不正确地对城市样本分组,运用了不恰当的研究设计和计量方法,并给出了有误导性的研究结论,因此不宜作为国家政策的参考。

  一、样本分组分组

  这项研究使用了一种叫做断点回归的计量模型。该研究设计的关键假设是:秦岭-淮河线将中国的城市分为两组,一组在秦淮线以南,一组在秦淮线以北。秦淮线以南的城市没有中央供暖,秦淮线以北的城市有中央供暖。作者认为在秦淮线附近区域内,除了中央的集中供暖政策外,影响健康其他因素不会有太大变化。 中央集中供暖政策则会通过显著增加秦淮线北边城市的空气污染,对这些区域的人群健康造成损害。

  

  然而,该研究中地图上用来区分研究样本所使用的分界线并非秦淮分界线。

  图1 是原文所用的地图,黑色实线用于做南北分界。这条线并非供暖政策的淮河分界线。淮河位于图中黑色线上方,大约3个维度的距离。地图上的红线标示了秦岭淮河的大概位置。文中地图被向左旋转了一个角度,导致黑色线看起来几乎是水平的。实际上红色线应该是大致水平(东西向)。由于断点回归模型的结果严重依赖于分界线周边样本的情况,错误的分界必然导致结果有偏。利用原文的示意图,我们发现如果使用正确的秦淮分界线, 不论是总悬浮颗粒的浓度,还是预期寿命都没有明显的跳跃。原文很可能高估了该政策对健康的影响。

  在进行城市样本复查的过程中,我们还发现本文使用的坐标也可能存在问题。在这篇论文正式发表前的工作论文稿中,地图标示了更多城市名称。例如,在图2中,洛阳被标示在郑州东边,实际上洛阳在郑州西边。如果本研究的坐标误差的话,在匹配健康数据和空气质量数据的时候,可能存在更多的错误。

  

  我们猜测,该研究中发现的显著性结果可能主要来自于上海及其周边城市。这些城市在文中被分组到正好位于黑色线下方的区域中。这些城市属于中国最高收入的几个城市,临海且人口数量较大,同时拥有较好的空气质量和较高的预期寿命,并不能代表淮河以南的大多数城市。

  二、模型使用不恰当

  为了估计供暖政策对人均寿命的影响,该研究使用了全局多次函数拟合方法进行断点回归模型估计。这一模型的局限在于,估计的结果受具体函数形式的影响很大;同时,淮河以南的样本会影响淮河以北的拟合结果,反之亦然。如果南北方人均预期寿命与其相应的影响因素的关系存在差别,则这一模型的估计结果是有偏的。在使用断点回归模型时, 研究人员通常会将断点两侧的样本分开做拟合。从论文中给出的示意图来看,如果分开拟合的话,秦淮两侧人均预期寿命不会有实质性的跳跃。

  该研究还用了一种叫做”两阶段回归”的方法估计空气污染对预期寿命的影响。为了得到正确的估计,这一模型须假设在秦淮两岸空气污染的差异,完全是南北暖气政策造成的。文章认为,暖气政策按照秦岭-淮河线进行划分是政府任意独断的(原文”arbitrary”) 。因此在这条线两侧的城市,除了这个政策差异外,其他社会经济变量应该差别不大。但这是一种错误的认识。首先,在淮河流域,虽然淮河两岸城市的社会经济变量可能差别不大,但淮河南岸城市与北岸城市的空气污染并不可能被淮河完全隔离。更重要的是,在秦岭两侧,虽然秦岭能够很大程度上阻隔空气污染的跨区域流动,但空气质量的其他影响因素因为秦岭发生了重要的变化。秦岭对南北城市的气候、农业、水系、土壤均有重要影响。与秦岭北边的城市相比,秦岭南方城市有更多的降雨量,更高的气温,以及更多的暖风。 这些因素不仅会造成南北空气质量的显著差异,也可能直接影响人的健康状况。实际上,秦淮线同时也是水田旱地分界线,水稻小麦种植分界线,亚热带气候与温带气候与分界线。正是这些显著的地理、气候和环境差异,让这条线成为了中国传统上的南北分界线,建国初期国家供暖政策对城市的划分也并不是任意独断的。该研究并未对秦岭南北这些重要的地理、气候、环境差异进行深入讨论并加以控制,导致该文无论是对供暖政策影响的估计,还是对空气污染影响的估计,都是不可靠的。

  三、结果的解释

  研究所使用的断点回归模型只是局部有效的。该研究忽略了断点回归模型的局部有效性,将结论推广到全国范围,并错误的推断中央集中供暖政策累计导致了25亿年的生命损失。

  经济学家研究因果关系时,通常用”反事实”(counterfactual)来形容某个体如果没有受到某个政策影响会发生什么情况。例如,我们会问,如果北方城市没有供暖的话,可能出现的情况是什么?总体来说,南方城市的人均寿命并不是北方城市人均寿命的一个很好的”反事实”。北方冬天寒冷,如果没有中央集中供暖系统,大多数家庭(1980-2000s)将自己烧煤取暖。这样不仅成本更高,还会导致严重的室内空气污染与室外空气污染。室内空气污染通常比室外空气污染对健康的损害更大。实际上,更加合理的”反事实”推测是,中央集中供暖提高了北方人的人均寿命,因为如果没有这套系统的话,将会有更多人死于寒冷或者更加严重的室内空气污染。在研究使用的数据中也证实了这一点,北方人平均预期寿命比南方人高1岁。

  综上,该研究可能错误的将城市进行了分组,使用了不恰当的计量模型和研究设计,并给出了有误导性的结论。过去几年有大量关于南方城市集中供暖问题的讨论,网上的投票表明大多数长江以北城市的居民都希望政府能够提供集中供暖系统。这篇研究传递给公众和政策制定者的错误信号是,如果这些区域也有了中央供暖系统的话,人们预期寿命会降低5.5年。

  空气污染对健康的影响是一个重要的研究课题,准确的估计出空气污染的社会成本,是国家制定相关政策的基础。希望将来有更多的科研人员加入到这一研究领域,以更严谨的态度做更科学的研究。

  参考文献:

  Chen, Y., Ebenstein, A., Greenstone, M., & Li, H. (2013). Evidence on the impact of sustained exposure to air pollution on life expectancy from China’s Huai River policy. Proceedings of the National Academy of Sciences.

本文责编:frank
发信站:爱思想(http://www.aisixiang.com),栏目:天益学术 > 经济学 > 公共经济学
本文链接:http://www.aisixiang.com/data/66573.html
文章来源:爱思想首发,转载请注明出处(http://www.aisixiang.com)。

本文由自动聚合程序取自网络,内容和观点不代表数字时代立场

墙外新闻实时更新 欢迎订阅数字时代