经济学之镜

2020 年 4 月 18 日

原文首发于《经济观察报》，经过一定修订

一、实证之路

不管人文学者怎么抱怨“经济学帝国主义”的得寸进尺。经济学从没摆脱阴暗的科学（Dismal Science）的外号。单单是主流经济学家们在面对重大的经济学问题时互相分歧的回答，就不符合一门严肃科学在应有的公众形象。

诺贝尔经济学奖的奖项选择也多少暗示了这样的现状：1974年的诺贝尔奖由哈耶克和缪尔达尔分享。两人都在经济周期和货币政策的研究上做出过先驱性贡献，可其立场却截然相反。2013年获奖者尤金·法玛和罗伯特·希勒则分别是有效市场理论和非理性繁荣论的代表人物。相比而言，2019年诺贝尔奖的选择，更多体现出经济学共同体中共识的那一面。

达龙·阿西莫格鲁在他主编的《经济学》教材中总结到，现代经济学的三个基石是均衡、最优化以及经验研究。均衡是经济分析的方法总框架，最优化是经济学对经济主体行动的先验假设，经验研究则是经济学与“自然科学”最为靠拢、也是当代学术成果最为丰硕的领域。本届诺奖获奖人的贡献，正是在经验研究方面。

诺贝尔经济学奖委员会将三人学术成就简述为减轻全球贫困方面的实验性做法。其具体所指，即为将医药学研究中常用的控制变量对照实验法（Random Controlled Treatment, RCT）引入发展经济学研究，对扶贫和政策领域所带来的突破性变革。从本届获奖人开始进行学术贡献（2002年）到获得诺贝尔奖（2019年）之间不同寻常的短暂间隔，可以看出这一新方法和新路径是多么迅速的获得了经济学界、政策界的普遍接受和赞扬。

二、随机控制实验法的兴起

班纳吉和迪弗洛夫妇（前者同时也是后者的博士生导师）在十年前的畅销书《贫穷的本质》中就曾主张，扶手椅争论对理解真实世界的问题和提出有效的政策建议并无帮助。经济学家应关注严谨、基于证据的科学研究。他们认为，在面对真实世界的问题时，经济学家们总是太多主张，太少证据；太多故事，太少方法。多年实践表明，随机控制实验确实是解决很多经济学争吵的重要武器，并且对改善数百万人的生命和福利有着真实可见的影响。

该书提到的两个著名研究案例是他们的得意之作，最好地体现了RCT方法的独特优势。本文在此略加详细的介绍。

第一例是贫穷国家防治疟疾流行的政策选择。疟疾肆虐对非洲贫穷国家的发展和人民生活造成巨大损失。由于蚊子是疟疾传播的主要途径，通过广泛使用低成本的通过杀虫剂处理的蚊帐，就可以有效降低疟疾感染率。然而NGO和国际组织在非洲发放的免费蚊帐只有很低的使用率，降低了抗疫的效果。著名经济学家伊斯特利（《白人的负担》一书作者）指出，人们不用免费蚊帐的一个原因恰恰是因为它们是免费的。人们对于免费的东西很少能够正确估价。因此，伊斯特利建议国际组织应该以补贴过的价格把蚊帐卖给当地人，这会鼓励他们对来之不易的产品物尽其用。

这个主张是通过对行为主体的假设所推导出的结论。要证明这个假设的合理性，我们必须有经验的方法来加以检验，而这恰好就是RCT大显身手的地方。班纳吉通过精巧的设计，通过多组对照实验，发现免费发放不是蚊帐使用率低的主要原因，以市场价/补贴价卖出蚊帐也不会提高它们的使用率。相反，哪怕以一个很小的奖励鼓励人们开始使用蚊帐，让他们体会到使用蚊帐的具体好处，在奖励结束后蚊帐的使用率也不会下降。受益者甚至会把使用蚊帐的好处告诉自己的邻居，鼓励他们也使用。通过推广在实验中得出的结论，非洲疟疾疫区以很低的成本持久、广泛的提升了防虫蚊帐的使用率，大幅降低疟疾感染。

第二例是穷人分配资源时的消费选择。有一种假定认为穷人不能理性支配自己的命运和收入，所以最好由别人替他们选择他们要获得什么帮助。基于这种假设，相比直接的现金发放，各类食品和日用品兑换卷和价格补贴更受到政策制定者的欢迎。班纳吉在实地考察中发现，很多穷人在获得经济改善后会消费口味更好，但营养更差、价格更昂贵的食品。所以直接以营养摄入为指标的政府补助经常错失穷人的重要需求。通过对比发放食品补贴和直接现金，班纳吉和迪弗洛更近一步发现，那种关于穷人无法控制好自己资源的刻板印象是不准确的。接受现金的受试者花在食物上的消费比例并没有下降，甚至还有所上升。他们并没有拿去酗酒、赌博，或花在其它炫耀性消费上。他们得出两个重要结论：其一，即便是穷人，也会在基本的营养摄入和口味之间权衡，缺乏对穷人偏好的实际了解在扶贫工作中会出现偏差；其二，至少部分穷人对自己所处的有限资源进行“理性”规划的能力比常识所愿意设想的更强，这对扶贫政策的制定有着重大的启示。

用统计学术语来说，随机控制法提高了经济学理解特定经济现象时的内部效度：该方法可以相对精确地测定特定的因素（蚊帐是否免费、补助是否是现金），和特定的现象（蚊帐使用率高低、在食物上的花费是否变少）之间的因果联系。这对检验特定的扶贫项目的具体效果和设计新的社会政策格外有用。在《贫穷的本质中》他们写到，同样是通过受控随机田野实验，研究者发现曾经获得诺贝尔经济学奖，并且被很多国家和地区试图效仿的尤努斯小微金融，在改善穷人、妇女的金融状况方面实际效果非常有限。

三、随机实验的限度

但正如万事皆有利弊，随机控制法也有局限性。首先，随机实验尽管提升了具体预测的内部效度，但是他对外部效度的贡献就相对较小了。外部效度指的是某个实验的结论在多大程度上可以推广。可推广性强意味着，从特定实验设置得出的结果，有助于我们对更广泛和一般的现象的把握。这要求经济学家们对随机试验中所表现出的要素之间的相关性有更本质的理论把握。单靠随机试验本身无法提供这种理解。其次，医药实验中的随机分组的周期更长，样本更多，测试的环境更丰富，对变量的控制和把握更加简单有效。生物学对药物原理的掌握也更加明确、具体。相对来说，经济学（包括社会心理学）实验所采取的样本数一般较少，实验设置中无法设想的遗漏变量也更多。这对经济学实验之结论的有效性也提出了挑战。

最后，许多重大的经济学问题原则上就无法用对照试验的方法研究。像中国、印度、美国这些各自体量巨大，历史独特的经济体，其总体的发展是无法随机设计对照研究的。即便下降到区域和行业级别，我们能做的也无非是通过观察的方式，从能够获取的真实数据中，结合具体的模型和假设，设计我们的理论和检验。而这正是传统经济学的研究方法。

班纳吉和迪弗洛获得诺贝尔奖后刚刚出版的新书Good Economics for Hard Times（《坏年头的好经济学》）是一本出于经济学家的公民责任而呼吁行动的、关注大问题的经济学普及读物。面临移民、自动化、贸易、福利改革、扶贫、气候变化这些重大的发展问题，班纳吉和迪弗洛认为自己有义务代表整个经济学家团体（或经济学家最接近共识的部分），进行澄清和呼吁。作者们强调自己向公众所普及的是经济学的工作方法和思维方式，而不是更具体的口号化的结论。

由于他们在本书中处理的主题远远超过小规模随机控制实验的范畴，所以他们大量借鉴了同行中最新、最优秀的成果，以优美、流畅的笔触加以融会贯通。虽然同行们的方法和班纳吉和迪弗洛不同，但注重证据，讲求验证的思维模式和RCT方法背后的精神是一脉相通的。这正好也代表了当代经济学的最佳实践：大胆假设、小心求证，将实验证据、理论解释、微观案例相结合。

在“移民”和“贸易”等相关章节中班纳吉和迪弗洛以简洁、精确的语言向读者普及了最近几十年经济学家发展出的常用研究工具和统计概念：比如自然实验，双重差分，跨国回归，识别问题等等；以及重要的经济学概念：劳动力和资本流动的黏性；交叉价格弹性等等。

四、在观察和行动之间，在描述和盼望之间

对于RCT方法在研究“大问题”上的无力，班纳吉从不讳言。他似乎把哲学家维特根斯坦“能说清楚的就说清楚，对不能说清楚的就保持沉默”奉为圭臬。正如他在新书中娴熟但却毫不留情地总结发展经济学的可悲现状时所重复的，班纳吉多次提倡经济学应研究具体的、可以处理的问题，而较少投入精力到那些更像是哲学思辨和信念比拼的智力投资中。前者是真正能造福人们的“好经济学”，后者则要么无用，要么有害的“坏经济学”。

有趣的是，正是班纳吉和迪弗洛在本书中的优秀写作，反而向读者们更明显的暴露了他们所主张的“好坏经济学”、“好坏经济学家”的区分存在明显张力。

从纯粹经济学理论角度来看，《坏念头的好经济学》用丰富的方法和理论呈现，向我们揭示了“好的经济学”绝不仅仅是用最靠近自然科学的RCT去研究“小问题”。大的问题缺乏好的回答是因为这些问题很困难，而并非其没有意义。承认我们目前的成果充满矛盾和不确定性，既是知识诚实，也是对知识进步的号召。实验和统计可以揭示相关性，但理论才提供理解。我们不仅仅满足于看到，中国进口确实对美国特定地区（虽然不是整体）的制造业就业造成重大打击，我们还需要黏性这个概念来更一般的把握问题的实质——和李嘉图的完美假设不同，具体的劳动力很难在地区、行业之间无摩擦无成本的流动，这导致他们常常困守衰落地区，承受贸易的直接代价——而这有助于帮助我们去更好的探索贸易在世界其他地区是如何影响当地就业的。

经济学家是人，不是经济学的载体。他们自然也有别的身份，有超出纯粹知识兴趣之外的目标。当活动家、领袖、公共知识人呼吁行动，她们是在提供愿景（Vision）。人们行动起来是出于对“好世界”的期盼和对“坏世界”的厌恶。大众的愿景必然包括信念的简单化和口号化。最好的基于证据和推理经济学往往提供的是怀疑主义——也许，在特定发达国家的特定区域的特定时期，低技能移民不会挤占本地低技能劳动力的工作岗位。这说明当地劳动力市场有着充分的需求弹性（又一个该死的抽象概念！），但这无论从理论上还是经验上都不是必然。也许，对最富裕群体的减税不会影响他们工作的热情（毕竟他们已经非常有钱），但是无论是理论还是经验证据都指出大部分人确实会对税收水平作出反应：当税收上升，人们更少创造。

班纳吉和迪弗洛在《贫穷的本质》和《坏年头的好经济学》中都着力强调社会对部分群体的刻板印象，会对他们的自我认知和实际表现造成重大影响。不幸地是，在持续至今的社会心理学“复制危机”中，各式各样关于刻板印象威胁（Stereotype Threat）的实验成为重灾区——我们应该遵从最新的严格科学标准所提示的怀疑主义？还是继续大规模的投资于各种改善“刻板印象威胁”的项目？这同样取决于你的信念和愿景。

经济学中无处不在，而在本书中却鲜见的一个词就是权衡（trade-off）——为了获得一些东西，我们可能会失去另一些东西。对不同均衡点之间的选择就是愿景之间的对抗，就是对何谓更好世界之看法的分歧。经济学或社会科学（无论好的坏的）本身无力提供确切答案。经济学家作为公民可以选择自己支持的愿景，并用自己专业知识加以修缮改进。但这并不是经济学家作为经济学家的本分。

当班纳吉和迪弗洛充满激情地描述经济学家对现实问题的诊断，并提出自己的政策建议时，他们预设了自己听众极大的善意和行动自由。他们认为卫生组织确实最想要让疾病造成的损失最小化，地方官员确实最想要让居民扶贫脱困。阻碍他们成功的是缺乏正确的知识和方法，而不是动机和意图。但现实告诉我们这很少是事实。

当我们不再把经济学的分析框架局限于政策制定者们所处理的对象，而把决策者本身也包括进去，把他们也当成有着自己复杂动机、会对激励作出反应的行动主体，我们就进入了新政治经济学的研究领域。我们会研究为什么出于决策者的理性选择，而非经济学知识的缺乏，好的经济政策在政治上很可能不可行。（“如果人均基本收入让我丧失自己对选民的控制，我为什么要追求它？”）我们不仅考虑一个政策在经济层面上会造成的影响，还有它对政治均衡可能造成的冲击。在大多数情况下，糟糕的政治均衡会反过来让大量良好的经济政策变得政治上无法实施。

班纳吉和迪弗洛大胆建议由政府对衰落地区的制造业岗位提供补贴，缓解产业转移必不可少的痛苦，同时通过大规模服务业公共支出创造就业，以应对自动化的威胁。政治经济学分析则指出，过于慷慨和发达的指向性公共支出就是在邀请恩庇主义和政治操弄。这是拉丁美洲政治和经济陷入死局的典型症状之一。他们强调GDP核算对于衡量人类福利的不完整性，主张将更加无形的痛苦和欢乐包括在内。政治经济学的洞见再次暗示，在官僚机构缺乏制衡的广大国家和地区，主观指标为官员考核的造假和扭曲大开方便之门。这将对本就脆弱的官员可问责性造成潜在的灾难性削弱。

在《坏年头的好经济学》最后几页，班纳吉和迪弗洛讲到他们和几位来自发展中国家的NGO成员的接触。作者们写道，这些热情和充满理想的同事让他们大受感动。本书以经济学家的冷静开始，以活动家的热情结束。好经济学基于严格的证据和小心的推测，“行动”和“想象”则更看重激情和印象。然而经济学并不停止在行动和愿景开始的地方。它不仅像自然科学一样研究外在的客体（他人），也提供一面自照的镜子，反射出我们自己的形象。它不厌其烦地告诉我们，那些被迫切呼唤着行动起来的人们，远非完美无缺的天使。

本文关于内部效度/外部效度，以及随机实验局限性的段落参考了：https://afinetheorem.wordpress.com/2019/10/17/what-randomization-can-and-cannot-do-the-2019-nobel-prize/

关于班纳吉对“大问题”的态度，和Prichett的批评，参考：

https://m.facebook.com/lant.pritchett/posts/10218688602381690

CC BY-NC-ND 2.0 授权