【转】NBER和QJE所刊登经济学家对香港学生运动研究之道德疑点
Paper地址:https://home.uchicago.edu/bursztyn/Persistent_Political_Engagement_July2019.pdf
本文版权归原作者所有;本人转发此文供各位理性讨论。
原标题:实锤香港被境外势力干预!经济学家的伦理道德何在?问责NBER和QJE
作者: Participant
本文转载自:政策救生圈
摘要
美国权威经济学研究所NBER (June 2019)和期刊QJE (May 2019)纵容欧美经济学家在香港开展严重违反科学研究伦理道德的社会实验:使用现金奖励煽动香港大学生(HKUST)参与“七一游行”。
对于如此毫无伦理底线的研究行为,我们必须从道德和学术上对其进行双重批判,并呼吁港科大和斯坦福等高校重审其IRB流程,并建立RCT属地报备制度。
本文共4500字:吃瓜部分1810字(共需要10分钟),学术部分2700字(共需要30分钟)。
强势围观
7月21日周日晚,香港泛民派冲击中联办,而后部分示威者在元朗和西铁被黑社会人士攻击。这次反送中游行在规模和影响力上已经足以载入史册。
笔者在推特上发现一位名为Robert Dur的经济学家,并在其主页上发现了某些不得了的东西:
某些经济学家在香港开展了违反社会科学伦理的社会实验,利用金钱鼓励(最高达900港币)部分香港大学生参与抗议活动,并美其名曰为“探索影响社会运动的因素”。
该文章是Leonardo Bursztyn, Davide Cantoni, David Y. Yang, Noam Yuchtman, Y. Jane Zhang等人在2017-2018年(雨伞运动期间)所做的研究。论文题目是:《持续的政治参与:社会互动和抗议运动之间的动态关系》(Persistent Political Engagement: Social Interactions and the Dynamics of Protest Movements)。
该研究在道德伦理上有明显的争议和缺陷:怎么可以用金钱去煽动外国学生?推特中仅有的十几条评论,除了两条在讨论“香港是否属于独裁社会”之外,全部都在质疑该研究的道德伦理。
推特评论精选
“非常令人震惊。这个研究得到伦理许可了吗?怎么可以发表如此不道德的研究?”
“显而易见,从道德伦理来说是非常有问题的。”
“非常恶劣的行为。研究者的道德底线太低了。”
该论文属于美国NBER(National Bureau of Economic Research,美国权威的经济研究所)的会议论文。当然,网友Nick Or提出NBER的conference paper并没有经过同行审议。Nick还很友好地晒出另一篇已发表的论文(经同行审议)。
另一篇的内容也还是差不多的:鼓励香港学生参与抗议活动(但不是金钱激励)。笔者一口老血喷出来,居然还是发表在QJE 2019年五月刊。QJE是全美五大权威经济学期刊,到底有多权威,经济学学生应该心知肚明。
公开发表在QJE的这一篇主要是将“告知受试者关于本校学生计划参与游行的人数”作为主要干预方式,结论是学生如果知道身边有更多的人计划参与游行,那么他们参加游行的可能性更高。
乍看之下,这种干预模式其实不存在严重的道德问题。但其实本质和2016年美国大选的“剑桥数据门”没有任何区别——通过投放具有误导性(非全面)的信息来干预公众的政治行为。也就是说,研究者在向部分受试者不断强调“本次游行有XXXX人参加”的同时,并没有提供“不参加游行”的人数信息。除此之外,研究者还将所谓“计划参与的人数”作为“事实”告诉受试者,让受试者“以为”真的有那么多人实际参加,从而达到政治宣传的目的。
当然,这篇QJE在道德堕落上远不如NBER会议论文让人震惊。
下面笔者就带大家细细扒一扒这篇道德沦丧的NBER论文。
为什么说它道德沦丧?主要有三点:
1
没有经过严格的伦理审查。
尽管文章声明“该研究经过慕尼黑大学、斯坦福大学、加州伯克利和港科大的IRB(机构审查委员会)的批准。资金来源欧洲研究理事会(ERC)”
但很明显,如此敏感的社会实验项目居然没有报备当地机构?
这个逻辑就像是:A医院的医生借B医院的病人C做临床实验,理由是拿到了A医院的内部许可,花的钱还不是A医院的。(A最大赢家?)
你们这些学者是认真的吗?是不是就欺负中国没有独立的伦理审查委员会,然后拿中国人给你们当小白鼠?现在就算是去非洲大陆撒钱做慈善都要被人质疑是否存在伦理风险,外国学者可倒好,来香港撒钱煽动革命还能混两篇文章?
我对伦理审查没有任何了解,希望对这方面了解的同学可以查阅以上两个RCT实验的审查报告。两个实验的注册号分别是:AEARCTR-0001423和AEARCTR-0002301。
2
欺骗学生(被试者)。
虽然研究的内容是“金钱如何煽动抗议”,但是研究者在招募学生的时候可不是这样说的。招募受试者的广告是这样的:
“过去有许多同学会参加7.1游行,所以我们邀请部分同学帮我们统计7.1游行的参与人数…我们希望你们能够积极参与,为科学做出贡献。在游行中,这仅仅花费5分钟…一旦你们上传了所有数据,我们会提供350港元的报酬。”(原文P8)
我TM真的要报警了!本来是要鼓励大家参与反独裁游行,结果现在把“参加游行”换成“帮我们统计人数”,把“反独裁抗争”换成“为科学做出贡献”(原文是Participate in this scientific endeavor)。
真TM服气!我要是价值中立的被试者,我还真的以为只是帮你们做统计一下游行人数,结果你们把我看作参加抗议游行?
3
用高额现金作为奖励方式。
作者在开头(P6)还假惺惺地说:“我们不打算通过直接发放现金的方式来增加参与抗议游行的人数”,到最后变成“学生帮我们统计人数,我们提供劳务费”。
给劳务费难道就不是直接给钱了吗???这群人脑回路被狗吃了?
给的钱还这么多?统计人数(耗时5分钟)值350港元?用屁股想都知道你们就是想找人来给7.1游行站台。
不仅如此,如果学生完成全套实验,可以拿到总计900港元(350+350+200)的现金奖励。
本实验一共招募了1100名被试学生,总共849人完成了全套实验。光是现金奖励就至少花了76万港币。真的是狠下血本!
非学术人员可撤离战场
下面我就该文章的研究方法,包括概念定义、变量纳入、随机抽样的方式以及因果关系进行学术讨论,试图从学术的角度论证研究的不可靠性。
非学术人员可撤离现场。
原文摘要:“我们想要研究:在政治运动中,参与某次抗议活动的人数会不会影响参与后续抗议活动的人数,以及原因是什么…我们随机地、间接地鼓励香港大学的学生参与反独裁的抗议游行…我们发现鼓励抗议活动能够有效增加一年后抗议活动的人数…奖励越丰厚,参与抗议活动的意愿和强度就越强,说明了社会互动(social interactions)有利于维持政治运动的参与。”
该研究的干预流程如下:
第一步:所有受试者都会进行基线调查。基线调查的问题主要是当事人的政治态度(见原文附录C)。完成调查可以得到300港币劳务费的承诺。
第二步:如果受试者被分到对照组,那么他们不会受到任何干预;如果受试者被分到实验组,那么2017年6月30晚他们会收到一封邮件,内容如下:
“过去有许多同学会参加7.1游行,所以我们邀请部分同学明天(笔者注:也就是7月1日)帮我们更好地统计7.1游行的参与人数…我们希望你们能够积极参与,为科学做出贡献。在游行中,这仅仅花费5分钟…一旦你们上传了所有数据,我们会提供350港元的报酬。”
第三步:进行7.1游行的后测调查,主要关于受试者是否参加了7.1游行。如果完成调查,受试者可以获得50港币的额外奖励(除了第一步的300港元外)。
第四步:纯对照组和实验组不会受到任何干预。“安慰剂组”将在7.1后一周的周末收到一封邮件,内容如下:
“有许多同学会到中环地铁站坐地铁,所以我们邀请部分同学明天帮我们更好地统计地铁站内的人数…我们希望你们能够积极参与,为科学做出贡献。在地铁站中,这仅仅花费5分钟…一旦你们上传了所有数据,我们会提供350港元的报酬。”
第五步:2018年7.1游行前测调查,主要询问当事人政治态度。完成调查可获得100港币。
第六步:2018年7.1游行后测调查,询问当事人是否参加了游行。完成调查可获得100港币。
以上就是实验干预的最主要内容。下面我来讲讲这个研究的问题有什么。
文章的论证一共分为两部分。
第一部分:短期的金钱奖励能鼓励学生上街游行;
第二部分:短期的金钱奖励能够导致长期(1年后)的政治参与,不是通过改变受试者政治价值和政治倾向,而是通过社会互动(在游行中认识朋友)。
但笔者发现两个重大缺陷:
1. 研究者对“实验组”的定义模糊了“自变量”和“因变量”的区别,进而导致循环论证;
2. 研究者在进行随机分配的时候采用的是block randomization结合individual randomization的方式。但是通过数据发现,随机分配的blocks存在被人工干预的情况,进而导致只有blocked randomization,但没有individual randomization。以上随机化的结果便是强化了同一群体内部的互动效应。也就是说研究者第二部分得出的结论并非科学,而是其随机分配方式造成的偏差。
1
实验组的定义
研究者对于“实验组”的定义严重模糊了“自变量”和“因变量”的区别。
原文P8说到:“Subjects who uploaded all … information and completed … reporting module would … receive the bonus payment, and we consider them to have taken up the treatment”。
也就是说,在研究中所谓的“实验组”不是那些在7.1游行前收到邮件的学生,而是那些已经7.1上街并收集人数信息的学生。
这是一个非常严重的定义错误。按道理来说,所谓的“实验组”应该是受到干预的人群,也就是那群收到邮件的学生;而不应该是已经上街的学生。
如果按照研究者的定义,一个学生只有上街了才能被划入“实验组”,那岂不是所有的“实验组”都上街游行了?研究者通过定义强行将“上街”和“实验组”划上等号。
这就相当于自我循环论证。“收到钱的学生更有可能上街(因为学生只有上街才能收到钱)”。
2
失败的随机化
实际的随机分配并没有遵循文章所说的随机分配。文章宣称其随机化的方式是cells (也就是上文的blocks) randomization和individual randomization相结合。
但实际上,真正的cells (blocks) randomization 应该是按照受试者进入样本的时间先后分组,通常以30-40人为一组(one cell/block),然后在组内(cell/block)按比例(1:1或1:2)分配实验组和对照组。
依照正常的逻辑来说,每一组的人口特征应该千差万别,因为分组的规则只是受试者进入样本的时间前后。
但该研究的随机化cells(blocks)却是这样的:
很明显,所有的受试者都被研究者人工干预过:研究者将“性别、年级和专业”相同的受试者分配在同一组,不再按随机顺序来分组(cells/blocks)。
如此分组的弊端很明显:非常容易造成“实验组”和“对照组”存在结构性差异。
因为真正的cell(block)分组是存在两个随机化过程:一是组内随机化,二是组间随机化。这两个随机化过程能最大限度地保证最后筛选出来的“实验组”和“对照组”是不存在结构性差异的。但如果按照该研究的Cell随机化,组内随机化是不存在的,因为组内受试者都是相似的,仅仅剩下组间随机化。由于cells(blocks)的总数不到一百个,所以十分容易出现随机化失败的情况。
此外,研究者在组内(cells/blocks)随机化的过程中还非常神奇地用了五种比例:0%、1%、25%、50%和75%。也就是说每一组内的“实验组”人数比例从0%~75%不等。笔者没有学到过不同比例的blocks(cell) randomization,也不清楚其中会产生什么误差,但不解的为什么会有1%,而不是100%,至少0、25、50、75和100看起来是对称的。
按照研究者错误的随机化方法,得出“社会互动能够促进长期(1年后)的政治参与”简直“水到渠成”。
很明显,因为每个组的人口特征是相似的,所以组内的人更有可能互相认识。因此每个被选入“实验组”的受试者都非常可能在游行现场找到已经认识的熟人。因为,文章声称的friendships很有可能是早已存在的,而不是因为上街游行而结识的。
也就是说“上街游行——>结识新朋友——>参加下一年游行”的逻辑链条在中间就断了。
3
遗漏变量
学生自身的政治态度和游行意愿。学生会不会参加2017年的游行和2018年的游行很大程度上取决于他自身政治态度。但文章的回归模型并没有将学生的政治态度直接纳入其中。
下图是文章的第一阶段回归模型:
从注解的倒数第二句话可以清楚看到:模型并没有直接将学生的政治态度纳入其中,而是用2017年计划参与游行的学生的年龄、性别和家庭月收入等指标生成一个预测指标来替代该学生的游行参与可能性。这其中会产生多少偏差,我们也不得而知。
文章其余的问题还包括“安慰剂组”的干预方式存在争议,但篇幅有限就不再赘述。