TRIAL1清单:首次微移实验之前要考虑的六个标准(6/16/16)

在当今发展最快的公共​​政策领域中,裸体行为(将行为见解应用于公共政策干预)是其中之一。 在过去的几年中,从白宫到谷歌再到世界银行的组织已经成立了行为科学团队,其任务是进行随机对照试验(RCT),以鉴定有力的推动者。

在这段时间里,肯尼迪学校的学生涌向了新的行为课程和“行为洞察力研究小组”活动。 然而,很少有HKS学生实际使用RCT测试微动。 为什么是这样? 我为启动RCT进行的最初努力使我意识到,首次实验者面临的主要挑战是确定一个非常适合实验的问题。

在我的MPP计划期间,我在哈佛大学和麻省理工学院设计并领导了多个实验。 在这种情况下,为了决定我的团队和我要专注于哪个实验构想,我问自己一个简单的问题:哪种干预措施可能会产生最大的影响? 原来我问错了问题。

作为一名菜鸟推销员,我没有考虑过实验的特点(随机性,数据收集的简便性等)是否适合初次实验的人。

现在,完成了多个RCT之后,我了解到初学者必须考虑六个标准。 使用我开发的“ TRIAL1检查表”,新手实验人员可以预期实验可能会遇到的潜在陷阱,进而更快地为他们的第一个实验考虑更适合的机会。

1.)运输:有一种可靠的,已有的车辆可以运输自变量

很好的例子:促使非营利组织的电子邮件订阅者使用现有的每周电子邮件进行捐赠。 只需创建控制(标准每周电子邮件)和处理(标准每周电子邮件轻推)条件,然后向电子邮件订阅者发送已随机分配给他们的电子邮件条件。

不好的例子:煽动公民参加市政厅会议。 如果要创建一个新的运输工具(例如,邮件,电子邮件,SMS)以到达市民,测试此轻推将具有挑战性。

2.)随机:自变量可以随机分配并易于记录

很好的例子:促使学生使用短信来支付费用。 要随机化和记录,请使用Excel的随机数生成器并记录哪些对象在哪些情况下结束。

不好的例子:使用亲身分发的表格诱使学生自愿参加。 此实验引入了人为错误的可能性,因为它依赖于记录哪些对象接收哪种形式的人。

3.)个人级别:因变量的观察单位是个人级别

很好的例子:当将轻推随机分配给每位获得传单的行人时,鼓励行人不要乱扔传单。 如果每天有100名行人乘坐飞机,那么10天的实验将产生1,000个数据点。

不好的例子:每天将微调随机地分配给交出传单的行人时,要让行人不要乱扔传单。 如果每天有100名行人乘坐飞机,那么10天的实验将产生10个数据点。

4.)可获取:因变量数据可获取

很好的例子:努力增加家长参加家长会的出席率。 可能已经收集了该数据。

不好的例子:劝诱父母晚上给孩子读书。 尽管微调可能会起作用,但很难收集准确的数据,这种数据发生在学校之外,如果研究人员依靠自我报告,可能会被错误报告。

5.)低方差:因变量具有低方差

很好的例子:在食堂里减少饮料卡路里的消耗。 该数据集的低方差(由于它没有极端偏远的数据点而导致)使实验变得更简单,因为检测微动的影响所需的数据更少。

不好的例子:减少税收欺诈行为。 该数据集的高方差(由极端偏远的数据点引起)导致了更为复杂的实验,因为需要更多的数据来检测微动的影响。

6.)一次性决策:在个人层面,因变量是一次性或不频繁决策

很好的例子:推动增加器官捐赠的登记,投票或接种流感疫苗。 由于与这些行为有关的决策很少发生,因此这些实验在很大程度上避免了对新颖性效应的担忧。

坏例子:轻抚增加健康的饮食或运动。 确定微调对这些结果的影响需要增加复杂性,以区分微调的新颖性效果和长期效果。

结论

对潜在的高影响力的兴奋使许多人,包括我自己,为他们的第一个实验选择了过于复杂的问题。 使用TRIAL1检查表可以避免此错误。 通过根据这六个标准评估行为问题,菜鸟轻拍将可以更好地确定最适合其第一个实验的问题。

发表在哈佛肯尼迪学校评论