Twitter,偏见和同行评审的科学– Alexey Zimarev

在很长一段时间里,我都犹豫要写这个故事,但我决定现在是时候了。 这是一个误解和偏见的故事,它来自我们认为是软件行业领导者的人,他们宣扬和推广的事物以及它与同行评审的研究和认知偏见的关系。

一年前,即2017年10月,我参与了一个Twitter讨论,讨论了软件行业中性别失衡这一有争议的话题。 自14岁起我就从事软件开发工作,因此我可以认为自己是一名行业资深人士,因此,将使他拥有30年的工作经验。 我绝对同意,出于许多原因,一些明显的原因和不那么明显的原因,主要是由男性主导的,但是直到几年前,我才真正注意到这一点。 我们都知道,许多行业存在性别失衡的情况,而且并非总是容易找到原因。 在过去的几十年中,许多国家的性别不平等现象已大大减少,而欧洲国家是这一运动的领导者。 尽管如此,我在过去的七年中一直生活在挪威,在过去的六年中我曾在两家公司工作,几乎所有的开发人员都是男性。 在挪威第一年工作的挪威国家石油公司(Statoil),性别失衡并不是那么严重。 那里的一些团队的女性人数甚至超过男性。 我发现这种情况令人着迷并且有些令人不安,所以我仍然对自己个人目前在我工作的公司中可以做些什么以提高多样性感到好奇。 请注意,这种情况仅适用于组织的技术方面,而组织的其余部分(多数)具有很大的性别多样性。

因此,我参与了此Twiter主题的回复:

这是我的实际答复:

我的目标是在具体的时间和地点分享我的个人经验,也许会得到一些有用的建议。 但是,像往常一样,当人们喜欢在不知道自己的上下文的情况下告诉别人该做什么和该怎么想时,Twitter的谈话会受到假设的影响。

此后不久,Jez Humble自己也决定参与。 这是他的回复:

在这里,我说的事实是基于我个人的生活经验。 从那以后我一直没有改变主意。 在所有职业和活动中都不可能实现性别平等分配。 例如,确实没有人感到困扰,我们看到更少的妇女从事管道,砖石工作或在煤矿和海上钻井平台工作,仅仅是因为这些肮脏的工作通常需要施加大量的体力,在恶劣的条件下工作并且包括大量的改变出错会严重危害健康,有时会导致意外死亡。

不过,杰兹(Jez)使用了一个像医生一样的稻草人。 确实,该行业曾经具有很高的地位,在20世纪初之前,周围没有多少医生,而且所有医生都是男性。 但是,这是来自“第一世界”的特权白人男性的有限文化背景的第一个迹象,他出生于英国,就读私立学校,并在牛津大学获得了学位。 让我们看一下这个“状态”陈述,以及20世纪医学界真正发生的情况。 作为1970年在苏联出生的人,我完全知道那里的医学主要由女性主导。 实际上,在美国,1970年代初期,1972年《高等教育法修正案》第IX标题和1975年《公共卫生服务法》取消了对医学领域女性的限制,禁止基于理由的歧视。性别 在地球的另一边,在苏联,1970年的人口普查结果表明,医疗行业中70%的人是女性。 为什么会发生这种情况? 当然,第二次世界大战发挥了重要作用,大大减少了男性人口的比例,使更多的妇女入院,然后她们得以继续接受教育,成为医生。 显然,当时医学教育没有性别限制。 这与地位有什么关系? 嗯,在共产主义政权时期唯一可以得到的“状态”是基于意识形态和在管理链中的较高地位。 妇女担任管理职务的比例很低。 成为医生对身份没有任何意义。 一旦解除了男性的限制,这个专业领域很快就由女性占据主导地位。 在1917年后的俄国,阶级制度的中断导致了像医生或工程师这样的高等职业的重大变化。 但是,我们仍然观察到存在且没有基于性别的限制的行业,在这些行业中,性别不均衡比例很大。 它似乎与阶级或起源无关。 稍后我将回到课堂和不平等问题。

但是现在我想回到1989年。当时我16岁。 在那之前的两年,母亲坚持要我在一个更好的设施里上中学。 因此,我在市中心另一所学校的数学课上开始学习。 在那里,我开始使用可编程计算器进行编程。 1988年,我们首次接触了苏联第一台消费级PC BK-0010。 它具有32 Kb的RAM,屏幕使用了16 Kb,因此程序只能在16 Kb的RAM中运行。 我很快就厌倦了玩游戏,并开始学习Focal,这是这些计算机内置的编程语言。 然后,我学习了该处理器的汇编程序,因为使用高级编程语言在16 Kb或RAM中可以做的事情不多。 但是,这个故事有点出轨了。 让我们看看我的课,这是照片:

这是数学课,被认为是一个极好的学习场所。 但是,每个人都可以加入。 我不需要通过任何测试,他们只查看我的成绩,就接受了采访。 我由单身母亲抚养长大,住在一个带单间和厨房的公寓里。 我们没有很多联系,也没有钱。 我的母亲在一家研究机构担任工程师程序员,该研究机构正在为潜艇设计零件。 不过,该设施没有分类,因此我能够参观母亲的工作场所,并看到那些装有大磁盘的大型机器,大量穿孔的卡片等。 那就是我可能受到启发并影响编程生涯的地方。

但是,作为基于学校的专业教育的一部分,我们班级接受了计算机的学习,在那里我们每周花费一天的时间来学习一些有助于继续学习的知识。 我们可以选择学习冰箱,做一些可以工作的计算机,学习如何驾驶卡车以及如何操作缝纫机。 我们班上大多数人选择计算机。 后来,我们也在学校买了电脑。 再看一次班级照片。 您会看到18个男孩和11个女孩。 对于数学课来说一点也不差。 但是现在猜想我们当中有多少人真正地参与编程? 好吧,我告诉你-五六个。 几个女孩? 没有。 我对此没有任何解释,但我知道一件事。 我们所有人花在计算机上的时间多于外出,而诸如此类的事情被视为极客和书呆子。 我们不酷,我们真的不受欢迎。 好吧,直到成为编程考试的要求之时,我们才开始受到欢迎。 一个星期。 这可能是女孩对这个学科完全不感兴趣的原因吗? 也许。 我没有数据,也没有研究,我只有中学生的经验。

有趣的是,我的大多数母亲同事都是女性。 他们都没有接受过任何与计算机相关的教育,因为当时甚至还不存在。 我的母亲和许多同事一样都是数学老师,但其中一些是来自不同领域的工程师。 工程工作与任何身份或职位都不相关,收入为中等或以下。 现在我知道,尽管苏联有90%的女性工作,但她们的收入却大大低于男性同事。 留在家里的妻子的概念几乎不存在,与美国不同,在美国,1950年代只有26%的已婚妇女工作,尽管这种情况有所改变,到1980年代中期,这一比例上升到67%。 但是,在美国,越来越多的职业妇女是家庭主妇解放运动的一部分。 共产党人早在1920年就开始“解放”妇女。 但是这种“解放”变成了假货。 除了在家中执行所有家政“传统”职责外,妇女还开始全职工作。 社会的父权制没有改变。 由于在苏联,几乎所有人都是同样贫穷的人,因此不可能雇人做家务。 整个电影在1981年获得奥斯卡金像奖最佳外国电影的《 莫斯科不相信眼泪》电影中得到了清晰的展示。 在一个场景中,一位成功的妇女担任一家大型工厂的总干事,在郊区的火车上,坐在一个友好的男人面前,她们开始讲话。 他说:“你还没结婚。”“你怎么知道?”她问。 他回答-“你在看我的鞋子。 可以像您一样看待鞋子的人有两种。 经理人还是未婚妇女。 您不能成为经理 ,因此您不会结婚。” 他们开始约会,但在某一点上,这个家伙发现她确实是一位高调的经理,尽管他是一个非常受好评的机械师,但他的收入比他高得多。 这使他陷入沮丧,他中断了恋爱关系,消失了,后来被发现喝酒并解释说,整个情况对于他来说是不可接受的。 失踪后,那位女士花了一些时间哭泣并思考自己做错了什么(尽管成功的女人没事,什么也没做),并努力将男生带回来。 当然,这个国家的每个人都可以理解,仅仅是因为这就是社会的运作方式

对我来说,对数百万人进行社会实验的70年是不容忽视的事情,就像没有发生那样。 为每个人打开门去选择他们想做的事还不够。 当然,经济和社会压力也起着重要作用。 有时,甚至很难理解某些专业中的性别失衡。 例如,在苏联,将近100%的公共汽车司机是男子。 而且,电车司机中近100%是女性。 对于无轨电车,奇怪的是,它是50/50。 对于这个原因,我有一点线索,但是肯定有一些线索。 考虑到这一点,我们来到了性别平等悖论


在这里,我们进入对话的第二部分。 提醒您,我的目标是分享个人经验,也许会得到一些建议。 这是我最后来的地方:

在这里,我看到了Humble发出的同行评议科学的神奇词汇。 当时我没有注意,但是稍后它将变得更加重要,我将不得不重新关注它。 所以,让我们看看。 看来我是“错”。 我必须先打官司才起诉这个词,这并不明智。 同时,在这种特定情况下我了什么? 挪威联合国人类潜在发展指数中的第一名; 这是事实。 我还回应说,在这里,人们可以自由选择如何生活。 对比如下所示:

挪威和马来西亚之间有什么区别?据我们所知,那里有许多年轻女性选择在软件行业从事职业? 答案是显而易见的,并且有研究证实了这一点。 这地位问题。 女孩没有其他方法可以赢得社会的尊重并获得可观的收入。 像挪威这样的国家却并非如此。

让我们看看Humble促使我阅读的论文。 这是一篇名为《性别平等较高的国家》的研究论文由Gijsbert Stoet,Drew H. Bailey,Alex M. Moore和David C. Geary出版,由Gijsbert Stoet,Drew H. Bailey,Alex M. Moore和David C. Geary出版, 对女孩数学焦虑表现出更大的国家性别差异,而对父母的数学评价却相对较低 。 PLOS在2016年。该研究专门关注数学焦虑的性别差异如何与社会和家庭变量相关的问题,试图在数学焦虑与选择STEM的女生比例较低之间建立联系(科学,技术,工程和数学)在发达国家的教育和职业。 他们使用了国际学生评估计划(PISA)的数据。

研究得出结论,分析数据不支持父母对子女的影响的假设。 也,

我们建议,虽然经济考虑因素在生活在欠发达国家的个人中可能会在与STEM相关的利益中扮演更重要的角色 ,但固有的特定主题利益在生活在高收入国家的个人的教育和职业态度及选择中将扮演更重要的角色。经济福祉水平 。 当利益的相对作用比财务驱动力更为重要,并且男人和女人有更多追求自己内在利益的自由时,在职业利益上公认的性别差异将变得更加强烈。

也:

此外,我们提出,父母意见对儿童数学焦虑的影响尚不充分,并且相关性至少可以反映出父母的子女对其子女的兴趣所产生的影响,这反映了儿童的利益对其父母意见的影响。 我们假设,当研究人员问父母他们对数学的重视对他们的孩子的未来有多重要时,父母可能会考虑与数学相关的焦虑水平和对孩子在家中所表达的数学的兴趣以及对他们数学经验的兴趣。在学校。

在此我要特别提到的是,研究人员曾说过, 在北欧国家,并未观察到父母对女孩对数学焦虑的看法和期望。

简而言之,结论是,在人们可以自由决定自己的教育和职业目标的国家中,社会的一些更深刻的期望将发挥更大的作用。 其中一些期望来自父母。 但是,在斯堪的纳维亚国家, 情况并非如此

足够有趣的是,尽管Humble选择使用此特定研究来说明我的观点是错误的 ,但他将这个问题声明为对某些公认事实的确认,但事实并非如此。 在性别平等状况较好的国家中,选择STEM从事职业的女孩所占比例较小的事实被称为“ 性别平等悖论” 。 您可以轻松地找到许多(不仅仅是一项)关于它的研究。

SAGE在2018年2月发布的最新研究《科学,技术,工程和数学教育中的性别平等悖论》得出以下发现:

即使女孩的科学能力等于或优于男孩,女孩的阅读理解能力总体上也可能更好,这与非STEM科目的能力更高有关。 结果,这些女孩倾向于寻找与STEM领域无关的其他职业。

有趣的是,他们还得出以下结论:

富裕国家往往拥有更多的经济机会,使妇女可以根据纯粹的经济因素以外的其他因素做出选择。 但是,在贫穷和性别平等程度较低的国家,妇女发现就业机会并不容易,因此,STEM职业带来的安全性和高薪吸引了更多妇女。

后者的结果与我上面的陈述完全相关,我的陈述涉及欠发达国家固有的不平等和阶级问题,这进一步刺激了女孩寻求技术职业,以改善其社会地位并获得更多可观的收入。 我们还可以将这些发现与Humble的男医生论证联系起来。 这种观点只适用于不平等程度高和阶级制度成熟的社会。 值得注意的是,耶斯现在居住和工作的美国,以及他成长并获得学位的英国,都存在着严重的不平等现象,并且拥有一套既定又僵化的阶级制度,在这种制度下,人们受到歧视。他们的血统可能与他们的种族或教育程度相近甚至更高。

在整个故事中,更令人着迷的是我刚才引用的研究的作者。 它是由同一人写的,他们写了谦卑给我的论文,指出我错了

较新的论文建议:

但是当谈到他们的相对优势时,在几乎所有国家(除罗马尼亚和黎巴嫩以外的所有国家), 男孩的最佳学科是科学,女孩的学科是阅读

作者得出的结论是:

此外,在科学,工程或数学等领域培养出最多女性大学毕业生的国家还是性别平等程度最低的国家。 他们认为,这是因为赋予妇女权力的国家也间接赋予她们权力,以选择她们最喜欢,最擅长的职业

因此,这里出现了带有大写字母CChoice事物,Humble在回复我的推文时说的很讽刺。 他选择称呼我的“政治口号”,似乎与撰写这项研究的同一人的最新发现一致,而谦卑建议我“选择”阅读。 真是令人着迷。

看这张图也很有趣:

我的注意力吸引到了该图上的三个离群点,即挪威,芬兰和瑞典稍为落后,这很好地印证了以下结论:在北欧国家,父母对女孩在数学方面取得成功的期望会影响这些国家中女性STEM毕业生的数量。国家。

但是,《北欧性别平等悖论》网站和书中的出版物也表达了这一观点的另一面,表明:

北欧福利国家无意中阻止了妇女。 公共部门的垄断和巨大的税收楔入限制了妇女在劳动力市场上的进步。 过度慷慨的育儿假制度鼓励妇女呆在家里而不是工作。 福利国家安全网阻碍了妇女自谋职业。 另一方面,挪威广受赞誉的平等权利行动法并没有帮助增加妇女的职业机会。

但是,尽管它包含一些合理的想法,但这不是同行评审的研究。

SAGE于2018年3月发表的另一篇论文由王铭特,Jacquelynne S.Eccles和Sarah Kenny撰写,名为《 不是缺乏能力,但有更多 选择》 ,这表明数学能力较高但阅读能力较低的人可能会选择STEM事业。 同时,精通数学和阅读的人不太可能选择STEM事业,而是在生活中做其他事情。 他们得出结论:

我们的研究提供了证据,表明并非并非缺乏能力促使女性从事非STEM职业,而是具有较高数学能力的女性也具有较高的语言能力并因此可以考虑更广泛的职业的可能性更大。

再次令人着迷,“ 选择 ”一词现在出现在文章标题中。

但是,该主题仍然存在很大争议。 如果您阅读Stuart Reges对本文的评论,则会发现对选择的性质的担忧可能会受到父母,学校老师和周围人对个人的期望所压迫。 该讨论非常有趣,尽管发表了论文,但对该主题尚未达成共识。 更甚者,全球社会也不尽相同。 对于父母的期望和态度,我很容易提出一些意见,这些意见和态度会影响女儿的选择,而不是从事STEM职业。 但是,我对斯堪的纳维亚半岛和挪威的情况特别感兴趣,因为这会影响我的工作和生活。 研究表明,在斯堪的纳维亚国家,父母对女儿和儿子数学成绩的期望非常接近。 另外,我无法确定在我为挪威工作的任何公司中,女性候选人是否因性别而受到歧视,低估或被排除在招聘过程之外。 相反,我们倾向于选择女性候选人为我们的组织带来更多多样性。 当谈到一个有女性总理,财政部长,地方政府和现代化部长,外交部长,前国防部长等等的国家时,谈论性别歧视是很奇怪的。 我仍然不确定目前没有足够的女性候选人供我工作的公司的确切原因,但这可能与我们的位置有关。 在奥斯陆,卑尔根,特隆赫姆和斯塔万格等大城市,情况截然不同。 我们经常在国外获得学位的人,我可能只是因为某些原因,女孩决定不这样做。 尽管我也知道,在我们学校的职业选择会议上,诺威根社会服务机构的当地代表明确提出了议程,因为那里有女孩,所以女孩需要考虑加入技术职业,而且这个行业的需求很大。


那么,这与偏见有什么关系? 今年,我在会议上的主要演讲是“简单性与简化性”。 在本次演讲中,我试图敦促人们不要过分简化本质上复杂的问题。 我们倾向于对复杂问题寻求简单解释的原因之一,以及为什么我们倾向于选择想到的第一个解决方案而忽略所有其他可能性的原因是确认偏差

这种偏见迫使我们思维敏捷的系统(系统1)仔细考虑可以确认我们已经相信的事实,而忽略了所有与世界情况不符的事实。

当一个人将一组人写成的研究作为同行评议的科学,同时又不愿看同一个人写的新论文时,您会如何看待情况?包含有关同一主题的更多发现,但是这些发现不正是该人想要听到的吗? 对我而言,这是确认偏差的经典示例。 我从没想过我需要考虑关于Jez Humble的事情。 这家伙是行业领导者之一,他写了一本颇具影响力的屡获殊荣的书《 持续交付》 ,最近发表几篇关于该主题的同行评审论文? 更令人着迷的是,谦卑和一些有影响力的前ThoughtWorks顾问因此拒绝评论这些论文以及由Nicole Forsgren,Jez Humble和Gene Kim撰写的新书Accelerate中所概述的结果,并使用了同行评审的神奇词汇。 研究

假设Jez有兴趣阅读有关性别失衡主题和“性别平等悖论”的最新发现,我几周前通过电子邮件与他联系,并发送了一些经过同行评审的 科学链接 老实说,我没想到他会记得在Twitter上的讨论,也没有希望得到回复的希望。 最后,他是一个忙碌的人,也是一个昂贵的顾问。 但是,第二天我得到了答复。 耶兹首先说他决定中止辩论,因为我无视他发送的链接是在“浪费他的时间”。 足够有趣的是,我已经阅读了所有内容,并于第二天就此进行了撰写。

然后他说,他没有时间,也没有兴趣阅读我寄给他的任何有关该主题的东西,因为他选择在生活中尽量减少分心。 嗯,这听起来已经有些不可思议了,到底是经过同行评审的科学吗? 文字的语气越来越富有表现力,我几乎感觉就像信件开始充满激情和愤怒。 最后的一句话是,他通常不会像这样进行个人电子邮件通信,这一切对他来说都是非常沮丧的。

哇,那可真好。 首先,将近一年之后,他清楚地记得了这件事。 线上有些私人的东西,然后是沮丧。 我发送的研究再次是由同一个人撰写的,他们似乎继续研究性别平等悖论的根本原因。 但看起来这里的确认偏见非常强烈,人们不想看到什么不适合已经形成的世界图景。 当这幅画受到干扰时,人们会感到沮丧,需要考虑新的事实和新的研究。 这是思想较慢的系统的工作。 但是,在阅读该答案时,即使在撰写电子邮件时,我也没有看到System 2的任何迹象,甚至还没有上线。 这个事实使我最难过。

我既不出名,也不那么有影响力。 我的工作是关于软件体系结构的,有时涉及与整个组织的合作,试图使软件交付流程更好。 我一直与人一起工作,有一段时间,我与同一个人一起工作,看到他们成长(或不成长),新人加入,有些人离开。 我尝试从所有经验中学习,但是我真的不确定我在这里学到了什么,除了我尊敬的人可能是个混蛋。 当然,整件事带给我更深刻的发现和有趣的学习。 哦,是的,我知道。 我了解我将永远不会对别人表现出来,以身作则。


现在是一个大问题。 我观察到一个明显的WYSIATI案例(Daniel Kahneman写的《 快速思考与缓慢思考》中所见即所得)适用于定位为软件行业领导者之一的人。 他撰写有影响力的书,人们用来改善组织和生活。 最后一本书《加速》是基于同行评审的研究成果,但是对于只愿意看到和倾听证实其信念和思想的人来说,这意味着什么呢? 批判性思维在哪里,接受和接受可能不太舒服的事物的能力和意愿在哪里? 在哪里意识到某些主题本质上是复杂的,特别是在涉及社会科学和心理学时,没有简单的答案,也没有对与错? 最后一个问题是-对于持续交付,谦卑的工作有多公正 ? 当同行评议的研究用魔术词代替“唯一有效答案”时,存在什么程度的确定性?最后,《加速》一书涉及的主题的社会技术性质也不是那么简单,他们作为复杂的适应系统,更多地关注组织的文化,心理和人类学方面。

最后,我想引用马丁·福勒(Martin Fowler)的《加速》一书的前言:

因此,如您所料,我很高兴他们将这本书投入生产,并且在接下来的几年中,我会推荐它。 (我在谈话中已经使用了其草稿中的许多内容。)但是,我确实要提一些注意事项。 他们很好地解释了为什么他们的调查方法使他们成为数据的良好基础。 但是,他们仍然是收集主观观念的调查,我不知道他们的人口样本如何反映整个IT领域。 当其他团队使用不同的方法确认他们的推理时,我会对他们的结果更有信心。 ……这种进一步的工作也使我不必担心他们的结论证实了我的大部分主张-确认偏见是强大的力量(尽管我在其他人中大多注意到它;-)。 我们还应该记住,他们的书专注于IT交付,即从提交到生产的过程,而不是整个软件开发过程。

让我困扰的是,我们有很多人告诉我们该做什么和不该做什么。 当涉及到软件行业的领导地位时,我们可以清楚地看到一群拥有盎格鲁-撒克逊血统和牛津大学或常春藤联盟学位的特权白人男性。 他们在山谷伦敦等地方的竞争激烈的环境中生活和工作。 权力斗争,不平等,歧视,骚扰和围攻常常使气氛本身中毒。 然后,这些人找到了自己的位置,并愿意教会世界其他地区如何生活,工作和举止,信仰什么,对与错。 他们经常不了解的是世界的固有多样性。 我过着相对简单的生活,但是我在共产主义的俄罗斯长大,看到这个国家不复存在,摧毁了数百万人的生活,为那些没有原则和士气的人们敞开了大门。 1991年,我在莫斯科的大街上看到坦克,1993年,我听到子弹的声音很近。我的职业是银行,成为那里的IT主管,然后选择搬到其他地方,发现自己在荷兰,我从事开发人员工作的收入少于第一两年的收入。 我是一名企业家和顾问,学习过簿记和会计(该行业由女性主导)以及许多其他领域,分别生活在荷兰,瑞士,英国,比利时和现在的挪威。 我了解到,即使我们说欧洲,在所有这些不同的国家中,人们的差异也可能很大。 文化,经验,生活方式,信念和目标的这种出色多样性使我们成为了我们自己。 我不能接受某些单文化的家伙,除了他们自己的语言,不会说其他语言,他们已经从白皮书和学术研究中了解了世界,这会影响我们的思维方式,做事方式,超出他们的专业领域,甚至质疑。