评估候选人的3种最佳方法

或者,我如何得知自己的直觉有时只是一团糟。

受到Jean Hsu和Jeff Lu的精彩分享的启发,在这里,我将概述我们如何决定要建立什么样的招聘渠道,以及我们选择在产品中建立的3种评估技术。

“从实用价值的角度来看,人员评估方法最重要的特性是预测有效性:预测未来工作表现的能力” ——Schmidt / Hunter(1998)

像洞穴兄弟一样招聘

我一直很讨厌招聘。 我希望人们喜欢我,所以我选择像我这样的简历,并在典型的面试中交朋友,而忘记了我的工作是尽可能客观地评估他们的能力。 融洽关系……有多少人融入社会。

作为招聘经理,这也不是我唯一的失败。

  • 我略读了人们的简历,所以错过了重要的细节
  • 我在精神上高估了可以很好地反映我的技能,而低估了我所不具备的技能
  • 我在面试时会做出快速判断,因此一些候选人会从优势开始
  • 我不知道该问什么候选人,哪些问题最能显示他们的能力
  • 我问不同的候选人不同的问题,因此每次面试都是不同的,很难与他人进行比较。
  • 当与其他面试官讨论候选人时,我经常不同意我的看法

很糟糕吧?

也许有一两个人听起来很熟悉,但证据似乎表明对这些东西不好是很标准的(尽管我确定细节和严重性会有所不同)。

其中一些东西很容易修复。 例如,我的面试可以使我更有条理,使他们更加一致……但是这里有些事情很难靠意志力来解决,例如让第一印象过分影响我的观点。

最终,我也想帮助其他所有人解决这些问题,这意味着改变了我从未认识的人的行为。

改变行为很难,而改变整个公司的行为则更加困难,更不用说了。

偏见训练怎么样?

几乎没有证据表明培训能奏效,实际上在某些情况下它会适得其反。 它也非常昂贵且耗时。

争取立法怎么样?

法律的工作(以我的观点)是定义期望的结果,并在出现问题时提供正义的途径。 尽管可能会有改进的方法,但我们已经广泛存在。 另一方面,问题出在流程设计的细节上,立法太慢且过硬,无法解开这种混合的隐喻。 我们希望增强人力资源和招聘经理的能力,而不是让他们沉迷于进行公正的招聘流程所需的劳动力。

所以…

如果我们不能依靠培训或法规,那将留下工具。 这意味着建立自己使用的招聘工具,并说服其他人使用。

但是有很多选择,我们怎么知道要建造什么?

(稍后请注意:在我一生的直接视频剪辑中,我们应该在这里进行剪辑,主要是凯特基本上阅读了所有科学知识,而我在Twitter上说的是傻话。)

进入施密特和亨特,以慢动作…到AC / DC

早在1998年(当Spice Girls庞大时,Justin Timberlake就是N-Sync中的傻瓜,Madonna的Ray of Light专辑最终使美国陷入了一个事实,那就是舞蹈音乐是一回事,然后他们将其重命名为“ EDM ”(完全错误))弗兰克·施密特(Frank Schmidt)和约翰·亨特(John Hunter)发表了一项荟萃研究,汇总了85年的有关如何评估候选人的研究。

这是招聘过程中的营养标签

他们研究的关键输出是一个简单的表格(如下),该表格显示了评估类型的预测有效性,即,在每种类型上都表现出色的人实际上可能胜任这项工作。

(本文也可能是戴着墨镜走在路上,在后台播放“ Back In Black”时已分发给出版商的)。

此处最高的有效性得分r = 0.54实际上是中等水平的,您不想单单雇用它,因此您可以了解为什么聘用方法建立了评估层来提高进行良好聘用的几率。 数据适合。

但是,要使用分层评估来达到较低的误报率(不良员工),您需要丢弃任何一个阶段失败的人员……因此,低效评估通常也具有较高的误报率(好的人被拒之门外),这意味着您需要处理更多的候选人才能获得相同数量的员工。

但是,此表令人惊讶的是,大多数公司使用的评估的预测效度很低。 大多数公司甚至不使用结构化访谈,因此,他们最好的选择是少数非常薄弱的指标之间的相互参照。

例如,简历包含一些能力最弱的指标和潜在偏见的最强来源……人们的姓名,年龄,所研究的机构的名称,在该地区的工作年限以及所工作的公司的名称。 。

(请注意:我们进行了一项研究来测试这一点,并且 我们的工具 甚至具有良好的简历过程,即使没有性别或种族偏见……拳头撞击……麦克风跌落,其预测能力也达到 三倍 )。

不仅个人广泛地吸纳聘用人员, 公司也很吸纳设计招聘流程

如您所料,我们认为值得尝试一些不同的东西。

我们正在研究一个复杂的问题,但是我们知道它的边界,并且由于施密特和亨特以及所有研究招聘偏见的各个方面的人们,我们有了一个简单的建议。

我们的方法

  1. 进行最具预测性的评估
  2. 看看这些评估可以大规模开展的方式,它们容易受到哪些已知的偏差问题以及我们提供内容和支持技术的难易程度
  3. 建立支持这些流程的工具,同时最大程度地降低偏差风险
  4. 从真实的招聘中获取真实数据
  5. 持续监控过程的每个部分的偏见和预测能力*

*注意:有一天,我们可能必须在预测最佳候选人和支持多样性之间进行权衡,但我们尚未面对这一问题。 到目前为止(触摸木头),这两件事似乎非常紧密地结合在一起。

现在到了我要点的时候了,告诉您到目前为止我们已经尝试了什么。 到目前为止,我们已经在平台上实现了(并在内部和与客户一起使用):

1.工作样本

这些只是与工作直接相关的书面答案。 他们通常测试工作知识和情况判断的某种组合,并且在涵盖能够准确反映工作本身的工作类型时最有效。

这些答案由招聘组织中的人员审核小组进行了评分,以减少亲和力偏见,刻板印象偏见,晕轮效应,确认偏见,排序效应,比较摩擦和小组思考……但这是另一篇博客文章的故事。

2.结构化面试

为了使面试结果难以基于第一印象,偏见或缺乏纪律性,我们建立了一个流程,通过该流程,招聘经理可以定义面试的结构和内容,面试官可以记录他们的笔记并分配分数。 这样做的好处来自确保候选人之间的一致性,帮助团队专注于对角色重要的技能,并使面试官从“系统1”思维转向“系统2”思维(从而避免所有相关的认知偏见)。

3.多项选择题(是)

多项选择测试(虽然显然受到限制)是用于较大轮次的好工具,在这种情况下,时间限制要求过滤器根据候选量进行缩放。 它们可以用于测试基本领域知识,也可以用于一般技能,例如计算能力。

我们认为这些测试与这三个测试之间的关系最为松散,这主要是由于多项选择的局限性所致。 我们建议将它们用作宽松的筛选器,即使用结果分数将最低20%而不是最低80%降低,但是从广义上讲,这是管理批量招聘的好方法。 我们倾向于不将这些用于较小的轮次或更多的高级员工。

商业计算能力测试市场在性别和少数族裔偏见方面也存在严重问题,比例在8%至25%之间(关键阶段4的数学中的性别偏斜约为3%)。 说明这种歪斜在实践中有多严重; 如果您与行业领先的计算能力测试提供商一起在80%的位置上设置及格分数,则男性的人数将是女性的三倍。 那是3倍。 三倍。 300%。 我们的计算能力测试仍然存在偏差,但这是该行业中最低的,并且我们才刚刚开始。

稍后我们将继续发布一些帖子,以显示这些评估类型的一些数据分析。 这是一些正在进行中的工作的一个秘密高峰,以展示我们如何去挑选哪些问题是公平和客观的,并实际预测工作绩效。

同时,我们很想听听您使用的是什么,以及您认为我们可以做得更好的地方。


Richard Marr Applied的 联合创始人兼首席技术官, Applied 是一个SaaS平台,可提高招聘准确性并减少偏见。 当他说话大声的时候,他实际上充满了胡言乱语,并且相当虚假地声称发明了A / B测试。