将“双盲随机测试”用于招聘测评的可行性探讨

“双盲随机测试”是怎么来的?

18世纪,英国哲学家休谟认为:我们从来没有亲身体验或者亲眼验证过因果连接关系本身,我们看到的永远是两个相继发生的现象,所以一切因果关系都是值得怀疑的。


将“双盲随机测试”用于招聘测评的可行性探讨

比如,公鸡打鸣,太阳东升,这两个相继发生的现象,会被认为是“因果关系”,比如,电闪雷鸣,刮风下雨,这两个相继发生的现象,会被认为是“因果关系”,这两个因为相继发生而被认为的“因果关系”,起码对人的生命不会造成威胁,但是,涉及到与人的生命有关的医学问题上,人们在确定药物是否有效的方式是,让病人先吃了某种药物或者进行某种手术等活动,再观察病人是否治愈了,如果治愈了,那么这种药物或者这种手术等活动,就被认为是有效的,然后就会沿用下来,这就是传统临床医学阶段的治疗方式!

现在想想那时候的治疗方式,都会觉得一身冷汗,这不就是在拿活生生的人在做实验吗?哲学家休谟的一番话,间接引起了一场医学革命,首先是法国的巴黎学派,以Pierre Louis为代表,在1789年提出了以观察事实做出推理和决策,而不是依靠传统临床医学阶段的治疗方式。

那么,该怎样实现这种以观察事实来做出推理和决策的治疗方式呢?

首先,大样本随机选择病人:根据统计学的“大数原则”:样本越大,统计结果越能稀释掉特性,越能逼近真实情况;而随机则可以避免因为病人由于病情的不同产生的治疗效果的差异。

之后,将病人随机分成三组:对照组,不做任何治疗;安慰剂组,吃“假药”考察心理作用对治疗的影响;治疗组,吃真药,看看药物的治疗效果。

最后,统计结果,看看第三组的治疗效果是否明显高于对照组和安慰剂组,注意是明显高于,如果相差不大,比如51%和49%,是不能证明药物对治疗是有效的。

这种仅让病人不知情的实验方案,很快收到了挑战:参与实验的医生,出于自觉还是不自觉的心理,会因为自己的主观偏见,影响实验的最终效果,这就是“双盲随机测试”之前的“单盲随机测试”!

那该怎么办呢?把医生的眼睛也“盲”起来,让医生也不知道病人在哪个组、自己处在哪个组、手里的药是真是假,并且采用第三方统计最终实验数据,从而消除医生的偏见影响,保证实验的客观公正,这就是“双盲随机实验”!

“双盲随机测试”的思考和归纳


将“双盲随机测试”用于招聘测评的可行性探讨

通过对“双盲随机测试”的回顾,“双盲随机测试”起源于医学,是一种用来验证新药或新治疗方案是否有效的实验方式,实验过程中的关键点包括如下:

1、实验对象是从大样本中随机抽取的,对自己处于哪个组、以及对别的组等均不知情。

2、实验参与者对实现对象的分组、自己处于哪个组、实验用的治疗方案等均不知情。

3、实验数据统计者,与实现对象、实现参与者等均无瓜葛,仅从数据统计角度统计数据。

那么问题来了:

1、如果实验对象的样本数据较少,那么统计学中的“大数原则”该怎么使用?

2、对实验参与者采取信息加密、信息屏蔽,是否可以让不了解信息的人,甚至是机器人,作为实验参与者?

3、实验数据由第三方参与统计,但如何避免第三方在统计失误、心理因素等方面的影响?采取相应信息收集系统,是否更加有助于客观、真实的统计实验数据,避免第三方人为统计对实验结果的影响?

第一个问题,可采取其他的抽样方式!大样本随机抽样的目的是为了稀释样本特性,而稀释样本特性的抽样方式还有其他,比如分层抽样,先把总体分成互不交叉、互不重合的层,然后按照比例从各层抽取个体,得到所需样本;比如整群抽样,先把各单位分成互不交叉、互不重合的集合,即群,然后从群中抽取样本。

第二个问题,这点毋庸置疑,在这次疫情中,机器人已经在测试、治疗等各个方面被采用,其实无论是否采用机器人,关键在于隔断参与者心理作用对实验过程的影响。

第三个问题,这点也不是问题,“黑匣子”自1958年发明之后,就用来客观、如实的记录飞机飞行和性能参数,以便于对飞行事故分析,重现事故现状,找到真实原因。

“双盲随机测试”在测评中的应用设想

测评在企业的应用还是比较广泛的,用于招聘、用于甄选、用于评估,等等,以招聘为例,“双盲随机测试”该如何应用呢?


将“双盲随机测试”用于招聘测评的可行性探讨

其一,明确“双盲随机测试”的目的

“双盲随机测试”,是验证药物是否有效的一种科学方法,那么,在招聘测评中,可以将经常使用的某种测评方式,对能否有效测评如特质、动机、价值观等,将测评方式作为“双盲随机测试”测试目的。

其二,选择经数据验证的胜任特征

“双盲随机测试”,是以实验数据为基础判定是否有效,所以,应对作为测试对象的招聘测评工具是否有效,首先界定一个判定标准,而经过数据验证、与绩效保持逻辑关系的胜任特征的具备程度、具备数量,则可以作为判定招聘测评工具是否有效的标准。

其三,选取测试的对照组和实验组

“双盲随机测试”中,实验对象的选择采取大样本随机选择,以达到稀释特性的目的,但在招聘测评的选择上,除非校园招聘,其他招聘渠道是很难获取大样本的,但可根据经验等标准,对候选群体进行分层抽样,然后组成对照组和实验组。

其四,采取两种有差异的测评工具

“双盲随机测试”中,对实验组给的是真药,对对照组给的是安慰剂,但在招聘测评中,无法采取一组测、一组不测的操作方式,但可采取不同的的测评方式,同时,作为对照的测评方式要和验证的测评方式有差异,以便于测评之后通过数据统计、对照分析。

其五,以在线等方式收集测评数据

“双盲随机测试”中,数据收集由第三方来完成,目前很多测评工具均可通过在线方式收集,则更能避免人为因素的影响,保障数据收集过程中的客观、公正,同时,也有利于便捷的统计测评数据。

其六,对比数据与胜任特征一致性

“双盲随机测试”中,测试结果是通过观察两组的治疗情况,并通过对比数据分析、判定是否有效,在招聘测评中,通过对不同测评工具测试数据的对比,尤其是对差距较大的数据对比,来判定测评工具的有效性,然后将其与胜任特征进行比例排序及分析,以最终确认测评工具的有效性。

虽然目前有多种招聘测评工具,但是由于招聘设计时,对样本选择与实际使用的差异性,就会导致测评工具出现无效的可能性,从“双盲随机测试”的角度探讨招聘测评工具的有效性,其目的在于找到符合企业实际的有效测评工具,从而为提高招聘的效果提供保障,作为探讨,还远远不够,期望在接下来的实证过程中,对这一思维方式进一步优化和调整,为拓展其应用范围,提供基础的依据。


分享到:


相關文章: