在上一期我们聊了信度,知道它衡量的是测量工具的稳定性和一致性。今天我们来谈谈另一个更核心的概念——效度(Validity)。如果说信度是“尺子稳不稳”,那么效度就是“尺子量得准不准”。一把尺子即使每次量的结果都一样(信度高),但如果它要量的是身高,实际上却在量体重(效度低),那这把尺子就毫无意义。因此,效度是衡量一个评估工具是否真正有效的关键指标。

效度指的是一个测验或量表能够测量出它所要测量的特质的程度。简单来说,就是我们想测的东西和实际测到的东西之间的一致性。例如,一个智力测验如果真正测的是智力而不是知识储备或记忆能力,那么它就具有较高的效度。如果测验题目主要考察的是死记硬背的知识,那么它可能更多地测的是学业成就而非智力,效度就不高。
效度的核心含义:测量工具是否测量到了它声称要测量的东西。信度是效度的必要条件,但不是充分条件;效度高一定意味着信度高,但信度高不一定效度高。
心理测量学通常将效度分为三类:内容效度、效标效度和结构效度。
内容效度是指测验题目是否能够充分代表所要测量的内容范围。比如,一个测量“一年级数学能力”的测验,题目应该涵盖加减法、数数、图形认知等一年级数学的核心内容,而不是只考加法。内容效度通常由专家通过逻辑分析来判断,确保测验题目有代表性,没有遗漏重要方面。

效标效度是指测验分数与某个外部效标(金标准)之间的相关程度。例如,一个新开发的智力测验的结果,与经典的韦氏智力测验结果之间的相关系数。如果两者高度相关,说明新测验具有良好的效标效度。效标可以是同时收集的(同时效度),也可以是未来收集的(预测效度)。比如,高考成绩与大学学业成绩的相关,就是预测效度。
也叫构想效度,指一个测量工具(如问卷、量表、测验)实际测到它想要测量的理论概念、特质或结构的程度。检验它常用方法有:因子分析(看题目是否聚合成预期的维度)、与测量同一构念的其他工具的相关(聚合效度)、与测量不同构念的工具的低相关(区分效度)。

效度类型 | 含义 | 常用检验方法 |
内容效度 | 题目是否覆盖了要测的全部内容 | 专家判断、逻辑分析 |
效标效度 | 与外部标准(金标准)的一致性 | 计算与效标的相关 |
结构效度 | 是否测量了理论构念 | 因子分析、聚合效度、区分效度 |
想象您开车去一个陌生的地方,用手机导航。信度高就是导航信号稳、播报清,效度高是它真的把你导到了目的地。信度高但效度低就是信号满格、播报清晰,但地图是错的——稳定地带你走错路。

机构合作咨询
西安天乐医疗科技有限公司专注于儿童发育评估软件系统的研发与销售。我们为医院、特教学校、康复中心、科研机构等提供专业的数字化评估工具,包括0岁~6岁儿童发育行为评估量表(儿心量表-II)、联合瑞文智力测验(CRT)、韦氏智力测验、Gesell、S-M、PPVT等六十余种量表系统。欢迎有合作意向的机构联系我们,获取产品资料与试用方案。
咨询专线:何老师 153-1998-0802(电话/微信同号) 029-8861-8888