研究中的4种效度类型|定义和例子

有效性告诉您一个方法度量某物的准确性。如果一个方法测量了它声称要测量的东西,并且结果与真实世界的值密切对应,那么它就可以被认为是有效的。有效性主要有四种类型:

  • 建构效度:测试是否测量了它想要测量的概念?
  • 内容效度:测试是否完全代表了它所要测量的东西?
  • 表面有效性:测试的内容是否适合它的目的?
  • 效标效度这些结果是否准确地衡量了它们被设计用来衡量的具体结果?

定量研究,你必须考虑信度和效度你的方法和测量。

请注意,本文涉及测试效度的类型,它决定了测量的实际组件的准确性。如果你在做实验研究,你也需要考虑内部有效性和外部有效性,处理实验设计普遍性的结果。

建构效度

建构效度评估测量工具是否真正代表了我们感兴趣的测量内容。这对于建立一个方法的整体有效性至关重要。

什么是构念?

构式是指不能直接观察到的概念或特征,但可以通过观察与之相关的其他指标来测量。

构念可以是个体的特征,如智力、肥胖、工作满意度或抑郁;它们也可以是应用于组织或社会团体的更广泛的概念,如性别平等、企业社会责任或言论自由。

例子

没有一个客观的、可观察到的实体叫做“抑郁”,我们可以直接测量。但根据现有的心理学研究和理论,我们可以根据一系列症状和指标来衡量抑郁症,比如低自信和低能量水平。

什么是构念效度?

建构效度是关于确保测量方法与您想要测量的结构相匹配。如果你设计了一份问卷来诊断抑郁症,你需要知道:问卷真的衡量了抑郁症的结构吗?或者它实际上是在测量受访者的情绪、自尊或其他构念?

为了达到结构的有效性,您必须确保您的指标和测量是基于相关的现有知识仔细开发的。问卷必须只包括测量抑郁症已知指标的相关问题。

下面描述的其他类型的效度都可以被视为构念效度的证据形式。

内容效度

内容效度评估一个测试是否代表了结构的所有方面。

为了产生有效的结果,测试、调查或测量方法的内容必须涵盖其旨在测量的主题的所有相关部分。如果在测量中遗漏了某些方面(或者包含了不相关的方面),那么有效性就会受到威胁,研究就可能受到影响忽略变量偏差

例子

一位数学老师为她的班级设计期末代数测验。考试应该涵盖课堂上教过的所有形式的代数。如果某些类型的代数被省略,那么结果可能不能准确地表明学生对该学科的理解。类似地,如果她包含了与代数无关的问题,那么结果就不再是对代数知识的有效衡量。

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

表面有效性

表面有效性从表面上看,测试内容是否合适。它类似于内容效度,但表面效度是一种更加非正式和主观的评估。

例子

你创建了一个调查来衡量人们饮食习惯的规律性。你检查了调查项目,这些问题涉及一天中的每顿饭和一周中每天吃的零食。从表面上看,调查似乎很好地代表了您想要测试的内容,因此您认为它具有较高的表面效度。

由于表面效度是一种主观的衡量标准,它通常被认为是效度最弱的形式。然而,它在开发方法的初始阶段是有用的。

效标效度

标准效度评估测试对具体结果的预测程度,或者您的测试结果与另一个测试结果的近似程度。

什么是标准变量?

标准变量是一种被广泛认为有效的已建立的有效度量,有时被称为“金标准”度量。标准变量很难找到。

什么是标准效度?

为了评估准则的有效性,您需要计算相关在你的测量结果和标准测量结果之间。如果有很高的相关性,这就很好地表明您的测试正在测量它想要测量的东西。

例子

一位大学教授发明了一种新的测试来衡量申请人的英语写作能力。为了评估该测试对学生写作能力的真正衡量效果,她找到了一个被认为是有效衡量英语写作能力的现有测试,并比较了同一组学生参加这两项测试的结果。如果结果非常相似,新测试具有较高的标准效度。

关于有效性类型的常见问题

内容效度和表面效度在哪些方面相似?

表面有效性而且内容效度相似之处在于它们都评估测试内容的合适程度。区别在于表面有效性是主观的,在表面上评估内容。

当一次考验已经坚强表面效度,任何人都会同意,测试的问题似乎衡量了他们想要衡量的东西。

例如,在四年级的数学考试中,学生们必须做加法和乘法,大多数人会认为它有很强的说服力表面有效性(也就是说,它看起来像一个数学测试)。

另一方面,内容效度评估一个测试如何很好地代表一个主题的所有方面。内容效度的评估更加系统,依赖于专家评价。对于每个问题,分析每个问题是否涵盖了测试设计要涵盖的方面。

四年级的数学考试会有高内容效度如果它涵盖了那个年级教的所有技能。专家(在这种情况下,数学老师)必须通过将测试与学习目标进行比较来评估内容效度。

标准有效性的两种类型是什么?

效标效度评估一个测试对它所要测量的结果的测量程度。结果可以是,例如,疾病的发作。

标准效度由两种子类型组成,这取决于两个测量(标准和您的测试)获得的时间:

  • 同时效度测试的分数和标准是在哪里获得的验证策略相同的时间
为什么收敛效度和判别效度经常一起评估?

聚合效度而且区分效度的子类型都是建构效度.它们一起帮助您评估一个测试是否测量了它被设计用来测量的概念。

  • 收敛效度表示用于测量特定结构的测试是否与评估相同或相似结构的其他测试相关联。
  • 判别效度指示两个测试是否应该彼此高度相关的其实并不相关。这种类型的有效性也被称为不同的有效性

为了证明结构的有效性,您需要对两者进行评估。任何一个单独都不足以建立构念效度。

为什么生态效度在理论测试模式下的研究中没有被优先考虑?

理论检验模式的目的是寻找证据,以反驳、完善或支持一个理论。因此,普遍性不是理论测试模式的目的。

因此,研究人员在理论测试模式下的首要任务是消除之间关系的其他原因变量.换句话说,他们会优先考虑内部效度外部效度,包括生态效度

谁应该评估面孔有效性?

最好是让不同的人来检查你的测量结果。你可以请专家,如其他研究人员,或外行,如潜在的参与者,来判断表面有效性的测试。

而专家们对此有着深刻的理解研究方法你正在研究的人可以为你提供有价值的见解,否则你可能会错过。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

米德尔顿,F.(2022年11月30日)。研究中的4种效度类型|定义和例子。Scribbr。检索于2022年12月19日,来自//www.dandarfirm.com/methodology/types-of-validity/

这篇文章有用吗?
霏欧纳米德尔顿

菲奥娜自2016年8月以来一直在Scribbr编辑。她拥有地质学学士学位,目前正在攻读海洋科学硕士学位。她喜欢与来自世界各地的学生一起工作,以完善他们的写作。
Baidu