研究中的4种效度类型|定义和例子
有效性告诉您一个方法度量某物的准确性。如果一个方法测量了它声称要测量的东西,并且结果与真实世界的值密切对应,那么它就可以被认为是有效的。有效性主要有四种类型:
请注意,本文涉及测试效度的类型,它决定了测量的实际组件的准确性。如果你在做实验研究,你也需要考虑内部有效性和外部有效性,处理实验设计和普遍性的结果。
建构效度
建构效度评估测量工具是否真正代表了我们感兴趣的测量内容。这对于建立一个方法的整体有效性至关重要。
什么是构念?
构式是指不能直接观察到的概念或特征,但可以通过观察与之相关的其他指标来测量。
构念可以是个体的特征,如智力、肥胖、工作满意度或抑郁;它们也可以是应用于组织或社会团体的更广泛的概念,如性别平等、企业社会责任或言论自由。
例子
没有一个客观的、可观察到的实体叫做“抑郁”,我们可以直接测量。但根据现有的心理学研究和理论,我们可以根据一系列症状和指标来衡量抑郁症,比如低自信和低能量水平。
什么是构念效度?
建构效度是关于确保测量方法与您想要测量的结构相匹配。如果你设计了一份问卷来诊断抑郁症,你需要知道:问卷真的衡量了抑郁症的结构吗?或者它实际上是在测量受访者的情绪、自尊或其他构念?
为了达到结构的有效性,您必须确保您的指标和测量是基于相关的现有知识仔细开发的。问卷必须只包括测量抑郁症已知指标的相关问题。
下面描述的其他类型的效度都可以被视为构念效度的证据形式。
内容效度
内容效度评估一个测试是否代表了结构的所有方面。
为了产生有效的结果,测试、调查或测量方法的内容必须涵盖其旨在测量的主题的所有相关部分。如果在测量中遗漏了某些方面(或者包含了不相关的方面),那么有效性就会受到威胁,研究就可能受到影响忽略变量偏差.
例子
一位数学老师为她的班级设计期末代数测验。考试应该涵盖课堂上教过的所有形式的代数。如果某些类型的代数被省略,那么结果可能不能准确地表明学生对该学科的理解。类似地,如果她包含了与代数无关的问题,那么结果就不再是对代数知识的有效衡量。
以下是学生们喜欢Scribbr校对服务的原因
表面有效性
表面有效性从表面上看,测试内容是否合适。它类似于内容效度,但表面效度是一种更加非正式和主观的评估。
例子
你创建了一个调查来衡量人们饮食习惯的规律性。你检查了调查项目,这些问题涉及一天中的每顿饭和一周中每天吃的零食。从表面上看,调查似乎很好地代表了您想要测试的内容,因此您认为它具有较高的表面效度。
由于表面效度是一种主观的衡量标准,它通常被认为是效度最弱的形式。然而,它在开发方法的初始阶段是有用的。
效标效度
标准效度评估测试对具体结果的预测程度,或者您的测试结果与另一个测试结果的近似程度。
什么是标准变量?
标准变量是一种被广泛认为有效的已建立的有效度量,有时被称为“金标准”度量。标准变量很难找到。
什么是标准效度?
为了评估准则的有效性,您需要计算相关在你的测量结果和标准测量结果之间。如果有很高的相关性,这就很好地表明您的测试正在测量它想要测量的东西。
例子
一位大学教授发明了一种新的测试来衡量申请人的英语写作能力。为了评估该测试对学生写作能力的真正衡量效果,她找到了一个被认为是有效衡量英语写作能力的现有测试,并比较了同一组学生参加这两项测试的结果。如果结果非常相似,新测试具有较高的标准效度。
关于有效性类型的常见问题
- 内容效度和表面效度在哪些方面相似?
-
表面有效性而且内容效度相似之处在于它们都评估测试内容的合适程度。区别在于表面有效性是主观的,在表面上评估内容。
当一次考验已经坚强表面效度,任何人都会同意,测试的问题似乎衡量了他们想要衡量的东西。
例如,在四年级的数学考试中,学生们必须做加法和乘法,大多数人会认为它有很强的说服力表面有效性(也就是说,它看起来像一个数学测试)。
另一方面,内容效度评估一个测试如何很好地代表一个主题的所有方面。内容效度的评估更加系统,依赖于专家评价。对于每个问题,分析每个问题是否涵盖了测试设计要涵盖的方面。
四年级的数学考试会有高内容效度如果它涵盖了那个年级教的所有技能。专家(在这种情况下,数学老师)必须通过将测试与学习目标进行比较来评估内容效度。
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。