忽略变量偏差当统计模型未能包含一个或多个相关时发生变量.换句话说,这意味着你在分析中遗漏了一个重要因素。
结果,该模型错误地将缺失变量的影响归因于包含的变量。排除重要变量可以限制有效性你的研究结果。
什么是被省略的变量?
省略的变量是a混杂变量与一项研究的假定原因和假定结果相关的。换句话说,它与自变量和因变量.
虽然可以忽略某个变量,因为您没有意识到它的存在,但也可以忽略您无法测量的变量,即使您意识到它们的存在。
什么是遗漏变量偏差?
省略变量偏差发生在线性回归分析当一个或多个相关的自变量不包括在你的回归模型。
回归模型描述了一个或多个自变量(也称为预测变量、协变量或变量)之间的关系解释变量)和因变量(通常称为响应变量或目标变量)。
因为省略的变量是隐藏的或未被观察到的,所以它不会被考虑到分析中,从而影响结果。
如果省略的变量是,这可能会使系数产生偏差相关用:
- 因变量
- 一个或多个其他自变量
为什么省略变量偏差是一个问题?
一个被忽略的变量是内生性的来源。内生性发生在误差项中的变量也是相关用一个自变量。
当这种情况发生时,来自被忽略变量的因果影响就会与系数在与它相关的变量上。这反过来又削弱了我们推断出因果关系严重影响我们的结果。
的变量可能会导致高估(向上偏倚)或低估(向下偏倚)系数自变量的。由于系数变得不可靠,回归模型也变得不可靠。
如何处理遗漏变量偏差
回归模型不能总是完美地预测因变量的值。因此,每个回归模型都有一个或多个被忽略的变量。虽然不能完全避免,但您可以采取一些步骤来减轻被忽略的变量偏差。
- 如果所需要的数据没有,像在能力的情况下,可以使用控制变量.以工资为例,控制在理论上是影响工资的变量,比如工作经验的年数。
- 如果您没有这些数据,请为省略的变量使用代理。这些变量与省略的变量非常相似,可以让您了解其值,但您可以测量。例如,你可以用智商测试来代表一个人的能力。
- 如果您无法解决研究偏见,试着预测一下你的估计偏向哪个方向。这被称为“签名”偏差。你可以把它写成正号或负号,这对你很有帮助估计忽略的变量偏差.
估计遗漏变量偏差
不需要深入高等代数,我们可以使用逻辑思维来预测省略变量的方向。通过这种方式,我们可以确定我们是否高估或低估了我们在回归模型中包含的变量的影响。
下表总结了忽略变量偏差的方向。偏差的符号基于被省略变量与模型中变量之间关系的符号。
我们假设:
Y是因变量
一个是一个自变量
B是另一个自变量,也就是省略的变量。
|
A和B正相关 |
A和B是负相关的 |
B对Y有积极的影响 |
正偏置 |
负偏压 |
B对Y有负面影响 |
负偏压 |
正偏置 |
请注意,在正面偏见下,我们倾向于高估,而在负面偏见下,我们倾向于低估。
其他类型的研究偏见
常见问题
本文的来源
我们强烈鼓励学生在他们的工作中使用资源。你可以引用我们的文章(APA Style)或深入研究下面的文章。
这篇Scribbr文章
来源