什么是方差?|定义,例子和公式
的方差是衡量可变性.它是通过取均值的方差的平均值来计算的。
方差告诉你数据集中的分布程度。数据越分散,相对于的方差就越大的意思是.
方差与标准差
的标准偏差由方差得出,告诉你,平均而言,每个值离均值有多远。它是方差的平方根。
两项指标都反映了可变性在分布中,但它们的单位不同:
- 标准偏差以与原始值相同的单位表示(例如,米)。
- 方差用更大的单位表示(例如,平方米)
由于方差的单位比数据集的典型值大得多,因此很难直观地解释方差数。这就是为什么标准差通常被首选作为可变性的主要衡量标准。
然而,方差比标准差更能说明可变性,它被用于统计推断.
总体与样本方差
不同的公式用于计算方差取决于你的数据是来自整个群体还是样本。
总体方差
当你收集了所有成员的数据人口你感兴趣的,你可以得到总体方差的确切值。
的总体方差公式是这样的:
公式 | 解释 |
---|---|
|
样本方差
当你从一个样本中收集数据时,样本方差被用来进行估计或计算推论关于总体方差。
的样本方差公式是这样的:
公式 | 解释 |
---|---|
|
对于样品,我们使用n在公式中使用- 1,因为使用n会给我们一个有偏差的估计,始终低估变异性。样本方差会小于总体的实际方差。
减少样本n来n- 1使方差人为地变大,给你一个无偏倚的变异性估计:最好是高估而不是低估样本的变异性。
值得注意的是,用标准差公式做同样的事情并不能得到完全无偏的估计。因为平方根不是一个线性操作,就像加法或减法一样,样本方差公式的无偏性并不包含样本标准差公式。
计算方差的步骤
方差通常由用于统计分析的任何软件自动计算。但你也可以手工计算,以更好地理解公式是如何工作的。
手动查找方差有五个主要步骤。我们将使用一个包含6个分数的小数据集来完成这些步骤。
数据集 | |||||
---|---|---|---|---|---|
46 | 69 | 32 | 60 | 52 | 41 |
步骤1:求平均值
来求均值,把所有分数加起来,然后除以分数的个数。
意思是( ) |
---|
= (46 + 69 + 32 + 60 + 52 + 41) 6 =50 |
步骤2:找出每个分数与均值的偏差
减去每个分数的平均值,得到偏离平均值的偏差。
自x̅= 50,从每个分数中减去50。
分数 | 偏离均值 |
---|---|
46 | 46 - 50 =4 |
69 | 69 - 50 =19 |
32 | 32 - 50 =-18年 |
60 | 60 - 50 =10 |
52 | 52 - 50 =2 |
41 | 41 - 50 =9 |
步骤3:每个偏离均值的平方
每一个偏离均值的值都乘以它自己。结果是正数。
均值的平方 |
---|
(4)2= 4 × 4 =16 |
192= 19 × 19 =361 |
(-18)2= -18 × -18 =324 |
102= 10 × 10 =One hundred. |
22= 2 × 2 =4 |
(9)2= -9 × -9 =81 |
步骤4:求平方和
把所有的方差平方加起来。这叫做平方和。
平方和 |
---|
16 + 361 + 324 + 100 + 4 + 81 =886 |
步骤5:平方和除以n- 1或N
把平方和除以n- 1 (for a样本)或N(对于人口)。
既然我们在研究样本,我们就用n- 1,其中n= 6。
方差 |
---|
886 (6 - 1) = 886 5 =177.2 |
为什么方差很重要?
差异之所以重要,主要有两个原因:
- 参数统计检验对方差敏感。
- 比较样本的方差有助于评估组间差异。
统计检验中的方差齐性
在执行之前考虑方差是很重要的参数测试.当比较不同样本时,这些检验要求相同或相似的方差,也称为方差齐性或同方差。
样品之间不均匀的方差会导致有偏和倾斜的测试结果。如果样本间方差不均匀,非参数测试更合适。
用方差评估组间差异
统计测试,如方差测试或方差分析使用样本方差来评估组间差异。他们使用样本的方差来评估它们来自的群体是否彼此不同。
方差分析背后的主要思想是比较组间方差和组内方差,看看结果是由组间差异还是个体差异来最好地解释。
如果组间方差高于组内方差,则组间差异很可能是治疗的结果。如果不是,那么结果可能来自样本成员的个体差异。
关于方差的常见问题
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。