如何计算标准偏差(指南)|公式和例子

标准偏差平均是多少可变性在你的数据集中。它告诉你,平均而言,每个值离平均值有多远。

较高的标准偏差意味着数值通常远离的意思是,而较低的标准差表明值聚集在平均值附近。

标准差告诉我们什么?

标准偏差是一种有用的度量正态分布

在正态分布中,数据是对称分布的.大多数值都聚集在一个中心区域周围,当值离中心越远时,值就越小。标准差告诉你数据平均从分布中心向外分布的程度。

许多科学变量遵循正态分布,包括身高、标准化测试分数或工作满意度评级。当你有不同的标准差时样品,你可以比较它们的分布统计测试来推断他们来自更大的群体。

例子:比较不同的标准差
你从三组员工中收集工作满意度评级的数据简单随机抽样

平均值()每个组的评分都是一样的——它是曲线处于峰值时x轴上的值。然而,他们的标准差(SD)各不相同。

标准差反映了分布的分散性。标准差最小的曲线峰值高、分布小,而标准差最高的曲线更平坦、分布更广。

显示三个不同标准差样本分布的图表

经验法则

标准偏差和平均值一起可以告诉你在你的频率分布如果它们服从正态分布就撒谎。

经验法则,或者68-95-99.7法则,告诉你你的价值所在:

  • 大约68%的分数与平均值相差1个标准差,
  • 大约95%的分数与平均值相差2个标准差,
  • 大约99.7%的分数与平均值相差3个标准差。
例如:正态分布的标准差
你对一组学生进行记忆回忆测试。数据服从正态分布,平均得分为50分,标准差为10分。

遵循经验法则:

  • 大约68%的分数在40到60之间。
  • 大约95%的分数在30到70之间。
  • 大约99.7%的分数在20到80之间。

显示正态分布经验法则的图表。

经验规则是一种快速获得数据概览并检查任何数据的方法离群值或者不符合这个模式的极值。

请注意
对于非正态分布,标准偏差是一种不太可靠的可变性测量方法,应该与其他测量方法如范围四分位范围

总体和样本的标准差公式

不同的公式用于计算标准差取决于你是否有收集的数据从整个群体或样本中。

总体标准差

当你收集了所有成员的数据人口你感兴趣的,你可以得到总体标准差的确切值。

总体标准差公式是这样的:

公式 解释
\sigma =\sqrt{\dfrac{\sum{(X - \mu)^2}}{N}}
  • \σ 总体标准差
  • \总和 总和…
  • X =每个值
  • \μ 总体平均数
  • N =总体中值的数量

样本标准差

当你从一个样本中收集数据时,样本标准差为用于进行估计或推论关于总体标准差。

样本标准差公式是这样的:

公式 解释
s =\sqrt{\dfrac{\sum{(X - \bar{X})^2}}{n - 1}}
  • 年代 样本标准差
  • \总和 总和…
  • X =每个值
  • 酒吧\ {x} 样本平均数
  • n =样本中值的个数

对于样品,我们使用n公式中的- 1是因为使用n会给我们一个有偏见的估计,一直低估了可变性。样本标准差会趋向于低于总体的真实标准差。

减少样本nn- 1使标准偏差人为地变大,给你一个变异性的保守估计。

虽然这不是一个无偏的估计,但它是一个偏差较小的估计:高估而不是低估样本的可变性更好。

防止抄袭,运行免费检查。

免费尝试

计算标准差的步骤

标准偏差通常由用于统计分析的任何软件自动计算。但你也可以手工计算,以更好地理解公式是如何工作的。

手动查找标准偏差有六个主要步骤。我们将使用一个包含6个分数的小数据集来完成这些步骤。

数据集
46 69 32 60 52 41

步骤1:求平均值

求均值,把所有分数加起来,然后除以分数的个数。

意思是(x̅)
酒吧\ {x} = \ dfrac {(46 + 69 + 32 + 60 + 52 + 41)} {6} = 50

步骤2:找出每个分数与均值的偏差

减去每个分数的平均值,得到偏离平均值的偏差。

= 50,这里我们从每个分数中拿走50。

分数 偏离均值
46 46 - 50 =4
69 69 - 50 =19
32 32 - 50 =-18年
60 60 - 50 =10
52 52 - 50 =2
41 41 - 50 =9

步骤3:每个偏离均值的平方

每一个偏离均值的值都乘以它自己。结果是正数。

均值的平方
(4)2= 4 × 4 =16
192= 19 × 19 =361
(-18)2= -18 × -18 =324
102= 10 × 10 =One hundred.
22= 2 × 2 =4
(9)2= -9 × -9 =81

步骤4:求平方和

把所有的方差平方加起来。这叫做平方和。

平方和
16 + 361 + 324 + 100 + 4 + 81 =886

步骤5:求方差

把平方和除以n- 1 (for a样本)或N(对于总体)-这是方差

由于我们的样本容量为6,所以我们将使用n- 1,其中n= 6。

方差
\dfrac{886}{(6 - 1)} = \dfrac{886}{5} = 177.2

步骤6:求方差的平方根

为了求标准差,我们取方差的平方根。

标准偏差
\sqrt{177.2} = 13.31

通过学习SD= 13.31时,我们可以说每个分数平均偏离平均值13.31分。

为什么标准差是可变性的有用衡量标准?

虽然有更简单的方法来计算变异性,但标准差公式对不均匀分布样本的权重大于均匀分布样本的权重。更高的标准差说明分布不仅更分散,而且分布更不均匀。

这意味着它可以让您更好地了解数据的可变性,而不是简单的测量方法,如平均绝对偏差(MAD)。

MAD与标准差相似,但更容易计算。首先,通过将它们转换为正数(例如,-3变成3),以绝对值表示与平均值的每一个偏差。然后,计算这些绝对偏差的平均值。

与标准偏差不同,你不需要计算MAD的平方或平方根。然而,由于这个原因,它提供了一个不太精确的可变性度量。

让我们选取两个具有相同集中趋势但变异性不同的样本。样本B比样本A更多变。

的意思是 平均绝对偏差 标准偏差
样品一个 66 30 40 64 50 15 17.8
示例B 51 21 79 49 50 15 23.7

对于与均值的平均偏差相等的样本,MAD不能区分传播水平。标准偏差更精确:对于偏离平均值的变异性更大的样本,标准偏差也更高。

通过对平均值的差异进行平方,标准差更准确地反映了不均匀的离散。与小的偏差相比,这个步骤更重视极端的偏差。

然而,这也使得标准偏差敏感离群值

关于标准差的常见问题

四种主要的可变性测量方法是什么?

可变性最常用的测量方法是什么描述性统计

标准差告诉我们什么?

标准偏差平均是多少可变性在你的数据集中。它平均告诉你,每个分数离的意思是

在正态分布中,高标准偏差意味着值通常远离平均值,而低标准偏差表明值聚集在平均值附近。

什么是正态分布?

在一个正态分布,数据对称分布,无歪斜。大多数值都聚集在一个中心区域周围,当值离中心越远时,值就越小。

集中趋势的度量(均值、众数和中位数)在正态分布中完全相同。

正态分布

经验法则是什么?

经验法则,或者68-95-99.7法则,告诉你a的大部分值在哪里正态分布

  • 大约68%的数值都在1以内标准偏差均值的。
  • 约95%的数值与平均值相差2个标准差。
  • 约99.7%的数值与平均值相差3个标准差。

经验规则是一种快速获取数据概览并检查不遵循此模式的任何异常值或极端值的方法。

标准差和方差的区别是什么?

方差是均值的平方偏差,而标准偏差是这个数的平方根。两项指标都反映了可变性在分布中,但它们的单位不同:

  • 标准偏差以与原始值相同的单位表示(例如,分钟或米)。
  • 方差用更大的单位表示(例如,米的平方)。

虽然方差的单位很难直观地理解,但方差在统计测试

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

班达里,P.(2022年11月11日)。如何计算标准偏差(指南)|公式和例子。Scribbr。检索于2022年12月18日,来自//www.dandarfirm.com/statistics/standard-deviation/

这篇文章有用吗?
Pritha班达里

普里塔拥有英语、心理学和认知神经科学方面的学术背景。作为一名跨学科研究人员,她喜欢为学生和学者撰写文章,解释棘手的研究概念。
Baidu