单向方差分析|何时及如何使用(附示例)

方差分析是方差分析(Analysis of Variance)的缩写统计检验用于分析之间的差异意味着两组以上的。

一个单向方差分析使用一个独立变量,而双向方差分析使用两个自变量。

单向方差分析例子
作为一名作物研究员,您希望测试三种不同的肥料混合物对作物产量的影响。你可以使用单向方差分析来找出三组之间的作物产量是否有差异。

何时使用单向方差分析

如果有的话,使用单向方差分析收集的数据大约一个分类自变量和一个定量因变量.自变量至少有三个水平(即至少三个不同组别或类别)。

方差分析告诉你因变量是否随着自变量的水平而变化。例如:

  • 自变量是社交媒体使用,并将组分配给媒介,社交媒体的使用水平,看看是否有差异每晚的睡眠时间
  • 自变量是汽水品牌,并收集数据可口可乐百事可乐雪碧,芬达来找出是否有区别每100毫升价格
  • 自变量是肥料种类你用混合物来处理农田12而且3.来找出是否有区别作物产量

零假设H0)的方差分析是组间均值无差异。替代假设(H一个)是至少有一组与因变量的总体平均值显著不同。

如果你只想比较两组,使用at测验代替。

方差分析是如何工作的?

方差分析通过计算处理水平的均值与因变量的总体均值是否不同,来确定由自变量水平创建的组是否具有统计上的差异。

如果组均值中有任何一个显著不同于总体均值,则零假设将被拒绝。

方差分析使用F测试统计显著性.这允许同时比较多个平均值,因为误差是为整个比较集计算的,而不是为每个单独的双向比较计算的t测试)。

F测试比较方差每一组的均值来自于整个组的方差。如果方差群体内部小于方差团体之间,F考试会找到更高的F值,因此观察到的差异更有可能是真实的,而不是偶然的。

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

方差分析假设

方差分析检验的假设与任何参数检验的一般假设相同:

  1. 观察的独立性:数据收集采用统计有效抽样方法,并且观察结果之间没有隐藏的关系。如果你的数据不能满足这个假设,因为你有混杂变量你需要在统计上控制,使用一个有阻塞变量的方差分析。
  2. 正态分布响应变量:因变量的值遵循a正态分布
  3. 方差齐性:被比较的每一组内的变化都是相似的。如果各组之间的方差不同,那么方差分析可能就不适合这些数据。

进行单向方差分析

而你可以进行方差分析用手在美国,仅靠几次观察就很难做到这一点。我们将在R统计程序中执行我们的分析,因为它是免费的、强大的并且广泛可用的。有关此ANOVA示例的完整演练,请参阅我们的执行指南R的方差分析

来自我们假想的作物产量实验的样本数据集包含以下数据:

  • 肥料类型(1、2、3型)
  • 种植密度(1 =低密度,2 =高密度)
  • 田间种植位置(第1、2、3、4座)
  • 最终作物产量(蒲式耳/英亩)。

这为我们提供了足够的信息来运行各种不同的方差分析测试,并查看哪个模型最适合数据。

对于单因素方差分析,我们只分析肥料类型对作物产量的影响。

方差分析样本数据集

在将数据集加载到R环境后,我们可以使用该命令自动阀()进行方差分析在这个例子中,我们将模拟平均值的差异反应变量作物产量,作为肥料类型的函数。

单向方差分析R码
一个。Way <- aov(yield ~ fertilizer, data = crop.data)

解读结果

要查看R中统计模型的摘要,请使用总结()函数。

单向方差分析模型汇总R代码
总结(one.way)

方差分析测试的总结(在R中)如下所示:

单向方差分析总结

方差分析输出提供了自变量可以解释的因变量中有多少变化的估计。

  • 第一列列出独立变量和模型一起残差(也就是模型误差)。
  • Df列显示自由度对于自变量(用变量内的水平数减去1计算)和残差的自由度(用观察总数减去1,然后减去每个自变量的水平数计算)。
  • 平方之和列显示了组均值和由该变量解释的总体均值之间的平方和(也就是总变异)。肥料变量的平方和为6.07,残差的平方和为35.89。
  • 意思是平方列是平方和的平均值,由平方和除以自由度来计算。
  • F价值列是检验统计量F检验:每个自变量的均方除以残差的均方。越大F值越大,与自变量相关的变化就越有可能是真实的,而不是偶然的。
  • 公关(F >)列是p价值F统计。这表明,它是多么有可能F从测试中计算的值将会发生零假设组间均值无差异。

因为p自变量肥料的值为统计上显著p< 0.05),可能肥料类型对作物平均产量有显著影响。

事后测试

方差分析会告诉你自变量的水平之间是否存在差异,但不会告诉你哪些差异是显著的。为了发现治疗水平之间的差异,执行TukeyHSD (Tukey 's honest - significant Difference)事后测试。

Tukey测试R代码
TukeyHSD (one.way)

Tukey测试在每个组之间进行两两比较,并使用保守的误差估计来找到统计上彼此不同的组。

TukeyHSD的输出如下所示:

Tukey总结单因素方差分析

首先,该表报告正在测试的模型(“Fit”)。接下来,它列出了自变量组之间的两两差异。

在“$fertilizer”部分,我们可以看到每种肥料处理之间的平均差异(“diff”),即95%的下限和上限置信区间(' lwr '和' upr '),以及p价值,针对多个成对比较进行了调整。

两两比较表明,肥料3的平均产量显著高于肥料2和肥料1,但肥料2和肥料1的平均产量差异不具有统计学意义。

报告方差分析结果

当报告方差分析的结果时,包括对测试变量的简要描述F价值,自由度,以及p每个自变量的值,并解释结果的含义。

示例:报告单向方差分析的结果
我们发现不同肥料类型的作物平均产量在统计上有显著差异(F(2) = 9.073,p< 0.001)。Tukey事后测试显示,肥料类型3和2之间存在显著的两两差异,平均差异为0.42蒲式耳/英亩(p< 0.05), 3型和1型肥料的平均差异为0.59蒲式耳/亩(p< 0.01)。

如果您想提供关于在测试中发现的差异的更详细的信息,您还可以包含方差分析结果图,在自变量的每个级别上用分组字母表示,以显示哪些组在统计上彼此不同:

单向方差分析图

关于单向方差分析的常见问题

单向方差分析和双向方差分析的区别是什么?

单向和双向方差分析之间的唯一区别是的数量独立变量.单向方差分析有一个自变量,而双向方差分析有两个。

  • 单向方差分析:在马拉松比赛中测试鞋品牌(Nike, Adidas, Saucony, Hoka)与比赛完成时间之间的关系。
  • 双向方差分析:测试鞋品牌(耐克,阿迪达斯,Saucony, Hoka),跑者年龄组(初级,高级,硕士)和马拉松比赛结束时间之间的关系。

所有的方差分析都是为了测试三个或更多组之间的差异。如果您只是测试两组之间的差异,请使用学习任务代替。

什么是阶乘方差分析?

阶乘方差分析是任何使用一个以上的方差分析分类自变量.一个双向方差分析是一种阶乘方差分析。

阶乘方差分析的一些例子包括:

  • 测试疫苗接种(接种或未接种)和健康状况(健康或已有疾病)对人群流感感染率的综合影响。
  • 测试婚姻状况(已婚、单身、离婚、丧偶)、工作状况(受雇、自雇、失业、退休)和家族史(无家族史、有家族史)对人群抑郁症发病率的影响。
  • 测试饲料类型(A型、B型或C型)和鸡舍拥挤程度(不拥挤、有点拥挤、非常拥挤)对商业养殖操作中鸡的最终体重的影响。
方差分析如何计算统计显著性?

在方差分析中,零假设群体均值之间没有差异。如果任何一组显著不同于整个组的平均值,那么方差分析将报告a统计上显著结果。

使用F统计量计算组均值之间的显著差异,F统计量是平均平方和的比值方差由自变量解释)到均方误差(剩余方差)。

如果F统计值高于临界值(与alpha值相对应的F值,通常为0.05),则组间的差异被认为具有统计学意义。

定量变量和分类变量的区别是什么?

定量变量是否有数据表示数量的变量(例如身高、体重或年龄)。

分类变量是否有数据表示组的变量。这包括排名(例如在比赛中获得的名次)、分类(例如谷物的品牌)和二元结果(例如抛硬币)。

你需要知道是什么变量类型您正在为您的数据选择正确的统计测试,并解释您的数据结果

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

贝文斯,R.(2022年11月17日)。单向方差分析|何时以及如何使用它(附示例)。Scribbr。检索于2022年12月13日,来自//www.dandarfirm.com/statistics/one-way-anova/

这篇文章有用吗?
丽贝卡·贝

丽贝卡正在攻读土壤生态学博士学位,空闲时间用来写作。她很高兴能和大家一起研究统计数据。
Baidu