决定系数(R²)|计算与解释

决定系数是一个介于0和1之间的数字,用来衡量统计的好坏模型预测结果。

解释决定系数
决定系数(R2 解释
0 该模型预测结果。
在0和1之间 该模型部分预测结果。
1 该模型完美的预测结果。

决定系数通常写成R2,发音为“r平方”。为简单线性回归,小写字母r通常用来代替(r2).

决定系数是多少?

决定系数(R²)衡量一个统计数据的好坏模型预测结果。结果由模型的结果表示因变量

的最低可能值R²为0,最大值为1。简而言之,一个模型的预测能力越强,其预测结果就越接近R²等于1。

示例:决定系数
假设您执行一个简单的线性回归,根据学生花费在学习上的时间(独立变量).

  • 如果R2是0,线性回归模型不能让你更好地预测考试成绩比简单地估计每个人都有一个平均考试分数。
  • 如果R2介于0和1之间,该模型允许您部分预测考试成绩。该模型的估计并不完美,但比简单地使用平均考试成绩要好。
  • 如果R2为1时,该模型允许你完美地预测任何人的考试成绩。

更多的技术,R2是一种适合度的度量。它是的比例方差在因变量中,由模型解释。

图形化你的线性回归数据通常给你一个很好的线索,是否它R2是高是低。例如,下图显示了两组模拟数据:

  • 观测结果以圆点表示。
  • 模型的预测(最佳拟合线)显示为一条黑线。
  • 观测值和预测值之间的距离(残差)用紫色线表示。

你可以在第一个数据集中看到R2是高的,观察结果是接近模型的预测.换句话说,大多数点都接近于最佳拟合线:

决定系数(R2) = 0.9

注意:决定系数总是正的,即使当相关是负的。

相比之下,你可以在第二个数据集中看到R2是低的,观察值是与模型的预测相差甚远.也就是说,当R2是低,很多点都离最佳贴合线很远:

决定系数(R2) = 0.2

计算决定系数

你可以在两个公式中选择计算决定系数(R²)的简单线性回归。第一个公式是特定于简单线性回归,第二个公式可用于计算R²的多种统计模型。

公式1:利用相关系数

公式1:

\开始*}{方程R ^ 2 = (R) ^ 2 \{方程*}结束

在哪里r皮尔逊相关系数

例如:计算R²利用相关系数
你正在研究儿童心率和年龄之间的关系,你发现这两个变量具有负的皮尔逊相关:

*}{方程r = -0.28 \ \开始结束{方程*}

此值可用于计算决定系数(R²)使用公式1:

\开始*}{方程R ^ 2 = (R) ^ 2 \{方程*}结束

\开始*}{方程R ^ 2 =(-0.28) ^ 2 \{方程*}结束

\开始*}{方程R ^ 2 = 0.08 \{方程*}结束

公式2:使用回归输出

公式2:

\开始*}{方程R ^ 2 = 1 - \ dfrac {\ textup {RSS}} {\ textup {TSS}}{方程*}\结束

地点:

  • RSS =残差平方和
  • TSS =总平方和
例如:计算R²使用回归输出
作为执行简单线性回归的一部分,从学生的学习时间(自变量)预测他们的考试成绩(因变量),您可以计算出:

{方程*}\ \开始textup {RSS} = 629.22 \{方程*}结束

{方程*}\ \开始textup {TSS} = 2 \ 187.04 \{方程*}结束

这些数值可用于计算决定系数(R²)利用公式2:

\开始*}{方程R ^ 2 = 1 - \ dfrac {\ textup {RSS}} {\ textup {TSS}}{方程*}\结束

\开始*}{方程R ^ 2 = 1 - \ dfrac{629.22}{187.04} 2 \ \{方程*}结束

\开始*}{方程R ^ 2 = 1 - 0.29 \{方程*}结束

\开始*}{方程R ^ 2 = 0.71 \{方程*}结束

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

解释决定系数

你可以解释决定系数(R²)的比例方差因变量这是统计数据所预测的模型

另一种思考方式是R²是自变量和因变量之间的方差比例。

你也可以说R²是模型“解释”或“解释”的方差的比例。(1−.R²)为模型未预测到的方差。

如果您愿意,您可以编写R²是百分比,而不是比例。简单地将比例乘以100。

R²作为效应大小

最后,您还可以解释R²作为an影响的大小:因变量和自变量之间关系强度的度量。心理学家和统计学家雅各布·科恩(1988)提出了以下的经验法则简单线性回归

作为一个效应量
最小决定系数(R²)值 效应量解释
. 01
.09点 媒介
二十五分

小心:R²本身并不能告诉你任何关于因果关系

例如:解释R²
一个简单的线性回归,预测学生的考试成绩(因变量)从他们的学习时间(自变量)有一个R²(。71)从这个R²value,我们知道:

  • 71%的学生考试成绩差异是由他们的学习时间预测的
  • 该模型无法解释学生考试成绩中29%的差异
  • 学生的学习时间对他们的考试成绩有很大的影响

学习更长时间可能会,也可能不会导致学生成绩的提高。虽然这种因果关系是非常合理的,但R²不能单独告诉我们为什么学生的学习时间和考试成绩之间有关系。

例如,当学生们很好地理解课程材料时,他们可能会发现学习不那么令人沮丧,所以他们会学习更长时间。

报告决定系数

如果你决定加入一个决定系数(R²)在你的研究论文论文论文,你应该在你的结果部分.如果你愿意,你可以遵循这些规则以APA风格报告统计数据

  • 你应该使用"r²”用于具有一个自变量的统计模型(如简单线性回归)。使用“R²"用于具有多个自变量的统计模型。
  • 你不需要提供参考或公式,因为决定系数是一个常用的统计。
  • 你应该用斜体r²,R当报告它们的值时(但不要用斜体)。
  • 你不应该包含前导零(小数点前的零),因为决定系数不能大于1。
  • 您应该在小数点后提供两个有效数字。
  • 通常,决定系数与相关的统计结果一起提供,例如F价值自由度,p价值
例如:报告r²APA风格
学生的考试成绩是由他们的学习时间来预测的,r²= .71,F(1,32) = 7.33,p= .003。

实践问题

关于决定系数的常见问题

决定系数(R²)的定义是什么?

决定系数(R²)是一个介于0和1之间的数字,用于衡量统计模型预测结果的好坏。你可以把R²解释为因变量这是由统计模型预测的。

决定系数(R²)的公式是什么?

有两个公式可以用来计算决定系数(R²)简单线性回归

公式1:R ^ 2 = (R) ^ 2

公式2:R ^ 2 = 1 - \ dfrac {\ textup {RSS}} {\ textup {TSS}}

如何计算R中的决定系数(R²)?

可以使用summary()函数查看你会在输出的底部附近看到“r平方”。

如何在Excel中计算决定系数(R²)?

可以使用RSQ()函数进行计算在Excel中。如果你的因变量在A列中,而你的自变量在B列中,然后单击任何空白单元格并键入“RSQ(A:A,B:B)”。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

特尼,S.(2022, 9月14日)。决定系数(R²)|计算与解释。Scribbr。2023年1月3日,从//www.dandarfirm.com/statistics/coefficient-of-determination/检索

这篇文章有用吗?
肖恩·特尼

在他的硕士和博士期间,Shaun学习了如何将科学和统计方法应用到他的生态学研究中。现在,他喜欢教学生如何为他们自己的论文和研究项目收集和分析数据。
Baidu