比例量表|定义，示例和数据分析

发布于2020年8月28日Pritha班达里。2022年11月28日修订。

一个比率量表是一种定量刻度，其中有一个真零和相邻点之间的等距。与区间尺度不同，比率尺度上的零意味着完全没有变量你在测量。

长度、面积和人口是比率量表的例子。

测量水平

比率等级是四个等级中最高的测量水平。测量的级别或尺度表示数据记录的精确程度。级别越高，测量就越复杂。

比率级别包含其他3个级别的所有特性。在比率级别，值可以被分类、排序、具有相等的间隔并具有真正的零。

而名义上的而且序数变量是分类变量，时间间隔比率变量是定量变量。定量数据比分类数据可以进行更多的统计检验。

什么是真正的零?

在比率尺度上，零意味着完全没有兴趣变量。例如，一个家庭中孩子的数量或工作经验的年数是比例变量:受访者可以没有孩子，也可以没有工作经验。

与一个真正的零在你的比例尺中，你可以计算值的比率。例如，你可以说一个家庭中4个孩子是2个孩子的两倍。同样，8年是4年经验的两倍。

有些变量，如温度，可以用不同的尺度来测量。摄氏度和华氏度是间隔标度，开尔文是比例标度。

在所有3个尺度中，相邻点之间都有相等的间隔。然而，与摄氏温标和华氏温标不同的是，零度只是另一个温度值，开尔文温标有一个真正的零度(0 K)，没有什么比这更冷了。

这意味着你只能计算开尔文标度下温度的比值。虽然40°是20°的两倍，但在摄氏度或华氏度上，它并不是前者的两倍。然而，在开氏温标中，40k的温度是20k的两倍，因为在这个温标的起点有一个真正的零。

一个真正的零使乘、除或平方根值成为可能。收集数据比率级别总是比其他级别更可取，因为它是最精确的。

比率量表的例子

许多变量在自然科学和社会科学中使用比率量表来衡量。

和区间变量一样，比率变量也可以离散或连续的。

一个离散变量只能用可数数字(如整数)表示，而a连续变量可以有无限多的值。

比例变量	离散的还是连续的?
过去10年拥有的车辆数量	离散
一个家庭的人数	离散
有宗教信仰的学生人数	离散
计算机任务中的反应时间	连续
工作经验	连续
以英里每小时为单位的速度	连续

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

比率数据分析

收集了比率数据之后，可以进行收集描述性的而且推论统计。几乎所有的统计测试可以在比率数据上执行，因为所有数学运算都是允许的。

比率数据示例

您收集了一个大城市中员工通勤时间的数据。数据是连续的，以分钟为单位。

为了总结您的数据，您可以收集以下描述性统计数据:

以数字或百分比表示的频率分布，
的模式，中位数,或的意思是要找到集中趋势，
的范围，标准偏差而且方差表示可变性。

分布

您可以大致了解表中不同值的频率，并在图形中可视化它们的分布。

要组织数据，请将其输入到分组频率分布表中。在左手一列上创建间隔相等的组，并在右手一列中输入每个间隔内的分数。

通勤时间(分钟)	频率
1 - 10	3.
11 - 20	1
21 - 30	9
31 - 40	19
41 - 50	13
51 - 60	3.
61 - 70	2
71 - 80	1

集中趋势

从图表中，您可以看到您的数据是相当正态分布的。由于不存在倾斜，为了找到您的大多数值所在的位置，您可以使用所有3种常见的度量集中趋势:众数、中位数和平均值。

的模式是数据集中重复频率最高的值。对于连续变量，通常没有模式，因为你的数据有无限个可能的值。在我们的例子中，没有模式，因为每个值只出现一次。

的中位数恰好位于数据集中间的值。要找到中间位置，请取position (n+ 1) / 2n是值的总数。

（n+1)/2 = (51+1)/2 = 26

中位数在第26位，其值为36.4分钟。

的的意思是（米)使用所有值为数据的集中趋势提供一个单一的数字。使用⅀的公式x/n。将所有值相加(⅀x)然后把总和除以n。

⅀x= 1883.5
n= 52
米=⅀x/n =1883.5/52 =36.9

当你拥有正态分布的定量数据时，平均值通常被认为是集中趋势的最佳度量。这是因为它使用数据集中的每一个值进行计算，而不像众数或中位数。

可变性

极差、标准差和方差描述如何传播你的数据是。极差是最容易计算的;标准差和方差更复杂，但信息量也更大。

变异系数是一种仅适用于比率变量的扩散度量。

来找到范围，用数据集中的最高值减去最低值。我们上下班的最长时间是72.5分钟，最短时间是7分钟。

范围= 72.5 - 7 = 65.5

的标准偏差（年代)是数据集中可变性的平均值。它告诉你每个分数离平均值有多远。大多数计算机程序都可以很容易地为你计算出标准偏差。如果你想用手做，就用这个步骤。

年代＝13.34

的方差（年代 ²)是平均值的平方偏差。偏离平均值是指数据集中的值与平均值之间的差值。方差要平方标准差。

年代²＝178.04

亦称相对标准偏差(标准偏差)，变异系数(简历)是离散度的标准化度量。它告诉你你的数据相对于平均值的变化程度。它只能用于比率级别的测量，因为它是一个分数。变异系数(简历)为标准差除以均值。

简历＝s / M

简历= 36.9/13.34 =0.36

变异系数为0.36或36%。这告诉你，你的数据有一个很大的价差，因为标准偏差是平均值的36%。

统计测试

现在您已经对数据有了概览，可以选择适当的数据测试用于统计推断。对于正态分布的比率数据，参数检验是检验假设的最佳方法。

参数检验比非参数检验更强大，可以让您对数据做出更有力的结论。但是，您的数据必须满足几个条件需求用于应用参数测试。

下面的参数测试是一些最常用的测试测试假说关于比率数据。

目的	样本或变量	测试	例子
均数比较	2样品	学习任务	波士顿和洛杉矶员工的平均通勤时间有区别吗?
均数比较	3个或以上样本	方差分析	北美、亚洲和欧洲员工的平均通勤时间有区别吗?
相关	两个变量	皮尔森的r	通勤时间和收入水平有什么关系?
回归	两个变量	简单线性回归	收入能预测平均通勤时间吗?

比率数据的常见问题

测量的四个层次是什么?: 测量水平告诉你变量的记录有多精确。有4个等级的测量，可以从低到高的排名:

名义上的：数据只能进行分类。

序数：可以对数据进行分类和排序。

时间间隔：可以对数据进行分类和排序，并均匀间隔。

比：数据可以被分类，排序，均匀间隔，并有一个自然的零。
区间数据和比值数据的区别是什么?: 而时间间隔而且比数据可以对两者进行分类、排序，并且相邻值之间具有相等的间距，只有比率尺度具有真正的零。

例如，摄氏度或华氏度的温度是间隔刻度，因为0不是可能的最低温度。在开尔文标度(一种比率标度)中，零表示完全缺乏热能。
离散变量和连续变量的区别是什么?: 离散连续变量有两种类型定量变量：

离散变量表示计数(例如集合中对象的数量)。

连续变量表示可测量的量(例如水量或重量)。

引用这篇Scribbr文章

如果你想引用这个来源，你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮，自动添加到我们的免费引用生成器引用。

班达里，P.(2022, 11月28日)。比例量表|定义，示例和数据分析。Scribbr。2023年1月3日，从//www.dandarfirm.com/statistics/ratio-data/检索

引用本文

这篇文章有用吗?

你已经投票了。谢谢:-) 你的投票被保存了:-) 处理你的投票…

Pritha班达里

普里塔拥有英语、心理学和认知神经科学方面的学术背景。作为一名跨学科研究人员，她喜欢为学生和学者撰写文章，解释棘手的研究概念。

让语言专家提高你的写作水平

在10分钟内做一次免费的抄袭检查

免费生成准确的引用

让语言专家提高你的写作水平

在10分钟内做一次免费的抄袭检查

免费生成准确的引用

比例量表|定义，示例和数据分析

目录