比例量表|定义,示例和数据分析

一个比率量表是一种定量刻度,其中有一个真零和相邻点之间的等距。与区间尺度不同,比率尺度上的零意味着完全没有变量你在测量。

长度、面积和人口是比率量表的例子。

测量水平

比率等级是四个等级中最高的测量水平。测量的级别或尺度表示数据记录的精确程度。级别越高,测量就越复杂。

比率级别包含其他3个级别的所有特性。在比率级别,值可以被分类、排序、具有相等的间隔并具有真正的零。

测量的4个级别:名义、顺序、间隔和比率

名义上的而且序数变量是分类变量,时间间隔比率变量是定量变量。定量数据比分类数据可以进行更多的统计检验。

什么是真正的零?

在比率尺度上,零意味着完全没有兴趣变量。例如,一个家庭中孩子的数量或工作经验的年数是比例变量:受访者可以没有孩子,也可以没有工作经验。

与一个真正的零在你的比例尺中,你可以计算值的比率。例如,你可以说一个家庭中4个孩子是2个孩子的两倍。同样,8年是4年经验的两倍。

有些变量,如温度,可以用不同的尺度来测量。摄氏度和华氏度是间隔标度,开尔文是比例标度。

在所有3个尺度中,相邻点之间都有相等的间隔。然而,与摄氏温标和华氏温标不同的是,零度只是另一个温度值,开尔文温标有一个真正的零度(0 K),没有什么比这更冷了。

这意味着你只能计算开尔文标度下温度的比值。虽然40°是20°的两倍,但在摄氏度或华氏度上,它并不是前者的两倍。然而,在开氏温标中,40k的温度是20k的两倍,因为在这个温标的起点有一个真正的零。

一个真正的零使乘、除或平方根值成为可能。收集数据比率级别总是比其他级别更可取,因为它是最精确的。

比率量表的例子

许多变量在自然科学和社会科学中使用比率量表来衡量。

和区间变量一样,比率变量也可以离散或连续的。

一个离散变量只能用可数数字(如整数)表示,而a连续变量可以有无限多的值。

比例变量 离散的还是连续的?
过去10年拥有的车辆数量 离散
一个家庭的人数 离散
有宗教信仰的学生人数 离散
计算机任务中的反应时间 连续
工作经验 连续
以英里每小时为单位的速度 连续

以下是学生们喜欢Scribbr校对服务的原因

发现校对和编辑

比率数据分析

收集了比率数据之后,可以进行收集描述性的而且推论统计。几乎所有的统计测试可以在比率数据上执行,因为所有数学运算都是允许的。

比率数据示例
您收集了一个大城市中员工通勤时间的数据。数据是连续的,以分钟为单位。

为了总结您的数据,您可以收集以下描述性统计数据:

分布

您可以大致了解表中不同值的频率,并在图形中可视化它们的分布。

要组织数据,请将其输入到分组频率分布表中。在左手一列上创建间隔相等的组,并在右手一列中输入每个间隔内的分数。

通勤时间(分钟) 频率
1 - 10 3.
11 - 20 1
21 - 30 9
31 - 40 19
41 - 50 13
51 - 60 3.
61 - 70 2
71 - 80 1
要使数据可视化,请将其绘制在频率分布多边形上。在x轴上绘制分组,在y轴上绘制频率,并使用线条连接每个分组的中点。频率分布多边形可用于可视化数据的分布。

集中趋势

从图表中,您可以看到您的数据是相当正态分布的。由于不存在倾斜,为了找到您的大多数值所在的位置,您可以使用所有3种常见的度量集中趋势:众数、中位数和平均值。

模式是数据集中重复频率最高的值。对于连续变量,通常没有模式,因为你的数据有无限个可能的值。在我们的例子中,没有模式,因为每个值只出现一次。
中位数恰好位于数据集中间的值。要找到中间位置,请取position (n+ 1) / 2n是值的总数。

n+1)/2 = (51+1)/2 = 26

中位数在第26位,其值为36.4分钟。

的意思是)使用所有值为数据的集中趋势提供一个单一的数字。使用⅀的公式x/n。将所有值相加(⅀x)然后把总和除以n。

x= 1883.5
n= 52
=⅀x/n =1883.5/52 =36.9

当你拥有正态分布的定量数据时,平均值通常被认为是集中趋势的最佳度量。这是因为它使用数据集中的每一个值进行计算,而不像众数或中位数。

可变性

极差、标准差和方差描述如何传播你的数据是。极差是最容易计算的;标准差和方差更复杂,但信息量也更大。

变异系数是一种仅适用于比率变量的扩散度量。

找到范围,用数据集中的最高值减去最低值。我们上下班的最长时间是72.5分钟,最短时间是7分钟。

范围= 72.5 - 7 = 65.5

标准偏差年代)是数据集中可变性的平均值。它告诉你每个分数离平均值有多远。大多数计算机程序都可以很容易地为你计算出标准偏差。如果你想用手做,就用这个步骤

年代13.34

方差年代 2)是平均值的平方偏差。偏离平均值是指数据集中的值与平均值之间的差值。方差要平方标准差。

年代2178.04

亦称相对标准偏差(标准偏差),变异系数(简历)是离散度的标准化度量。它告诉你你的数据相对于平均值的变化程度。它只能用于比率级别的测量,因为它是一个分数。变异系数(简历)为标准差除以均值。

简历s / M

简历= 36.9/13.34 =0.36

变异系数为0.36或36%。这告诉你,你的数据有一个很大的价差,因为标准偏差是平均值的36%。

统计测试

现在您已经对数据有了概览,可以选择适当的数据测试用于统计推断。对于正态分布的比率数据,参数检验是检验假设的最佳方法。

参数检验比非参数检验更强大,可以让您对数据做出更有力的结论。但是,您的数据必须满足几个条件需求用于应用参数测试。

下面的参数测试是一些最常用的测试测试假说关于比率数据。

目的 样本或变量 测试 例子
均数比较 2样品 学习任务 波士顿和洛杉矶员工的平均通勤时间有区别吗?
均数比较 3个或以上样本 方差分析 北美、亚洲和欧洲员工的平均通勤时间有区别吗?
相关 两个变量 皮尔森的r 通勤时间和收入水平有什么关系?
回归 两个变量 简单线性回归 收入能预测平均通勤时间吗?

比率数据的常见问题

测量的四个层次是什么?

测量水平告诉你变量的记录有多精确。有4个等级的测量,可以从低到高的排名:

  • 名义上的数据只能进行分类。
  • 序数可以对数据进行分类和排序。
  • 时间间隔可以对数据进行分类和排序,并均匀间隔。
  • 数据可以被分类,排序,均匀间隔,并有一个自然的零。
区间数据和比值数据的区别是什么?

时间间隔而且比数据可以对两者进行分类、排序,并且相邻值之间具有相等的间距,只有比率尺度具有真正的零。

例如,摄氏度或华氏度的温度是间隔刻度,因为0不是可能的最低温度。在开尔文标度(一种比率标度)中,零表示完全缺乏热能。

离散变量和连续变量的区别是什么?

离散连续变量有两种类型定量变量

  • 离散变量表示计数(例如集合中对象的数量)。
  • 连续变量表示可测量的量(例如水量或重量)。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

班达里,P.(2022, 11月28日)。比例量表|定义,示例和数据分析。Scribbr。2023年1月3日,从//www.dandarfirm.com/statistics/ratio-data/检索

这篇文章有用吗?
Pritha班达里

普里塔拥有英语、心理学和认知神经科学方面的学术背景。作为一名跨学科研究人员,她喜欢为学生和学者撰写文章,解释棘手的研究概念。
Baidu