比例量表|定义,示例和数据分析
一个比率量表是一种定量刻度,其中有一个真零和相邻点之间的等距。与区间尺度不同,比率尺度上的零意味着完全没有变量你在测量。
长度、面积和人口是比率量表的例子。
测量水平
比率等级是四个等级中最高的测量水平。测量的级别或尺度表示数据记录的精确程度。级别越高,测量就越复杂。
比率级别包含其他3个级别的所有特性。在比率级别,值可以被分类、排序、具有相等的间隔并具有真正的零。
而名义上的而且序数变量是分类变量,时间间隔比率变量是定量变量。定量数据比分类数据可以进行更多的统计检验。
什么是真正的零?
在比率尺度上,零意味着完全没有兴趣变量。例如,一个家庭中孩子的数量或工作经验的年数是比例变量:受访者可以没有孩子,也可以没有工作经验。
与一个真正的零在你的比例尺中,你可以计算值的比率。例如,你可以说一个家庭中4个孩子是2个孩子的两倍。同样,8年是4年经验的两倍。
有些变量,如温度,可以用不同的尺度来测量。摄氏度和华氏度是间隔标度,开尔文是比例标度。
在所有3个尺度中,相邻点之间都有相等的间隔。然而,与摄氏温标和华氏温标不同的是,零度只是另一个温度值,开尔文温标有一个真正的零度(0 K),没有什么比这更冷了。
这意味着你只能计算开尔文标度下温度的比值。虽然40°是20°的两倍,但在摄氏度或华氏度上,它并不是前者的两倍。然而,在开氏温标中,40k的温度是20k的两倍,因为在这个温标的起点有一个真正的零。
一个真正的零使乘、除或平方根值成为可能。收集数据比率级别总是比其他级别更可取,因为它是最精确的。
比率量表的例子
许多变量在自然科学和社会科学中使用比率量表来衡量。
和区间变量一样,比率变量也可以离散或连续的。
一个离散变量只能用可数数字(如整数)表示,而a连续变量可以有无限多的值。
比例变量 | 离散的还是连续的? |
---|---|
过去10年拥有的车辆数量 | 离散 |
一个家庭的人数 | 离散 |
有宗教信仰的学生人数 | 离散 |
计算机任务中的反应时间 | 连续 |
工作经验 | 连续 |
以英里每小时为单位的速度 | 连续 |
以下是学生们喜欢Scribbr校对服务的原因
比率数据分析
收集了比率数据之后,可以进行收集描述性的而且推论统计。几乎所有的统计测试可以在比率数据上执行,因为所有数学运算都是允许的。
为了总结您的数据,您可以收集以下描述性统计数据:
分布
您可以大致了解表中不同值的频率,并在图形中可视化它们的分布。
通勤时间(分钟) | 频率 |
1 - 10 | 3. |
---|---|
11 - 20 | 1 |
21 - 30 | 9 |
31 - 40 | 19 |
41 - 50 | 13 |
51 - 60 | 3. |
61 - 70 | 2 |
71 - 80 | 1 |
集中趋势
从图表中,您可以看到您的数据是相当正态分布的。由于不存在倾斜,为了找到您的大多数值所在的位置,您可以使用所有3种常见的度量集中趋势:众数、中位数和平均值。
当你拥有正态分布的定量数据时,平均值通常被认为是集中趋势的最佳度量。这是因为它使用数据集中的每一个值进行计算,而不像众数或中位数。
可变性
极差、标准差和方差描述如何传播你的数据是。极差是最容易计算的;标准差和方差更复杂,但信息量也更大。
变异系数是一种仅适用于比率变量的扩散度量。
统计测试
现在您已经对数据有了概览,可以选择适当的数据测试用于统计推断。对于正态分布的比率数据,参数检验是检验假设的最佳方法。
参数检验比非参数检验更强大,可以让您对数据做出更有力的结论。但是,您的数据必须满足几个条件需求用于应用参数测试。
下面的参数测试是一些最常用的测试测试假说关于比率数据。
目的 | 样本或变量 | 测试 | 例子 |
均数比较 | 2样品 | 学习任务 | 波士顿和洛杉矶员工的平均通勤时间有区别吗? |
均数比较 | 3个或以上样本 | 方差分析 | 北美、亚洲和欧洲员工的平均通勤时间有区别吗? |
相关 | 两个变量 | 皮尔森的r | 通勤时间和收入水平有什么关系? |
回归 | 两个变量 | 简单线性回归 | 收入能预测平均通勤时间吗? |
比率数据的常见问题
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。