聚类抽样|一个简单的一步一步的指南与示例

整群抽样,研究人员将人口分成更小的小组,叫做集群.然后他们在这些簇中随机选择形成一个样本

聚类抽样是一种方法概率抽样这通常用于研究大群体,特别是那些地理分布广泛的人群。研究人员通常使用已有的单位,如学校或城市作为他们的集群。

如何聚类样本

聚类抽样最简单的形式是单段整群抽样.它包括4个关键步骤。

研究的例子
你对你所在城市所有七年级学生的平均阅读水平感兴趣。

要获得所有七年级学生的名单,并从分布在整个城市的随机样本中收集数据是非常困难的。但是,您可以很容易地获得所有学校和列表收集数据从这些的子集中。因此,您决定使用集群抽样方法

步骤1:定义用户群体

与其他形式的抽样一样,你必须首先清楚地定义你想要研究的总体。

聚类抽样的第一步是定义你感兴趣研究的总体。

人口
在你的阅读项目研究中,你的研究对象是你所在城市的所有七年级学生。

步骤2:将你的样本划分成簇

这是整个过程中最重要的部分。集群的质量以及它们在多大程度上代表更大的总体决定有效性你的结果。理想情况下,您希望您的集群满足以下条件:

  • 每个集群的种群应该尽可能多样化。你希望整个群体的每个潜在特征都能在每个聚类中表示出来。
  • 每个聚类的分布特征应与整个人口的分布特征相似。
  • 总的来说,这些集群应该覆盖整个人口。
  • 集群之间没有任何重叠(即相同的人员或单位不会出现在多个集群中)。

理想情况下,每个集群应该是整个种群的一个迷你代表。然而,在实践中,聚类往往不能完美地代表总体的特征,这就是为什么这种方法提供的统计确定性低于简单随机抽样,并且更容易研究偏见就像选择性偏差

由于集群通常是自然形成的群体,如学校、城市或家庭,因此它们往往比整个人口更具同质性。在进行研究时,您应该意识到这一点,因为这可能会影响其有效性。

聚类抽样的第二步是将总体分组成簇,理想地代表总体。

集群
你把七年级学生按学校分组。为了覆盖整个人口,你需要包括城市里的每一所学校。没有重叠,因为每个学生只上一所学校。

步骤3:随机选择集群作为示例

如果每个聚类本身是较大总体的一个迷你表示,那么从聚类中随机选择和抽样可以让您模仿简单的随机抽样,这反过来又支持结果的有效性。

相反,如果群集不具有代表性,那么随机抽样将允许您收集不同群集阵列上的数据,这仍然应该为您提供总体的概述。

聚类抽样的第三步是随机选择聚类作为样本。

样本
你给每所学校分配一个数字,并使用随机数生成器选择一个随机样本。

您可以根据您希望的样本量的大小来选择集群的数量。这反过来又基于你所期望的整个七年级人口的估计规模置信区间和置信水平,以及你的最佳猜测标准偏差(一种衡量人口中价值观分布的方法)对七年级学生阅读水平的影响。

然后使用样本容量计算器以估计所需的样本量。

步骤4:从样本中收集数据

然后进行研究,并从所选集群中的每个单元收集数据。

在单阶段聚类采样中,最后一步是从所选聚类中的每个单元收集数据。

数据收集
你测试了随机抽取的学校中每一个七年级学生的阅读水平。

多级整群抽样

多级整群抽样,而不是从所选聚类中的每个单元收集数据,而是从聚类中随机选择单个单元作为样本。

然后,您可以从这些单独的单元中收集数据-这就是所谓的双级抽样

在双阶段聚类抽样中,从选定的聚类中随机选择单元。

你也可以继续这个过程,取越来越小的随机样本,这通常被称为多级抽样

当测试整个集群不可行或成本太高时,您应该使用这种方法。

例如:多级抽样
你没有从选定学校的每个七年级学生那里收集数据,而是将样本缩小到另外两个阶段:

  1. 从每所学校,你随机选择一个七年级的班级样本。
  2. 从这些班级中,你随机选择一个学生样本。

得到的样本要小得多,因此更容易从中收集数据。

接收关于语言、结构和格式的反馈

专业编辑校对和编辑您的论文,重点:

  • 学术风格
  • 模糊的句子
  • 语法
  • 风格的一致性

请看例子

优点和缺点

整群抽样因其实用的优点而被广泛采用,但在统计效度方面存在一些缺点。

优势

  • 整群抽样是时间和成本效率高的,特别是对于在地理上分布广泛的样本,否则很难正确抽样。
  • 由于聚类抽样采用随机抽样,如果总体正确地聚类,您的研究将具有较高的可信度外部效度因为你的样本会反映更大群体的特征。

缺点

  • 内部效度没有简单的随机抽样强,特别是当您使用更多阶段的聚类时。
  • 如果你的聚类不能很好地代表整个群体,那么依赖你的样本来提供有效结果就会更加困难,而且很可能是这样有偏见的
  • 聚类抽样比其他形式的抽样要复杂得多。

关于聚类抽样的常见问题

什么是聚类抽样?

整群抽样是一个概率抽样将人口划分为集群(如区或学校),然后随机选择其中一些集群作为样本的方法。

理想情况下,每个集群都应该是整个人口的迷你代表。

聚类抽样的类型是什么?

有三种类型整群抽样:单阶段、双阶段和多阶段聚类。在所有这三种类型中,首先将总体划分为集群,然后随机选择用于样本的集群。

  • 单级抽样,您可以从所选集群中的每个单元收集数据。
  • 双级抽样,您可以从群集中选择一个随机的单位样本。
  • 多阶段抽样,重复从聚类中随机采样元素的过程,直到达到可管理的样本。
聚类抽样的优点和缺点是什么?

整群抽样是否比其他方法更节省时间和成本概率抽样方法特别是当涉及到分布在广阔地理区域的大样本时。

然而,它提供的统计确定性低于其他方法,如简单随机抽样,因为很难确保您的集群正确地表示人口作为一个整体。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

托马斯,L.(2022, 12月05日)。聚类抽样|一个简单的一步一步的指南与示例。Scribbr。2023年1月3日,从//www.dandarfirm.com/methodology/cluster-sampling/检索

这篇文章有用吗?
劳伦·托马斯。

劳伦拥有经济学和政治学学士学位,目前正在攻读经济学硕士学位。她一直在四处奔波,曾在美国和法国的五个城市生活过,她很高兴有一份随她而去的工作。
Baidu