抽样方法

抽样方法定义

A sampling plan is just a method or procedure for specifying how a sample will be taken from a population.(抽样方法只是一种指定如何从数据中抽取样本的方法或过程)

抽样方法分类

Simple random sampling 简单随机采样

Systematic random sampling系统随机采样

Stratified random sampling分层随机采样

Cluster sampling整群随机采样

简单随机抽样( Simple random sampling)

简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

by far the most common one used

特点:

简单随机抽样的特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。

抽样方法:

简单随机抽样最基本的抽样方法。分为重复抽样和不重复抽样。在重复抽样中,每次抽中的单位仍放回总体,样本中的单位可能不止一次被抽中。不重复抽样中,抽中的单位不再放回总体,样本中的单位只能抽中一次。社会调查采用不重复抽样。

简单随机抽样的具体作法有:

①抽签法。将总体的全部单位逐一作签,搅拌均匀后进行抽取。

②随机数字表法。将总体所有单位编号,然后从随机数字表中一个随机起点(任一排或一列),开始从左向右或从右向左、向上或向下抽取,直到达到所需的样本容量为止。

注意

简单随机抽样的必须有一个完整的抽样框,即总体各单位的清单。总体太大时,制作这样的抽样框工作量巨大,加之有许多情况,使总体名单根本无法得到。故在大规模社会调查中很少采用纯随机抽样。

系统随机采样(Systematic random sampling)

系统抽样是将总体的观察单位,按一定顺序号平均分成n个部分,每一部分抽取第k号观察单位组成样本,这里的k是随机确定的,其体现了系统抽样中的随机性。

优点

1)易于理解,简便易行;

2)容易得到一个按比例分配的样本;

3)一般情况下样本的观察单位在总体中分布均匀,其抽样误差小于单纯随机抽样

缺点

如果总体中观察单位按顺序有周期趋势或单调递增(减)趋势时,采用系统抽样可能产生明显的系统误差。

场景

系统抽样方法多用于观察单位具有现成且与试验无关的自然编号,同时观察单位在总体中分布均匀。

分层随机采样(Stratified random sampling)

分层抽样是先按对主要研究指标影响较大的某种特征,将总体分为若干类别(统计上称之为“层”),再从每一层内随机抽取一定数量的观察单位,合起来组成样本。其随机性体现在层内的抽样过程。

优点

1) 由于分层后增加了层内的同质性,观察指标变异减小,各层的抽样误差减小;

2) 分层抽样便于对不同层采用不同的抽样方法;

3) 分层抽样便于对各层独立进行分析。

缺点

层间变异较大,抽样误差较小;如果分层特征选择不当,层内变异较大,层间变异较小,抽样误差仍然较大,分层抽样就失去了意义。

整群随机采样 (Cluster sampling)

整群抽样是先将总体按照某种与主要研究指标无关的特征划分为K个“群”,每个群包含若干观察单位,然后再随机抽取k个“群”,由抽取的各个群的全部观察单位组成样本。其随机性主要体现在“群”的抽取过程。

优点

便于组织调查、易于质量控制和节省调查成本。

缺点

当样本含量一定时,因为样本观察单位并非广泛散布于总体中,整群抽样的抽样误差一般大于单纯随机抽样。

结论:

一般情况下,当样本含量一定,几种方法抽样误差大小的排序为:分层抽样≤系统抽样≤简单纯随机抽样≤整群抽样。

发布于 2019-04-10 20:34