系统抽样( Systematic sampling )
概念:
系统抽样也称为等距抽样、机械抽样、SYS抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。在系统抽样中,先将总体从1~N相继编号,并计算抽样距离K=N/n。式中N为总体单位总数,n为样本容量。然后在1~K中抽一随机数k1,作为样本的第一个单位,接着取k1+K,k1+2K……,直至抽够n个单位为止。
分类:
根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。
按照具体实施等距抽样的作法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。
系统抽样分为间隔定时法、间隔定量法、分部比例法。
特征:
等距抽样的特点是:抽出的单位在总体中是均匀分布的,且抽取样本可少于纯随机抽样。
要求:
等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。
等距抽样要防止周期性偏差,因为它会降低样本的代表性。例如,军队人员名单通常按班排列,10人一班,班长排第 1名,若抽样距离也取10时,则样本或全由士兵组成或全由班长组成。
优缺点:
等距抽样方式相对于简单随机抽样方式最主要的优势就是经济性。等距抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少。使用等距抽样方式最大的缺陷在于总体单位的排列上。一些总体单位数可能包含隐蔽的形态或者是“不合格样本”,调查者可能疏忽,把它们抽选为样本。由此可见,只要抽样者对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。
调查应用:
在定量抽样调查中,等距抽样常常代替简单随机抽样。由于该抽样方法简单实用,所以应用普遍。等距抽样得到的样本几乎与简单随机抽样得到的样本是相同的。
等距抽样的基本做法是,将总体中的各单元先按一定的顺序排列、编号,然后决定一个间隔,并在此间隔基础上选择被调查的单位个体。
样本距离可通过下面公式确定:样本距离 = 总体单位数∕样本单位数
例如,你使用本地电话本并确定样本距离为 100 ,那么 100 个中取 1 个组成样本。这个公式保证了整个列表的完整性。
等距抽样方式随意用一个起点,例如,如果你把一本电话本作为抽样框,必须随意取出一个号码决定从该页开始翻阅。假设从第 5 页开始,在该页上再另选一个数决定从该行开始。假定从第 3 行开始,这就决定了开始的位置。
方法:当总体单位的顺序排列之后,可选用下列方法进行等距抽样。
(1)随机起点等距抽样
即在总体分成K段(K=N/n)的前提下,首先从第一段的1至k号总体单位中随机抽选一个样本单位,然后每隔k个单位抽取一个样本单位,直到抽足n个单位为止。这n个单位就构成了一个随机起点的等距样本。这种方法能够保证各个总体单位具有相同的概率被抽到,但是,如果随机起点单位处于每一段的低端或高端,就会导致往后的单位都会处于相应段的低端或高端,从而使抽样出现偏低或偏高的系统误差。
(2)半距起点等距随机抽样
这种方法又称为中点法抽取样本,它是在总体的第一段,取1,2,…,k号中的中间项为起点,然后再每隔k个单位抽取一个样本单位,直到抽足n个样本单位为止。当总体是按有关标志的大小顺序排列时,采用中点法抽取样本,可提高整个样本对总体的代表性。
(3)随机起点对称等距抽样
这种方法是在总体第一段随机抽到第i个单位,而在第二段抽取第2k-f+1的单位,在第三段抽取第2k+f的单位,而在第四段抽取第4k-f+1的单位…,以此交替对称进行。可概括为:在总体奇数段抽取第jk+i单位(j=0,2,4…);在总体偶数段抽取第jk-i+1单位(j=2,4…)。这种抽样方法能使处于低端的样本单位与另一段处于高端的样本单位相互搭配,从而抵消或避免抽样中的系统误差。
(4)循环等距抽样
当N为有限总体而且不能被n所整除,亦即k不是一个整数时,可将总体各单位按顺序排成首尾相接的循环圆形,用N/n确定抽样间隔k,k可以取最接近的整数,然后在第一段的1至后号中抽取一个作为随机起点,再每隔后个单位抽取一个样本单位,直至抽满行个为止。
排序方法:采用等距抽样时,必须首先对总体单位按某种标志进行排序,有下列两种排序方法。
(1)按无关标志排序
即总体单位排列的顺序和所要研究的标志是无关的。如调查职工的收入水平,可按姓氏笔划排列的职工名单进行抽样;工业生产质量检验可按产品生产的时间顺序进行等距抽样等等。一般认为,按无关标志排队的等距抽样是一种抽签法,随机数表法更好的纯随机抽样方式,又称无序系统抽样。
(2)按有关标志排序
即总体单位排列的顺序与所要研究的标志是有直接关系的。例如,农产量抽样调查时,可按照当年估产或前几年的平均实产由低到高或由高到低的顺序进行抽样。这种按有关标志排队的等距抽样又称有序系统抽样,它能使标志值高低不同的单位,均有可能选入样本,从而提高样本的代表性,减小抽样误差。一般认为有序系统抽样比等比例分层抽样能使样本更均匀地分布在总体中,抽样误差也更小。