抽样误差是指由于抽样的随机性而产生的样本统计量与总体参数之间的差异。影响抽样误差大小的因素主要有以下几个方面:
首先是总体的变异性。总体各单位标志值的差异程度越大,即总体的变异性越强,抽样误差就越大。这是因为在一个差异较大的总体中,抽取的样本可能不能很好地代表总体的特征。例如,在一个包含各种收入水平人群的总体中,收入的差异很大,如果抽取的样本恰好集中在高收入或低收入群体,那么由此计算出的样本均值与总体均值就可能存在较大偏差。相反,当总体各单位标志值比较接近,即总体变异性较小时,抽样误差就会相对较小。
其次是样本量的大小。在其他条件不变的情况下,样本量越大,抽样误差越小。这是因为随着样本量的增加,样本对总体的代表性就越强,样本统计量就越接近总体参数。例如,从一个班级中抽取学生来估计全班的平均成绩,如果只抽取 5 名学生,那么这 5 名学生的成绩可能会因为偶然因素而与全班平均成绩有较大差异;但如果抽取 30 名学生,样本的平均成绩就更有可能接近全班的真实平均成绩。
抽样方式也会对抽样误差产生影响。不同的抽样方式有不同的抽样误差。例如,简单随机抽样是最基本的抽样方法,它的抽样误差相对比较容易计算和控制;而分层抽样是将总体按照某些特征分成不同的层,然后从各层中独立地进行抽样,这种抽样方式可以充分利用总体的信息,在相同样本量的情况下,一般会比简单随机抽样的误差小。因为分层抽样可以保证每层都有一定数量的样本,从而更全面地反映总体的特征。
抽样的组织形式同样影响抽样误差。比如整群抽样是将总体划分为若干个群,然后以群为单位进行抽样。如果群内各单位的差异较小,而群与群之间的差异较大,那么整群抽样的误差可能会比较大。因为抽取的群可能不能很好地代表总体的情况。而系统抽样是将总体单位按一定顺序排列,然后按照固定的间隔抽取样本,它的抽样误差大小与总体单位的排列顺序有关。如果总体单位的排列存在某种周期性,而抽样间隔恰好