首页 期刊简介 最新目录 过往期刊 在线投稿 欢迎订阅 访客留言 联系我们
新版网站改版了,欢迎提出建议。
访客留言
邮箱:
留言:
  
联系我们

合作经济与科技杂志社

地址:石家庄市建设南大街21号

邮编:050011

电话:0311-86049879
友情链接
·中国知网 ·万方数据
·北京超星 ·重庆维普
经济/产业

信息类别

首页/本刊文章/第360期/市场/贸易/正文

发布时间

2008/12/31

作者

□文/曲永丽

浏览次数

4049 次

抽样调查中无回答误差分析与控制
  提要 无回答问题是影响抽样调查统计数据质量和利用效益的一个重要因素,也是非抽样误差的一个重要来源。分析抽样调查中的无回答误差并讨论控制方法具有重要的理论和现实意义。
  关键词:抽样调查;非抽样误差;无回答误差;随机化回答技术
  中图分类号:C31 文献标识码:A
  统计调查的目的是取得能准确反映客观实际状况的统计数据。但在许多时候,调查结果并不能准确地表现事实,总会有误差出现,尤其是在大规模的调查中更是如此。误差分为抽样误差和非抽样误差,前者是由于抽样的随机性导致的,可以计算,也可以通过调整样本容量或者改变抽样方式来加以改善或控制;而后者既难以计算又难以控制,成为影响调研结果可靠程度的重要原因。非抽样误差按照来源和性质不同,可以分为抽样框误差、无回答误差和计量误差。其中,无回答误差比较普遍,是影响统计数据质量和利用效益的一个重要因素。在国外,对无回答问题的研究已经比较系统,而我国在这方面的研究却尚未成熟,抽样调查实践中更是缺乏对无回答的控制手段。
  一、无回答误差及研究历程
  无回答是指在资料收集过程中,调查对象由于各种原因没有回答调查者所需的资料和信息。无回答情况一般发生在以人为调查对象的时候。无回答误差是指在调查中由于各种原因,调查人员没能够从入选样本的单元处获得所需要的信息,数据缺失从而造成估计量的偏误。它是由Bowley于1915年最先提出的,至今关于统计调查中无回答问题的理论研究大致可划分为三个阶段:第一阶段是宣传期(1915年至四十年代),有关学者开始了对无回答问题的初步研究,并强调处理无回答问题的重要性;第二阶段是专题研究期(20世纪四十年代中后期至七十年代末)。这一时期许多学者对无回答问题进行了大量的专题研究,提出了无回答处理补救的经典方法;第三阶段是迅速发展期(20世纪八十年代初至今)。这一时期涌现出了一批对回答方法理论进行系统总结的专著,并且以多重插补法为标志涌现出许多关于无回答多重插补的文献。
  二、无回答误差产生的原因及影响
  (一)无回答误差产生的原因。无回答通常发生在数据的收集阶段,其产生原因是多方面的:
  1、从社会环境方面看,中国市场经济制度的建立,导致行政手段越来越无助于调查的进行,反而可能增大无回答率。
  2、从调查设计方面看,问题设计不规范,常见的“长问卷”现象、“搭车调查”行为以及调查公司之间的恶性竞争等都导致了无回答的产生和无回答率的增加。
  3、从被调查者的角度看,由于居住条件的变化使得被调查者越来越难接触,社会环境的变化以及社会治安条件恶化导致被调查者的防备心理增强;被调查者由于客观原因无法接受调查,如生病或没有时间等。
  4、从调查者的角度看,大量聘用缺乏人际交往经验、职业道德和责任感可能差一些、吃苦耐劳精神不足的人员做兼职调查员;同时,调查组织者往往忽视对访问人员的培训,类似的访问员经验的缺乏成为无回答产生的主要原因。
  (二)无回答误差的影响。无回答产生的原因不同,对估计量的影响也不同。从动因上,无回答可分为有意识不回答和无意识不回答。有意识不回答是被调查者采取不合作的态度。例如,在调查内容中涉及敏感性问题时,被调查者不愿意作答,这时有可能出现项目无回答,甚至导致单位无回答。无意识不回答与调查内容无关。例如,被调查者不在家或正在生病,无法接受调查,由此产生单位无回答。如果无回答与调查内容有关,来自于被调查者有意识的拒绝,这种无回答就减少了样本容量,扩大了估计量的方差,同时还造成了估计量的偏差。如果无回答产生于一些客观原因,与调查内容无直接关系,这种无回答虽然会由于样本量减少而增大估计量方差,却不会带来估计量偏差。但有一种特殊情况,如果这种无意识的不回答集中于某个群体,而该群体与其他群体数量特征上有明显差异,这样的无意识不回答也会造成估计量偏差。
  三、降低无回答的措施和方法(事前预防)
  解决问题的最好方法是在问题发生之前采取措施加以预防,对调查中的无回答也是如此。导致无回答的原因是多方面的,如果调查进行前对可能产生无回答误差的原因加以认真研究,并针对性的采取预防措施,就会有效地提高调查中的回答率。针对采集数据的不同方式,在抽样调查实施过程中除了周密设计抽样方案、准确确定抽样方式方法、精心设计调查问卷或访问提纲等前期基础性工作外,还可以采取以下措施:
  (一)预防措施
  1、问卷设计具有吸引力,容易引起被调查者参与的兴趣,并注意适当的长度。
  2、优选与培训采访人员。要求采访人员具有高度的责任心,肯于吃苦,在困难的环境中发挥人的主观能动性,克服调查中的不利因素。同时,必须加强对采访人员的业务技能培训,提高他们的访谈技巧,保证采访过程的顺利进行和调查资料的质量。
  3、准确定位调查对象。如果不能明确调查对象的准确防卫,被调查者可能被遗漏,产生无回答的几率就会增加。
  4、保证问卷的送达率。在问卷调查中,造成无回答的一个原因就是被调查者没有收到问卷。可以投递发放也可以派人专门送发。
  (二)控制措施
  1、物质奖励。调查总要花费被调查者的时间和精力,适当的奖励是必要的。如入户调查中向被调查者赠送小礼品,对集体单位进行调查时许诺提供最后的调查报告或汇总结果,等等。
  2、消除疑虑。采取有助于消除被调查者担心或怀疑的控制措施,如事先通知、调查前的解释说明及雇佣与被调查者熟悉的人做调查。
  四、对存在无回答数据的调整
  虽然事先的预防措施和方法能够降低无回答误差,但是无回答现象依然可能存在。因此,还需要考虑,当无回答不可避免的出现时,采用一些方法对调查数据进行调整,以实现降低由于无回答而造成估计偏差这个目的。主要方法有再抽样调整、加权调整、相关推估法及插补调整等。其中加权调整比较典型。
  加权调整法是通过对调查中所获得的回答数据使用加权因子,达到对数据进行调整,减少由于无回答造成的估计偏倚。作为说明,设从整体N中随机抽取容量为n的样本,估计量■■=?鄱■W■■y■是无偏的,这里W■■是第i个样本单元的权数;若令?仔i为第i个单元的入样概率,在样本单元完全回答情况下,权数Wi=?仔i-1反映了第i个样本单元在估计中的作用。又设Pi为第i个单元的回答概率,P=1表示一定回答,P=0表示一定不回答,显示中Pi是一个随机变量,被调查者是否回答取决于多种因素。设回答概率期望值EP■?仔■=1=P■,即第i个单元被选中后的回答概率为Pi。在调查中由于无回答的存在,只能用n1个回答单元的信息对总体参数进行估计,因此估计量■=?鄱■W■y■就需要修整为■■=?鄱■W■■y■,其中W■■=(?仔■Pi)-1是对无回答的数据进行调整的权数。从这个意义上说,调整就是根据调查中回答单元的回答概率进行的。
  为了进行调整,需要掌握样本单元的回答概率。由于Pi未知,就需要对Pi进行合理的估计,对Pi的不同估计就形成不同的调整方法。因此,加权调整是一个概括的说法,它包括了一些不同的调整方法。其中最常用的是加权组调整。
  加权组调整是指把容量为n的样本划分为H个互不重叠的子集,把这些子集称为调整组,用下标h表示。通过划分使得组内各单位的Y值尽可能相近,并假设组内所有单位的回答概率相同。这个过程类似于对样本进行分层,因而需要足够的进行分层的辅助信息。
  加权组调整中使用的Pi的估计量,是组内经过加权的回答率。依上所述,对任何概率样本,有W■=?仔■■,这里W■是第h组中第i个样本单位的未经调整的权数,P■的估计量为:
  ■■■=■W■-■W■ (1)
  式中是第nh组中的样本容量,n1h是第h组中回答单位的个数。■■■是第h组第i个单位回答概率的估计值。于是经过加权组调整的权数为:
  W■■=W■■■■=W■•■ (2)
  显然,如果没有无回答,■■■=1,调整后和调整前的权数没有什么区别。如果存在无回答,■■■<1,则W■■>W■。可以看出,由于无回答单位无法提供信息,有关无回答单位的信息被分摊到回答单位身上;还可以看出,如果采用等概率抽样设计,即?仔■=nN对所有的h=1,2…H都成立,则Phi(2)=n1hnh。
  令△h=NhN是第h组在总体中所占的比重,则△h的估计值为:
  ■■=■ (3)
  令■■=■Y■N■为第h组中回答层的总体均值,则■■的估计值为:
  ■1h=■ (4)
  由式(2)、(3)、(4),可以得出总体均值估计为:
  ■WC=■■■■1h=■(5)
  估计量下WC表示加权组调整。
  五、结束语
  从我国调查业的三个主要领域看,市场调查由于缺乏权威性,无回答情况最严重;政府调查虽然具有较高的回答率,但由于“虚假回答”的存在可能使问题更加严重;科研性调查则因其较好的亲和力、调查内容不具商业性等原因,情况相对好一些。但是,不论是在哪一个领域,无回答率都呈现上升的趋势。而且我国对无回答问题的关注和实际调整处理方面与欧美有着巨大的差距。无回答误差是一种重要的非抽样误差,对调查数据的质量起着重要影响。由于这种现象十分普遍,对估计量的危害也比较大,所以国际上对这方面的讨论一直比较热烈,目前这种讨论仍在进行。

  (作者单位:东北财经大学统计学院)
     
参考文献:
[1]金勇进.抽样技术[M].北京:中国人民大学出版社,2003年6月257页.
[2]金勇进.调查中的非抽样误差[M].北京:中国统计出版社,2002年4月.
[3]金勇进.统计调查中的缺失数据及其补救[J].统计研究,1996年(1).
[4]钱伯海.国民经济学[M].北京:中国经济出版社,2000年10月.
 
版权所有:合作经济与科技杂志社 备案号:冀ICP备12020543号
您是本站第 25846986 位访客