- 市场营销研究方法与应用(第二版)
- 涂平
- 3398字
- 2025-04-13 15:58:17
5.4 概率抽样方法
概率抽样方法是采取随机的办法,排除研究人员主观因素的干扰,使样本总体中的每一个成员都有一个事先确定好的抽中概率。概率抽样的优点是由于采用随机抽样的方法,排除了主观因素对抽样的干扰,而且可以用统计学方法用样本估计值推断总体参数、计算置信区间和抽样误差。主要的概率抽样有简单随机抽样、系统抽样、分层抽样、整群抽样等。以推断总体特征为主要目的的描述性研究宜采用概率抽样的方法。
5.4.1 简单随机抽样
简单随机抽样(simple random sampling)是最基本的概率抽样方法,该抽样方法保证每一抽样单位都有相同的非零抽中概率,并给出总体参数的自加权估计值。若总体为N,样本量为n,则每一抽样单位的抽中概率p=n/N。为了抽出一个简单随机样本,需要一个完整的抽样框,其中每个个体都有一个唯一的编号,然后用计算机软件或抽签的方法随机抽取个体。
简单随机抽样的主要优点是易于理解,可以产生一个自加权的样本,其数据的统计处理和推断也相对简单,因为大多数统计估计与推断方法都是建立在简单随机抽样的基础上的。但是,简单随机抽样也有一些局限性,主要是:
·实际操作起来可能很麻烦。在很多情况下很难获得一个可以供简单随机抽样用的完整的抽样框架。
·数据收集所需的时间和成本高。如果抽样总体的分布很广,简单随机抽样可能产生一个跨越地理区域很广的非常分散的样本,因此会增加数据收集的时间和成本。
·抽样误差较大。简单随机抽样与其他概率抽样方法(例如分层抽样)相比,当样本量相同时,其抽样误差较大。
·小样本时代表性差。虽然一般来说,简单随机抽样所抽出的样本可以很好地代表总体,但是如果样本量很小,由于抽样误差大,对总体的代表性可能不佳。
由于上述原因,简单随机抽样在营销研究中应用得并不广。
5.4.2 分层抽样
分层抽样(stratified sampling)是将总体按某些重要特征分为数个子群(层),各层之间既不能重复也不能有遗漏,然后用简单随机抽样或系统抽样的办法从每层抽取一定数量的样本。表面上看,分层抽样似乎有点类似前面介绍的配额抽样。实际上分层抽样时每层中个体是随机抽取的,而不是基于便利或判断来选择。分层抽样的主要目的是提高样本的代表性和降低抽样误差,而能否达到这一目的取决于分层变量是否恰当。原则上讲,层内个体之间的差异越小而不同层之间的差异越大时,分层抽样的效果越好。当层内的个体完全一样时,每层只需抽取一个样本就能准确无误地估算出总体的参数。当然,分层变量除了要和研究的特征密切相关以外,还要易于测量和应用,从而降低分层过程的成本。在营销研究中常用的分层变量包括人口统计特征(性别、年龄、教育程度、收入、职业等),顾客的类型(个人、集团等),公司规模或者行业。与市场细分变量的选择一样,可以使用多个分层变量,但是同时应用两个以上的分层变量操作起来就比较困难了。
分层抽样还可以进一步分为按比例分层抽样(proportionate stratified sampling)和非比例分层抽样(disproportionate stratified sampling)。按比例分层抽样从每层中抽出的样本量与该层在整个总体中的相对量成比例;而非比例分层抽样从每层中抽出的样本量与该层在总体的相对量不成比例。按比例抽样时各层的抽样比例是相同的,因此可以产生一个自加权的样本。但是,为了在总样本量相同的情况下使抽样误差尽可能小,有时会采用非比例抽样,从个体差异大(或总体规模较小)的层中多抽一些样本。在市场营销中,有时也会有意识地从比较重要的层(例如重度消费者)或者能够提供更多信息的层(有经验的消费者)多抽一些样本。非比例分层抽样的另一个目的就是确保总数较少的个体(例如高收入者)在样本中也有一定的数量,这对于进行分组描述和比较很有帮助。例如,假设管理学院有600名本科生,200名普通硕士生和200名MBA学生,如果总共抽取100个学生,调查对教学的满意度,比例分层抽样的样本将包括60个本科生、20个普通硕士和20个MBA学生。为了能比较准确地估计普通硕士生和MBA学生的满意度,可能采取非比例分层抽样的方法,适当降低本科生的抽样比例,提高普通硕士生和MBA学生的抽样比例。
5.4.3 系统抽样
系统抽样(systematic sampling)是随机抽取第一个样本单位,然后每隔k个单位抽取一个。将总体所含样本单位数N除以样本量n,结果四舍五入取最接近的整数,可以确定抽样间距k。例如:总体的规模 N=10020,拟抽取的样本量n=100的样本,则抽样间距 k=10020/100=100(取最接近的整数)。然后从1到100之间随机选出一个数字r,则抽中的样本就由编号r、100+r、200+r……的个体组成。
系统抽样总体中的每个样本单位被选中的概率相等,p=1/k,通过系统抽样也可获得总体参数的自加权估计值。如果抽样框架中抽样单位的排列与拟研究的特征无关,则系统抽样将产生与简单随机抽样非常相似的结果;如果需要研究的特征与排列的顺序呈单调递增或递减的关系,系统抽样能够增加样本的代表性,有点类似前面介绍的分层抽样。
例如,按家庭收入将所有的家庭按增序或降序排列,那么系统抽样将保证高、中、低收入的家庭在样本中的比例与总体一致,而简单随机抽样却不能保证这一点,尤其是当样本量较小的时候。但是,如果个体的排列顺序呈现出一个循环的形式,则系统抽样可能会降低样本的代表性。例如,冷饮的月销售额可能呈现明显的季节性,如果用系统抽样方法从销售的历史数据中抽取样本点,每隔12个月抽一个,则抽样误差可能很大,因为抽的数据点有可能全部都是旺季或淡季,而简单随机抽样出现这种情况的可能性很小。
5.4.4 整群抽样
整群抽样(cluster sampling)将总体分为不同的群组,然后随机抽取一定数量的群组作为样本。整群抽样又可以分为:
·一级整群抽样:每个被抽中群中的所有个体都被包括进样本。
·二级整群抽样:先抽取一定数量的群,然后再从每个抽中的群中随机抽取一定比例或数量的样本。
·三级整群抽样:先抽取一定数量的群,然后从抽中的群中随机抽取一定比例或数量的子群,再从每个抽中的子群中随机抽取一定比例或数量的个体。
与提高样本代表性和降低抽样误差的分层抽样不同,整群抽样的目的是降低单个样本的成本,其抽样效率(与简单随机抽样相比,将抽样误差控制在相同水平时所需的相对样本量的倒数),取决于群内和群间差异的相对大小。进行整群抽样时,理想的情况是群内个体之间的差异尽可能大,各群之间尽可能相同。最理想的情况是各群之间完全相同(群间差异为0),这样只要抽取1个群,就可以完美地代表整个总体。
整群抽样是营销研究,尤其是涉及区域广泛的研究,常用的抽样方法。这主要有两个原因:(1)这种方法在许多情况下比其他概率抽样方法更可行。例如,要想进行一项全国性的消费者调查,通常获得完整的包括全国全部消费者名单的抽样框架是不可能的,但获得一个全国全部县市的完整名单却不难。因此,我们可以先抽县市,然后编制抽中县市的下一级抽样框架,这样就大大减少了工作量。(2)即使能够获得一个完整的包括所有最终样本单位的抽样框架,简单随机抽样、系统抽样或分层抽样产生的样本太分散,因而对于个人面访来说调查员要在全国各地到处奔波,收集数据的单位成本太高。而整群抽样所产生的样本相对集中,只要向抽中地区派遣调查员就可以了,从而大大地节约了成本。
过去由于中国的户籍制度比较完善,人口流动性小,许多调查都是以户籍登记资料作为抽样框架。改革开放之后,尤其是20世纪90年代以来,由于流动人口增加,常住人口的地址变动也更加频繁,新建居民区的不断出现,户籍管理已经严重滞后了。因此,过去以行政区划和户籍资料为基础的抽样方法已经越来越不适用,需要探索新的抽样方法。由于电子地图的逐步普及与发展,国外采用已久的区域抽样方法可以在中国的部分城市实施。
区域抽样(area sampling)就是在地图上将一个城市划分为不同的区域并依次编号,然后随机地抽取部分区域作为样本。如果对抽中区域的全部住户进行调查,则为一级区域抽样。如果在抽中区域只随机抽一部分住户作为样本,则为二级区域抽样。也可以将一个城市划分为不同区域,再将每个抽中区域进一步划分为不同小区,最后以住户为最终抽样单位,进行多级区域抽样。由此可见,区域抽样其实可以被看做是整群抽样的一种。区域抽样的关键是要有准确、详细的地图,并能够利用街道、河流和其他明显的地标划分出边界清晰的小区。
例5-3
二手房价格调查
众所周知,二手房的价格除了取决于房屋的质量以外,还和所处的位置有密切的关系。因此,在调查二手房时,适合采取区域抽样的方法,保证所抽的样本包括不同区域、不同档次的二手房。图5-3显示了上海某二手房价格调查的样本分布情况。

图5-3 上海二手房调查的样本分布
注:此图示清晰度不影响其示意性。