样本容量
样本容量是指一个样本中所包含的单位数,一般用n表示,它是抽样推断中非常重要的概念。
样本容量的大小与推断估计的准确性有着直接的联系,即在总体既定的情况下,样本容量越大其统计估计量的代表性误差就越小,反之,样本容量越小其估计误差也就越大1。
基本信息
- 中文名
样本容量
- 外文名
sample size2
- 因素
精确度、同质性、财力
- 意义
一个样本中所包含的个案或单元数
- 应用学科
统计学
- 别名
样本大小
基础定义
又称“样本大小”,在一个样本中所包含的个案或单元数。一般来说,样本容量主要由精确度、同质性、财力、抽样类型、分析类别等因素决定。在抽样调查中,样本容量的确定很重要。因为样本容量太大,会造成人力、物力和财力的很大浪费;样本容量太小,会使抽样误差太大,使调查结果与实际情况相差很大,影响调查的效果3。
解释
样本容量的大小涉及到调研中所要包括的单元数。样本容量是对于你研究的总体而言的,是在抽样调查中总体的一些抽样。比如:中国人的身高值为一个总体,你随机取一百个人的身高,这一百个人的身高数据就是总体的一个样本。某一个样本中的个体的数量就是样本容量。注意:不能说样本的数量就是样本容量,因为总体中的若干个个体只组成一个样本。样本容量不需要带单位。
在假设检验里样本容量越大越好。但实际上不可能无穷大,就像研究中国人的身高不可能把所有中国人的身高全部测量一次一样3。
详细内容
相关定义
回归分析是从已经发生的经济活动的样本数据中寻找经济活动中内含的规律性,它对样本数据具有很强的依赖性。样本的容量太小会导致参数估计值的大小和符号违反经济理论和实际经验。从建模需要来讲,样本容量越大越好,但收集与整理样本数据是一件困难的工作,因此,选择合适的样本容量,既能满足模型估计的需要,又能减轻收集数据的困难,是一个重要的实际问题。
(1) 最小样本容量
所谓“最小样本容量”,即从普通最小二乘法原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限,它是:n≥k+1
其中,k为解释变量的数目。
(2) 满足基本要求的样本容量
一般经验认为,当n≥30或者至少n≥3(k+1)时,才能满足模型估计的基本要求4。
最优选择
在确定抽样方法和样本量的时候,既要考虑调查的目的、调查性质和精度要求(抽样误差)等,又要考虑实际操作的可实施性,非抽样误差的控制、经费预算等。专业调查公司在这方面会根据您的情况及调查性质,进行综合权衡,达到一个最优的样本容量的选择。
意义
合理确定样本容量的意义:
1.样本容量过大,会增加调查工作量,造成人力、物力、财力、时间的浪费;