您现在的位置是：首页 > 科技生活 > 正文

科技生活

什么是大样本理论(为何需要大样本理论)

admin2023-02-01科技生活79

社会学研究为什么用大样本调查

一般来说，大样本和小样本相比较来说，大样本的抽样误差理论上更小些，比如调查大学生月消费，如果样本是1个，调查结果是3000元，很显然不具有什么总体推论意义，可能刚好你调查的这个学生这个月消费比较高，家庭条件比较好，你不能因此说目前大学生消费水平偏高，月消费3000元；假如样本是10000，1个学校也好，或者2个学校也好，调查下来有10000个样本的消费值，通过统计结果，平均消费水平是1100元。那么这样的大样本，如果你要推论说，某地区的大学生消费水平大致在1100元之间，这是合理的。因为样本数量大，涵盖的被调查者对象比较丰富，当然也一定存在抽样误差，但是误差就小了很多。

因此从这个意义上来说，一般如果要研究宏观性的问题，需要的样本量就要足够大。才能有理可据。

非参数统计的基本特点

非参数统计的特点　非参数统计问题中对总体分布的假定要求的条件很宽，因而针对这种问题而构造的非参数统计方法，不致因为对总体分布的假定不当而导致重大错误，所以它往往有较好的稳健性（见稳健统计），这是一个重要特点。但因为非参数统计方法需要照顾范围很广的分布，在某些情况下会导致其效率的降低。不过，近代理论证明了：一些重要的非参数统计方法，当与相应的参数方法比较时，即使在最有利于后者的情况下，效率上的损失也很小。

由于非参数统计中对分布假定要求的条件宽，因而大样本理论（见大样本统计）占据了主导地位。第二次世界大战前，非参数统计的大样本理论已有了一些结果，从20世纪50年代直到现代，更有了显著的进展，尤其是关于秩统计量与U 统计量的大样本理论，及基于这种理论的大样本非参数方法，研究成果很多。

常用的统计量有什么

1、样本矩

点矩和k阶样本中心矩，统称为样本矩。许多最常用的统计量，都可由样本矩构造。例如，样本均值（即α1）和样本方差是常用的两个统计量，前者反映总体中心位置的信息，后者反映总体分散情况。

2、次序统计量

最小次序统计量x⑴最大次序统计量x(n）称为极值，在那些如年枯水量、年最大地震级数、材料的断裂强度等的统计问题中很有用。

3、U统计量

这是W.霍夫丁于1948年引进的，它在非参数统计中有广泛的应用。其定义是：设x1,x2，…，xn，为简单样本，m为不超过n的自然数，为m元对称函数，则称为样本x1,x2，…，xn的以为核的U统计量。

4、秩统计量

把样本X1，X2，…，Xn 按大小排列为，若则称Ri为xi的秩，全部n个秩R1，R2，…，Rn构成秩统计量，它的取值总是1,2，…，n的某个排列。秩统计量是非参数统计的一个主要工具。

5、样本均值

样本均值又叫样本均数。即为样本的均值。均值是表示一组数据集中趋势的量数，是指在一组数据中所有数据之和再除以这组数据的个数。它是反映数据集中趋势的一项指标。

6、样本方差

先求出总体各单位变量值与其算术平均数的离差的平方，然后再对此变量取平均数，就叫做样本方差。样本方差用来表示一列数的变异程度。样本均值又叫样本均数。即为样本的均值。

参考资料来源：百度百科-样本均值

参考资料来源：百度百科-样本方差

参考资料来源：百度百科-统计量

大样本理论的基石是

正态分布的密度函数。正态分布密度函数公式：f(x)=exp{-(x-μ)?/2σ?}/[√(2π)σ]。计算时，先算出平均值和标准差μ、σ，代入正态分布密度函数表达式，给定x值，即可算出f值。正态分布的密度函数是大样本理论的基石。《大样本理论基础》由世界图书出版公司2010年1月出版。是美国著名作家黎曼的作品。

什么是"大样本恒星光谱"？

大样本统计方法是指研究样本大小n趋于无限时,统计量和相应的统计方法的极限性质(又称渐近性质)，并据以构造具有特定极限性质的统计方法。是一统计学术语。

恒星光谱主要取决于恒星的物理性质和化学组成。因此，恒星光谱类型的差异反映了恒星性质的差异。采用不同的分类标准，将得到不同的分类系统。最常用的恒星光谱分类系统是美国哈佛大学天文台于19世纪末提出的，称为哈佛系统。按照这个系统，恒星光谱分为O、B、A、F、G、K、M、R、S、N等类型。

恒星光谱的研究内容异常广泛，但从观测角度来看，主要有三条途径。第一是证认谱线和确定元素的丰度。第二是测量多普勒效应引起的谱线位移和变宽(见谱线的形成和致宽)，由此来研究天体的运动状态和谱线生成区。第三是测量恒星光谱中能量随波长的变化，包括连续谱能量分布、谱线轮廓和等值宽度等。这些特性同恒星大气中的温度、压力、运动、电磁过程以及辐射转移过程有关，是恒星大气理论的主要观测依据。

统计学中，如何区分大样本z和小样本t

总体标准差用大样Z。如果不知道总体标准差，只知道样本标准差就只能用t检定了，一个是总体，一个是总体中抽部分样品，30是指总体非正态情况下，抽样需超过30，才能根据中心极限法保证计算的准确性。

区别一：z检验适用于变量符合z分布的情况，而t检验适用于变量符合t分布的情况；

区别二：t分布是z分布的小样本分布，即当总体符合z分布时，从总体中抽取的小样本符合t分布，而对于符合t分布的变量，当样本量增大时，变量数据逐渐向z分布趋近；

区别三：z检验和t检验都是均值差异检验方法，但t分布逐渐逼近z分布的特点，t检验的运用要比z检验更广泛，因为大小样本时都可以用t检验，而小样本时z检验不适用。SPSS里面只有t检验，没有z检验的功能模块。

扩展资料：

在大样本方法的使用中，一般都存在此问题。但由于数学上的困难，使用的许多大样本方法中，通常很少有有效的误差估计，这是大样本方法的弱点。然而它仍有重要的理论和实际意义：

它不仅提供了一批可供选用的统计方法，而且，经验证明，当一个统计方法不具备某些基本的大样本性质（如相合性）时，常常也很难有良好的小样本性质。评价一个统计方法的优良性时，大样本性质是不可忽视的。

参考资料来源：百度百科-大样本统计

发表评论

评论列表

这篇文章还没有收到评论，赶紧来抢沙发吧~

冥王生活