第五章 统计估计和假设检验
统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。
统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。
假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验;另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。
第一节 点估计
一、点估计的极大似然法
点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。
极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。
例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?
记
A
=“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有
X=0
与
X=1
两种情形,于是,可得事件
A发生的概率为:
P(A)=
其中:是这批产品的次品率。
若次品率=0.1,则P(A)=×0.1=0.0229
若次品率=0.4,则P(A)=×0.4=0.0003。
现在事件A
既然在一次观察中就发生了,直观地我们可以认为事件A发生的概率P(A)不会小,故应选择使P(A)较大的次品率作为产品的次品率的估计更为可靠些。
由于0.0229>0.0003,故应选择0.1作为产品的次品率比选择0.4更可靠些。
把上例推广到一般的情形,我们就可以得到极大似然法的一般原理。设是取自密度函数为f(x,)的总体的一组样本。其中:x和都为参数,待估计。的极大似然估计的基本思路是,若记A
=“一次观察中,所得一组样本的样本值为()”。现在在一次观察中A发生了,即P(A)应尽可能地大,即应在所有可能取值的集合中选出一个使P(A)达到最大值的作为的估计值。此时的又称为的极大似然估计值。由于
相互独立,且都与X具有相同的分布,由此可以得到,P(A)就相当于事件:
同时发生的概率,也就是P(A)=,记为L()=L(),于是有:
L()=
L()称为的似然函数。求极大似然值的问题就是求似然函数L()的最大值问题,根据微分学的结果,L()取到最大值的必要条件是它对的导数为零。因为ln
L()与L()取得极大值的点相同,为计算方便,我们通常就用对数似然方程来求解最大似然估计值。
在我们上述例子中,f(1,)=,f(0,)=1-,于是得到似然函数:
L()=
令=0,舍去=1,得的最大似然估计值=0.067。
实际上,正是在15次抽样中得到一次次品的频率,用频率估计概率,当n充分大时无疑是合理的。
例5-2。从一个正态总体中抽取容量为n的样本,求总体参数的极大似然估计。
解:构造似然函数
为了求和,使ln的极大,令
解上述方程得到:
所以得到和的极大似然估计量为:
二、估计量好坏的评选标准
前面讨论了如何利用极大似然法来求参数的估计量。但对于同一个参数可以用不同的方法来求其估计量,于是,在参数估计中就存在怎样选择一个比较好的统计量来推断总体参数的理论问题。那么,什么样的估计量是好的估计量呢。这就有一个如何对估计进行评价的问题。请看下面一个例子。
例5-3。假如某一建设单位购进了一批建筑用的线材,就需要了解这批线材的平均抗拉强度是多少。现在要通过抽样,选择样本的某个函数(统计量)来推断总体指标值。由于随机原因,每次抽取样本的测量结果是不同的。如果样本容量为3,抽取4组样本,测得结果如表5-1所示。
表5-1
一组抽样样本的观察值
样本值
样本顺序
均值
900
999
1011
970
995
1050
1105
1065
1010
941
890
947
950
910
1140
1000
为了说明的方便起见,我们假定,实际上μ=1000公斤,当然这在事先是不知道的。我们要求利用样本信息来推断总体指标,并使其误差最小。第一组样本的中位数最接近总体指标,第二组样本是最小值最接近总体指标,第三组样本是最大值最接近总体指标,第四组样本是均值刚好等于总体指标。于是就产生了一个问题,在大量的实验中,究竟采用哪一个指标来推断总体指标更合理呢?
评价点估计的结果通常有无偏性、有效性和一致性等标准。
1.无偏性
无偏性的含义是个别样本由于随机原因可能偏大或偏小,然而一个好的估计量从平均上看应该等于所估计的那个指标,其直观意义是估计量的值应在参数的真值周围摆动而无系统误差。一般地,无偏性的定义为:设为被估计参数,若有估计量(),对一切n,有=,则称为的无偏估计量。
若-=b,则称b为估计量的偏差。若b≠0,则称为的有偏估计量。如果,则称为的渐近无偏估计量。
不论是重复抽样或不重复抽样,也不论样本容量大小,样本均值及样本比例都是总体均值和总体比例的无偏估计,即,但样本方差并不是总体方差的无偏估计量。这是因为如果我们把定义为
=,则:
产生偏差的原因是总体方差的无偏估计应该是,但抽样时由于μ是未知的,因而用估计量来代替。根据最小平方原理,变量X距样本均值的离差平方和为最小,因此就小于,从而用代替μ计算的方差就低估了,为了得到的无偏估计,令
这时,由于,就是的无偏估计了。
样本方差与之差称为偏差。但当n很大时,所以它是渐近无偏差估计。当样本容量很大时,也可以直接用样本方差作为总体方差的估计值。但如样本容量较小时偏差就比较大了。
图5-1
估计的无偏性和有效性
2.有效性
即使是符合无偏性要求的估计统计量,在抽取个别样本时也会产生误差。为了使误差尽量地小,要求估计量围绕其真值的变动愈小愈好,也就是说要求统计量的离散程度要小,或者说其方差要小。一般地,有效性的定义为:设、是未知参数的两个估计量,若对任意的正常数c,有,则称比有效。有效性反映了估计量分布的集中程度,估计量的分布越是集中在参数真值附近,则其估计效率越高,如图5-1所示。
但是为了方便起见,在实际上有效性可定义为:、是未知参数的两个无偏估计量,若用V(),V()分别表示各自的方差,若V()/V()<1,则称比有效。
例如,对正态总体,利用样本均值及样本中位数M来估计总体的均值时,均为无偏估计,那末哪一个更有效呢?
均值的抽样分布为,统计上可以证明中位数的分布为,由于。这就说明比有效,即用样本均值来估计总体的均值比用中位数来估计总体的均值效率高。换句话说,用中位数来估计总体均值的平均误差要比用样本均值来估计总体均值时的更大。如果用中位数作为估计量要达到与以样本均值作为估计量同样可靠的程度,就要增加样本。设用均值估计的样本为,中位数估计的样本为,设其估计效率相等,即方差相等,则,由此得到=1.57,即用中位数估计时要比用样本均值来估计时多抽57%的样本单位。
3.一致性
这就是要使统计量随样本容量n的增加,不断趋近于总体指标。在n→∞(有限总体n→N)时,估计值与总体参数完全一致。一般地,点估计的一致性定义如下:设
()为未知参数的估计量,若依概率收敛于,则为的一致估计量。
现在来看样本均值这一统计量是否符合一致性的要求。根据切比雪夫等式:
令
当时
一致性是从极限意义上来说明统计量与总体参数关系的。这种性质只有当样本容量很大时才起作用。另外,符合一致性的统计量也不止一个,因此,仅考虑一致性是不够的。事实上,我们也可以证明,当总体为正态分布时,中位数这一统计量也符合一致性的要求。而样本的最小值和最大值尽管在个别的抽样中可能取得好的效果,但从总体上来看并不是一个好的估计量。
第二节 区间估计
一、区间估计的概念和步骤
点估计用一个确定的值去估计未知的参数,具有较大的风险。因为估计量来自于一个随机抽取的样本,结果也就带有随机性。样本估计量刚好等于所估计的总体参数的可能性极小。但是如果说所估计的总体参数就落在估计值附近,即所估计的总体参数就落在以点估计所得到的估计值为中心的某一个小区间内,那就比较有把握了。这种方法就是区间估计法。
在第四章中我们已经知道,一个足够大样本的均值的抽样分布是正态的,并且所抽到的样本均值落在总体均值的两侧范围内的概率是0.683,落在总体均值范围内的概率是0.955,落在总体均值范围内的概率是0.997等等。由此可见,我们可以按照概率来估计总体均值是落在某一区间范围内的。我们把这种对总体均值的估计称作区间估计。从上述说明可以看到:
1.如果所估计的区间越大,参数被包含在该区间内的概率就越大。
2.如果样本的方差越小,则在相同的概率下区间估计所得到的结果就越短。
一般地,设为总体的一个未知参数,分别为由一组样本所确定的对的两个估计量,对于给定的,若P()=,则称区间[]为置信度是的置信区间。分别为置信区间的下限和上限。称为置信度或置信概率,表示区间估计的可靠度。称为置信度水平。
常用的置信度有 0.80,0.90,0.95 0.99等。一般来说,对于估计要求比较精确的问题,置信程度也要求高一些,在社会经济现象中,通常采用95%就可以了。置信度反过来也表示可能犯错误的概率。如置信度为95%,则犯错误的概率就为1-95%=5%。这一概率也就是置信度水平,也可理解为风险率或风险水平。
图5-2
根据不同样本所得到的置信度为95.5%的置信区间
需要指出的是,P()=不应理解为落在某一固定区间的概率。因为这里是一个参数,而不是随机变量,而是根据抽样的结果计算出来的,因此,[]是一个随机区间。即每一个样本都可产生一个估计区间[],因此,上述概率可以理解为随机区间[]中包括参数的概率。
图5-2表示根据不同样本所得到的置信度为95.5%的置信区间与总体均值的位置关系。从所有样本得到的置信区间中有95.5%的区间将包括总体均值,因此可以说所得到的估计区间包括总体均值具有95.5%的置信度。
二、单个总体参数的区间估计
(一)正态总体,方差已知,总体均值的区间估计
根据第四章关于样本均值分布的结果,有
~N(0,1)
在给定了估计置信度为时,我们有
我们可以根据这一原理用样本均值来推断总体均值的区间估计值。若样本的均值为,同时若规定置信度为,则总体均值的区间估计的公式是
这一置信区间的估计可以用图5-3来表示。
上述估计公式仅适用于无限总体的情形,对于有限总体的不放回抽样来说,如果总体规模为N,样本大小为n,则区间估计的公式中还需要乘上一个修正系数。因此,总体均值的区间估计的公式就变为
图5-3
置信度为的置信区间
从上述说明中我们可以总结出对于正态总体,方差已知,总体均值的区间估计的步骤如下:
1.计算出样本的统计量并确定该统计量的抽样分布。例如,若总体是正态的,那么样本均值也必然服从正态分布。
2.根据研究的目的确定置信度或置信度水平大小。按照要求的置信度或置信度水平查出相应的系数。
3.计算样本均方差,即抽样的标准误。
4.最后把上述数据代入公式,得到区间估计的结果。
其实,这些步骤也同样适用于其他类型的区间估计问题。
(二)非正态总体,方差未知,大样本,总体均值的区间估计
实际中所遇到的总体,往往不一定服从正态分布,而且总体方差也是未知的。在这种情况下要推断总体均值,就要借助于中心极限定理,这需要抽取足够大的样本。这样样本均值仍服从正态分布。此时尽管总体方差未知,但当样本足够大时,一般当时,我们可用样本标准差来代替总体标准差,直接把S代入上式中的就可以了。
(三)正态总体、方差未知,用小样本对总体均值的区间估计
在总体方差未知的情况下,如果抽取的样本就必须采用其他的估计办法。我们已知服从t分布,其自由度为n-1。因此我们就可以利用t分布来进行估计。此时
与前面同样地,上述估计公式仅适用于无限总体的情形,对于有限总体来说,如果总体规模为N,样本大小为n,不放回抽样的情形,则区间估计公式中也还需要乘上一个修正系数。
(四)总体比例的区间估计
根据第四章关于样本比例分布的结果,我们有
若样本的比例为,同时规定估计的置信度为,则总体比例的区间估计的公式就是
这里有一个问题,就是在确定总体比例的置信区间时要用到本身,而又恰恰是待估值。但由点估计理论我们知道,样本比例是总体比例P的无偏估计,于是在估计样本比例的方差时,直接用样本比例代替总体比例P。只要样本容量n足够大,并且满足和都大于5就可以保证结果是可靠的。最后,得到总体比例的置信区间为:
当然对于有限总体不放回抽样的情形,也同样需要乘上一个修正系数。
(五)正态总体方差的区间估计
在第四章关于分布的结果中我们介绍过,来自正态总体的一组样本的方差和总体方差之比服从于分布,即
~
于是对于给定的置信度,我们可以利用分布的特性,查表得到和,则有
于是总体方差的区间估计为
三、两个总体参数的区间估计
(一)两总体均值之差的区间估计
1.两个正态总体,方差已知,大样本
从两个总体中所抽取的样本都是大样本,并且两个总体的方差已知时,则两个样本均值之差也服从正态分布。此时,因此。
由此可以得到,在置信度水平为的情况下,的置信区间为
2.两正态总体,方差未知,但相等,大样本
两个样本都为大样本时,两样本均值之差也服从正态分布,由于假设两总体方差相等,但未知,需要根据样本方差进行估计。由于样本方差具有随机性,一般地,因此,合并推算总体方差,所以,两个样本均值之差的抽样分布的方差为,于是,对两总体均值之差估计的置信区间为。
3.两正态总体,方差未知但相等,小样本
根据上一章的结果,总体方差未知时,我们用样本的方差代替总体的方差,由于小样本,相应的统计量不再服从正态分布而服从t分布。由于,则如大样本时一样,应将两个样本合并起来代替总体方差。即
其自由度为,则两总体差的区间估计结果为。
(二)两总体比例之差的区间估计
根据两个样本比例之差的抽样分布,两个样本比例之差的均值为两个总体比例之差。两个样本比例之差的方差为
当两个比例的样本容量为大样本时,两个比例之差也服从正态分布,所以当置信度为时,两总体比例之差的置信区间为:
(三)两正态总体方差比的区间估计
根据第四章所介绍的F分布的结果,来自于两个正态分布总体的总体方差和样本方差和,和所构成的统计量
故对于给定的置信度水平,我们可以从F分布表查得置信区间的临界值:
和
从而
于是
最后我们得到的置信度为1-的置信区间为
第三节
样本容量的确定
在区间估计中我们发现,对于某一个总体的参数进行估计时,在样本数目一定的条件下,要提高估计结果的可靠性,就需要扩大置信区间,这就要增加估计中的误差,减少了估计的实际意义。如果要减少估计的误差,就要缩短置信区间,但这样就必须要降低估计的可靠性。可见在样本数目一定的条件下,估计的精确性和估计的可靠性不能两全其美。既要提高估计的精确性,减少误差,又要提高估计可靠性的办法就是增加样本容量。但是增加样本就要同时增加抽样调查的成本,同时又可能延误时间。因此就需要研究能够满足对估计的可靠性和精确性要求的最小样本数问题。
一、均值估计问题中,样本大小的决定
在总体均值的估计问题中,要决定必要的样本大小,必须先明确如下三个问题:
1.要规定允许的估计误差的大小,即允许的估计值与实际值之间的最大偏离值是多少,实际上也就是估计区间的大小,
2.规定置信度,即估计所要求达到的可靠性,也就是实际的抽样误差不超过所规定的误差的可信度。
3.要明确总体的标准差,即要求了解总体的分布情况。总体的标准差小,只要抽较少的样本就能满足对估计精确度和可靠性的要求,若总体标准差大,就必须抽取较多的样本才能达到对估计精确度和可靠性的要求。
设总体标准差为,样本均值的标准差为。估计的置信度为,于是可以相应地得到置信系数。于是对总体均值的估计可由下式得到:
上式中的实际上就表示估计所允许的最大误差,我们用Δ表示,于是根据上式有
则
由此只要规定了允许误差的大小Δ和总体的标准差σ,由置信度查表得到相应的,代入公式,求得满足要求的最小整数就是满足估计误差不大于Δ和置信度为的要求的最少样本数。
上述公式适用于重复抽样或无限总体不放回抽样时的情形。但对于有限总体不放回抽样的情形,公式变为如下的形式:
由此可求得满足上式要求的最小的整数为。
其中:Δ为允许最大误差,为有限总体的个体数,为置信度水平,为根据置信度水平查表得到的置信系数。
二、比例估计问题中,样本大小的决定
关于总体比例的估计问题中,要决定样本大小首先也要明确关于均值的估计问题中同样的三个问题:
1.允许误差的大小,即规定估计值与实际值的最大偏离值。
2.规定置信度,即估计所要求达到的可信度。
3.对总体比例的事先估计值,即大致的或估计的总体比例是多少。
与均值的估计问题完全平行地,我们可以得到以下的结果。
对于重复抽样或无限总体不重复(放回)抽样时的情形为
但对于有限总体不放回抽样的情形,公式变为如下的形式:
第四节 假设检验
一、假设检验的基本原理
假设总体的均值为某一个值,为了检验这一假设的正确性,我们收集样本的数据,计算出假设值与样本均值之间的差异,然后根据差异的大小来判断所作假设的正确性,这就是假设检验。直观地,我们知道差异越小,对于总体均值的假设正确的可能性就愈大。差异越大,对总体均值的假设正确的可能性就愈小。
然而在多数情况下,对总体参数的假设值与样本统计量之间的差异既不至于大到显而易见,应该拒绝假设,也不至于小到可以完全肯定,应该接受假设的程度。于是就不能简单地决定接受或拒绝所作的假设,而需要判断所作的假设在多大的程度上是正确的。于是就需要研究假设和判断假设是否正确的程度。
(一)假设检验中的假设
假设检验中通常把所要检验的假设称作原假设或零假设,记作。例如要检验总体均值μ=100这个假设是否正确,就表示为:μ=100。如果样本所提供的信息无法证明原假设成立,则我们就拒绝原假设。此时,我们只能接受另外备选的假设了,称之为备择假设,我们以表示备择假设。备择假设可以有三种形式,例如,在原假设:μ=100的条件下,备择假设可以是:
:μ100。这表示备择假设是总体的均值不等于100。或者是
:μ>100。这表示备择假设是总体的均值大于100。或者是
:μ<100。这表示备择假设是总体的均值小于100。
上述备择假设的选择与检验的要求是密切相关的。我们根据假设检验的目的要求不同又把假设检验分为双侧检验和单侧检验。
如果样本均值高于或低于假设的总体均值很显著时都拒绝原假设,我们称作双侧检验。在双侧检验时有左右两个拒绝区域。当原假设是::μ=100,备择假设是::μ100时就必须使用双侧检验。
若只有在样本的均值高于(或低于)假设的总体均值很显著时才拒绝原假设,这就称作单侧检验。单侧检验只有一个拒绝区域。若假设检验只有在样本均值高于假设的总体均值很显著时才拒绝原假设,这种假设检验称作右侧检验。此时,原假设实际上变为:μ100,备择假设为:μ>100。反之,如果只有在样本均值低于假设的总体均值很显著时才拒绝原假设,则称作左侧检验。此时,原假设实际上变为:μ100,备择假设为:μ<100。由此可见,原假设和备择假设总是排他性的。
(二)检验的显著性水平
假设检验需要确定一个是接受还是拒绝原假设的标准,这个标准就是显著性水平。所谓检验的显著性水平就表示,在假设正确的条件下落在某个界限以外的样本均值所占的百分比。具体地说,“在5%的显著性水平下检验假设”就是说,假定对总体参数所作的假设正确,那么样本均值同假设的总体均值差异过大的,在每100个样本中不应超过5个。如果样本均值与总体均值差异过大的超过这一数目就认为这个样本不可能抽自所假设的总体,所以拒绝零假设。
我们可以用图5-4来直观地解释假设检验的原理。假如设检验的显著性水平=5%,我们已知在概率密度曲线下包括在假设的均值两侧直线间的面积是95%,两边每一个尾端的面积各为2.5%。于是若样本的均值落在95%的区域内,我们就认为样本统计量与假设的总体参数的差异是不显著的。结果就接受原假设。若样本统计量落在左右尾端的各为2.5%的区域内,则差异就是显著的。我们就拒绝原假设。接受备择假设。
图5-4
假设检验的接受区域和拒绝区域
不过应该强调指出,在假设检验中“接受原假设”的意思仅仅是意味着没有充分的统计证据拒绝原假设。在假设检验中“接受原假设”的特定含义就是不拒绝原假设。但实际上,即使样本统计量落在95%的面积内,也并不能证明原假设就是正确的。因为只有在知道了总体参数的真实值与假设值完全相同才能证明假设正确。但我们无法知道总体参数的真实值。
在给定了检验的显著性水平后,我们可以根据假设来确定接受还是拒绝原假设的区域或范围。如果样本均值落在某一区域内我们就接受原假设,则就称这一区域为接受区域。如果样本均值落在某一区域内就拒绝原假设,我们就称这一区域为拒绝区域。
对于显著性水平的选择没有一个唯一的或通用的标准。实际上在任何显著性水平下检验某个假设都是可能的,但是必须注意不管选择什么样的显著性水平,都存在假设为真而被拒绝的可能性。另一方面,在检验同一个假设时,使用的显著性水平愈高,原假设为真时而被拒绝的概率也就愈高。这就需要研究假设检验中的错误,我们在以后将对此进行讨论。
二、假设检验的步骤
1.提出原假设和备择假设。原假设和备择假设必须由题意来决定。在一般情况下总是把检验的目的作为备择假设,这样可以有充分的把握拒绝原假设。
2.选择检验的显著性水平,从而确定检验的拒绝区域或临界点。表示在假设检验时当原假设为真而我们却拒绝了原假设,接受备择假设的错误概率。假设检验中还可能犯另一种错误,这将在下面讨论。
3.确定样本的统计量和分布。样本统计量又称检验统计量。不同的统计量具有不同的分布,用于检验不同的假设,要根据所检验的假设来正确地选择检验统计量。
4.计算检验统计量并由此作出决策。根据样本数据计算出检验统计量的值,如果统计量的值落在拒绝区(包括临界点)内就说明原假设与样本所反映的情形有显著的差异,应该拒绝原假设。如果统计量的值落在接受区域内,就说明原假设与样本所反映的情形的差异并不显著,应该接受原假设。
三、几种常用的假设检验
(一)平均数的假设检验
1.双侧检验
让我们研究下面的例子。
例5-4。某食品厂规定某种罐头每罐的标准重量是500克。多年的经验表明这个厂每罐重量的标准差是15克。今随机抽取了49个罐头,发现这些罐头的平均重量是506克。问在=0.05的显著性水平下能否认为这批罐头的重量符合标准的要求?
要检验这批罐头的重量是否符合标准的要求就是要检验这批样本的平均重量与标准重量之间是否具有明显的差别。因此可以列出要检验的假设为:
:μ=500
:μ500。
这是一个双侧检验问题。根据区间估计的结论可知原假设的接受区域为
由于置信度水平=0.05,=1.96。由此得到接受区域为[495.8,504.2]。但现在样本的实际均值为506,落在拒绝区域内,因此拒绝原假设接受备择假设。我们无法认为这批罐头的重量符合标准的要求,即这批罐头的重量不符合标准的要求。
当总体方差未知,样本数量又小于等于30时,检验统计量样本均值服从t分布。这就要用t分布确定原假设的接受区域和拒绝区域了。在得到接受区域后也就可以利用上面同样的方法,根据样本均值所处的位置作出判断。
2.单侧检验
再看下面的例子。
例5-5。某饮料厂规定某种纸罐包装饮料的容量不得少于500ml。今随机抽取了25个纸罐,发现这些罐头的平均重量是498
ml,标准差S=10。问在=0.05的显著性水平下能否认为这批纸罐的容重符合标准的要求?
根据问题的要求可以列出要检验的假设为:
:μ500
:μ<500
由于总体方差未知,样本容量又小于30,检验统计量服从t分布,其自由度为n-1。因此我们就必须利用t分布来进行检验。这又是一个单侧(左侧)检验问题。根据区间估计的结论可知原假设的接受区域为
根据置信度水平=0.05,查表得到。所以计算得到接受区域的临界点是496.6。现样本均值=498>496.6。可见样本均值落在原假设的接受区域内。我们接受原假设,即认为这批纸罐的容重符合标准的要求。
例5-6。某特种建材生产厂规定某种规格新型墙体材料的重量不得大于500公斤。今随机抽取了16块这种规格新型墙体材料,测得其平均重量为505公斤,标准差S=10。问在=0.05的显著性水平下能否认为这批新型墙体材料的重量符合标准的要求?
这次要检验的假设为:
:μ500
:μ>500
这次也需要利用t分布来进行检验。这是一个右侧检验问题。原假设的接受区域为
根据置信度水平=0.05,查表得到。由此可以得到原假设的接受区域临界点是504.4。现样本均值=505>504.4。可见样本均值落在原假设的拒绝区域内。我们拒绝原假设,接受备择假设,即认为这批新型墙体材料的重量不符合标准的要求。
(二)比例的假设检验
例5-7。某酒厂规定某种酒中含有的糖度应为12%,产品才能算合格。今随机抽取了100瓶这种酒,发现平均的糖度为11.3%。问在显著性水平=0.10的条件下,这批酒与合格产品对糖度的要求有无明显的差别?
问题要检验的假设为:
:μ=0.12
:μ0.12
这是比例的双侧检验问题。根据区间估计的结果,原假设的接受区域是
由于=0.10,则=1.64。计算得到原假设的接受区域是[0.114,0.126]。由于样本比例0.113<0.114,落在原假设的拒绝区域内。我们拒绝原假设,接受备择假设,即认为这批酒与合格产品对糖度的要求有明显的差别。
对于比例问题也同样可以进行单侧的假设检验。方法也几乎与总体均值的单侧检验的情形相同。
此外,参照两个总体区间估计的情形,我们也可以对两个总体均值和比例差进行假设检验,所用的方法几乎是完全同样的。
四、假设检验中的两类错误
假设检验是根据概率来进行判断的,因此有可能判断失误。在三种不同显著性水平下,例如=0.01,0.10,或0.50时,进行假设检验所得到的结果就可能是完全不同的。对于同一组样本的均值的位置,在=0.01和0.10的显著性水平下可能是接受零假设的,而在=0.50的显著性水平下拒绝零假设。可见,采用高的显著性水平不大可能接受一个不正确的零假设,但却很可能拒绝掉正确的零假设。
在假设检验中,如果原假设正确而被拒绝时,就称为犯了第一类错误,这是弃真的错误,犯第一类错误的概率记作。相反,如果原假设错误而被接受时,称作犯了第二类错误,这是取伪的错误,犯第二类错误的概率记作。表5-3表示了两者之间的关系。这两种错误是互相替补的,这就是说,在样本容量一定的情况下,要减少第一类错误的概率就不得不增加发生第二类错误的概率,反过来也一样。实际上,为了减少第一类错误的概率就要增大接受区域,减少拒绝区域。但此时由于接受区域的增大,不正确的原假设也被接受的概率也随之增大,即增加了,如图5-4所示。要减少接受不正确的原假设的概率,就要减少的值,此时不正确的零假设被接受的概率减少了,但随着拒绝区域的增大,正确的零假设被拒绝的概率就上升,即增大了,如图5-4所示,表5-2
两类错误之间的关系
接受
接受
为真
正确
弃真,第一类错误概率
α
为假
取伪,第二类错误概率β
正确
图5-5
假设检验中的两类错误
由于两类错误之间的这种替补关系,在管理上决定检验第一类错误或第二类错误的显著性水平时就要具体考察同这两类错误相联系的费用和可能造成的损失。由此来决定究竟宁可发生第一类错误,而不愿发生第二类错误,还是宁可发生第二类错误,而不愿发生第一类错误。
练习题
5-1
对某机器生产的滚动轴承随机抽取196个样本,测得直径的均值为0.826厘米,样本标准差0.042厘米,求这批轴承均值的95%与99%的置信区间。
5-2
某灯泡厂生产的灯泡的平均寿命是1120小时,现从一批新生产的灯泡中抽取8个样本,测得其平均寿命为1070小时,样本方差=(),试检验灯泡的平均寿命有无变化(=0.05和=0.01)?
5-3
设正态总体的方差为已知,问要抽取的样本容量n应为多大,才能使总体均值的置信度为0.95的置信区间的长不大于L。
5-4有人在估计总体均值时要求在置信度为99%的条件下保证样本平均数与总体均值之间的误差不超过标准差的25%。问应抽取多少样本?
5-5为降低贷款风险,某银行内部规定要求平均每笔贷款数额不能超过120万元。随着经济发展,贷款规模有增大趋势。现从一个n=144的样本测得平均贷款额为128.1万元,S=45万元,用=0.01的显著水平检验贷款的平均规模是否明显超过120万元。
5-6
正常人的脉搏平均为72次/分,今对某种疾病患者10人测得其脉搏为54
71(次/分)设患者的脉搏次数服从正态分布,试在显著性水平=0.05下检验患者与正常人在脉搏上有无显著差异?
5-7
从A市的16名学生测得其智商的平均值为107,样本标准差为10,而B市的16名学生测得智商的平均值为112,标准差为8,问在下这两组学生的智商有无显著差别?
5-8
用简单随机重复抽样方法选取样本时,如果要使抽样平均误差降低50%,则样本容量需要扩大到原来的()。(单选题)
A.2倍
B.3倍
C.4倍
D.5倍
5-9
某产品规定的标准寿命为1300小时,甲厂称其产品超过此规定。随机选取甲厂100件产品,测得均值为1345小时,已知标准差为300小时,计算得到样本均值大于等于1345的概率是0.067,则在:μ=1300,:μ>1300的情况下,有()成立。(单选题)
A.若=0.05,则接受
B.若=0.05,则接受
C.若=0.10,则接受
D.若=0.10,则拒绝
5-10下面关于假设检验的陈述正确的是()。(多选题)
A.假设检验实质上是对原假设进行检验
B.假设检验实质上是对备择假设进行检验
C.当拒绝原假设时,只能认为肯定它的根据尚不充分,而不能认为它绝对错误
D.假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确
E.当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确
5-11
某种新型建材单位面积的平均抗压力服从正态分布,均值为5000公斤,标准差为120公斤。公司每次对50块这种新型建材的样本进行检验以决定这批建材的平均抗压力是否小于5000公斤。公司规定样本均值如小于4970就算不合格,求这种规定下犯第一类错误的概率。