3.3 区间估计_管理统计学-QQ阅读科幻男生网

书名：管理统计学
作者名：王雪华主编
本章字数：2670字
更新时间：2025-02-26 09:35:05

3.3 区间估计

如前所述，点估计是用一个点（即一个数）去估计未知参数。顾名思义，区间估计（Interval Estimator）就是用一个区间去估计未知参数，即把未知参数值估计在某两界限之间。例如，估计明年GDP增长在7% ～8%之间，比说增长8%更容易让人们相信，因为给出7% ～8%已把可能出现的误差考虑到了。

现今最流行的一种区间估计理论是统计学家J.Neyman在20世纪30年代建立起来的，叙述如下。

设x1，x2，…，xn是来自密度f（X，θ）的样本，对给定的α（0＜α＜1），如能找到两个统计量θ1（x1，x2，…，xn）及θ2（x1，x2，…，xn），使

P{θ1（x1，x2，…，xn）≤θ≤θ2（x1，x2，…，xn）} =1-α

则称1-α是置信度，置信度也称为置信概率，[θ1（x1，x2，…，xn），θ2（x1，x2，…，xn）]是置信度为1-α的θ的置信区间，α称为显著性水平（Significance Level），如图3-8所示。

图3-8 区间示意图

这里需要指出的是，区间[θ1（x1，x2，…，xn），θ2（x1，x2，…，xn）]是随机区间，不同的样本观测值会得到不同的区间。对于置信区间和置信度，可以用频率来说明。如果[θ1（x1，x2，…，xn），θ2（x1，x2，…，xn）]是置信度为0.95的置信区间，只要反复从f（x，θ）中取样k次，通过每次所取样本求得相应的置信区间[θ1（x1，x2，…，xn），θ2（x1，x2，…，xn）]，从而得到k个区间，且这些区间 [θ1，θ2] 不尽相同。有的包含真值θ，有的并不包含θ，包含θ的区间出现的频率应在0.95附近波动。

置信区间表达了区间估计的精确度，置信概率表达了区间估计的可靠性，它是区间估计的可靠概率，而显著性水平表达了区间估计的不可靠的概率。例如，α=0.01或1%，是说总体指标在置信区间内，平均100次有1次会产生错误。

当然，在进行区间估计时，必须同时考虑置信概率与置信区间两个方面，即置信概率定得越大（即估计的可靠性越大），则置信区间相应也越大（即估计精确性越小）。所以，可靠性与精确性要结合具体问题、具体要求来全面考虑。

区间估计的特点是它并不是指出被估计参数的确定数值，而是指出被估计参数的可能范围，同时对参数落在这一范围内给定相应的概率保证程度。正如前面已经指出的那样，参数的可能范围是估计的准确性问题，而相应的概率保证程度（置信度）是估计的可靠性问题。在做估计时常常希望准确性尽可能提高，而且可靠性也不能小，但是这两个要求是矛盾的。在样本容量不变的条件下，要缩小估计区间，提高估计准确性，势必减少置信度，降低统计的可靠性。

3.3.1 总体方差σ2已知时，总体均值μ的估计

当X～N（μ，σ2）时，可以证明取自该总体的简单随机样本x1，x2，…，xn的样本均值x服从数学期望为μ、方差为σ2/n的正态分布，即，所以当σ2已知时，建立置信区间所用的统计量是服从正态分布的统计量，即

根据区间估计的定义，在1-α置信度下

即

从而有

即在1-α置信度下，μ的置信区间为

置信区间的宽度为

【例3-6】已知某零件的直径服从正态分布，从该批产品中随机抽取10件，测得平均直径为202.5mm，已知总体标准差σ =2.5mm，试建立该种零件平均直径的置信区间，给定置信度为0.95。

解：已知X～N（μ，σ2），=202.5mm，n=10，1-α=0.95，查标准正态分布表得μα/2 =1.96，所以在1-α置信度下，μ的置信区间为

即，计算结果为 [200.95，204.05]。

当总体为非正态总体时，根据中心极限定理可以证明，当样本容量n足够大时，样本均值X近似服从数学期望为μ、方差为σ2/n的正态分布。经验表明，n≥30，可近似认为样本容量足够大。

3.3.2 总体方差σ2未知时，总体均值μ的估计

①n≥30时，通常用样本方差S2来估计。用S2代替σ2建立置信区间，只须将其中的σ用S近似代替即可。

② n＜30时，有

所以

P（t≤tα/2（n-1））=1-α

即

所以

即在1-α置信度下，μ的置信区间为。

【例3-7】某大学从该校学生中随机抽取100人，调查到他们平均每人每天完成作业的时间为120分钟，样本标准差为30分钟，试以95%的置信水平估计该校学生平均每天完成作业的时间。

解：根据题意可知

且

1-α=0.95 μα/2=1.96

故在95%的置信度下，μ的置信区间为，即[120-1.96×30/10，120 +1.96×30/10]，计算结果为[114.12，125.88]。

【例3-8】已知某种灯泡的寿命服从正态分布，现从一批灯泡中随机抽取16只，测得其使用寿命（小时）如下：

建立该批灯泡平均使用寿命95%的置信区间。

解：已知X～N（μ，S2），n=16，1-α=95%，tα/2 =2.131.根据样本数据计算得x=1490，s=24.77。总体均值μ在1-α置信水平下的置信区间为

该种灯泡平均使用寿命的置信区间为1476.8～1503.2小时。

3.3.3 总体方差的区间估计

当总体为正态分布时，

即

式中，，，所以在1-α置信度下，σ2的置信区间为

总体标准差σ的置信区间为

3.3.4 总体比率的区间估计

设总体容量为N，其中具有某种特点（性质）的元素数为M，则称p=M/N为总体的比率。

从N中抽取n个样本，其中具有某种特点的元素数为X（X=0，1，…，n），则称为样本比率。

当样本容量n足够大时（一般不少于30），，总体比率p的1-α置信水平下的置信区间为

【例3-9】某城市想要估计下岗职工中女性所占的比例，随机抽取了100个下岗职工，其中65人为女性职工。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间。

解：已知n=100，p=65%，1-α=95%，zα/2=1.96。

故该城市下岗职工中女性比例的置信区间为55.65% ～74.35%。

3.3.5 区间估计的SPSS应用

调用SPSS软件的Explore功能：可对变量进行更深入详尽的描述性统计分析，称为探索性统计。它在一般描述性统计指标的基础上，增加有关数据其他特征的文字与图形描述，显得更加细致与全面，有助于用户思考对数据进行进一步分析的方案。以例3-8灯泡寿命的区间估计为例，说明Explore功能的应用。

在数据管理窗口中，单击Analyze菜单，选择Descriptive Statistics中的Explore命令（如图3-9所示），弹出Explore对话框，如图3-10所示。由于本例只有灯泡寿命一个变量，且需要对灯泡寿命进行探索性分析，故在对话框左侧的变量列表中选灯泡寿命，单击“右侧箭头”按钮使之进入Dependent List列表框。

图3-9 Explore菜单选择

图3-10 Explore对话框

单击Statistics按钮，弹出Explore：Statistics对话框（如图3-11所示），其中有如下选项。

图3-11 Explore：Statistics对话框

Descriptives：输出均值、中位数、众数、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误差、偏度系数、偏度系数的标准误差；此处能够设置置信区间，默认为95%（即α=0.05），可根据需要进行调整。

M-estimators：做中心趋势的最大似然确定，输出4个不同权重的最大似然确定数。

Outliers：输出5个最大值与5个最小值。

Percentiles：输出第5%、10%、25%、50%、75%、90%、95%位数。

本例选中Descriptives，置信度采用默认设置为95%，单击Continue按钮返回Explore对话框。再单击OK按钮，生成如表3-3所示的数据分析结果。

表3-3 描述性统计分析结果表（Descriptives）

由该表可知，灯泡寿命的样本均值为1490，样本标准差为24.76557，在置信度为95%下灯泡寿命的置信区间为 [1476.8034，1503.1966]，即该种灯泡平均使用寿命的置信区间为1476.8034～1503.1966小时。