中心极限定理例题-中心极限定理习题
1人看过
中心极限定理的精髓可以概括为:随机变量和的标准化形式,在样本量趋于无穷大时,其分布收敛于标准正态分布。

设X1, X2, ..., Xn是独立同分布的随机变量序列,具有有限的期望值μ和方差σ2 > 0。记这n个随机变量的和为Sn = X1 + X2 + ... + Xn,其样本均值为X̄ = Sn/n。
则当n充分大时,以下随机变量的分布近似服从标准正态分布N(0,1):
- 和的标准化: Z = (Sn - nμ) / (√n σ)
- 均值的标准化: Z = (X̄ - μ) / (σ/√n)
这个近似关系为我们解决实际问题提供了极大的便利。我们不再需要去探究复杂的总和Sn或均值X̄的确切分布,只需知道总体的均值μ和标准差σ,就可以利用正态分布表或软件来计算与样本统计量相关的概率。
二、 定理应用的关键前提与注意事项在欢呼中心极限定理的万能之前,必须严肃审视其应用条件,这是易搜职考网在教学过程中反复强调的重点。
- 独立性: 样本观测值之间必须相互独立。
例如,时间序列数据、整群抽样数据可能不满足此条件。 - 同分布: 每个随机变量应来自同一个总体分布。如果数据来源于混合总体,则需要分别处理。
- 有限方差: 总体方差σ2必须存在且有限。对于方差无限(如某些柯西分布)的总体,中心极限定理不适用。
- 样本量足够大: “足够大”是一个相对概念。对于接近正态的总体,n=10可能就够了;对于严重偏态(如指数分布、极端的幂律分布),可能需要n>50甚至更大。当总体本身就是正态分布时,样本均值的分布是精确的正态分布,与n大小无关。
某工厂生产的零件长度服从均值为10厘米,标准差为0.2厘米的正态分布。现从产品中随机抽取36个零件。问这36个零件的平均长度在9.95厘米到10.05厘米之间的概率是多少?
解析: 本题中总体本身就是正态分布,因此无论样本量大小,样本均值X̄的分布是精确的正态分布:X̄ ~ N(μ, σ2/n) = N(10, 0.22/36) = N(10, (0.2/6)2)。
计算标准化值:
对于9.95:z1 = (9.95 - 10) / (0.2/6) = (-0.05) / (0.0333) ≈ -1.5
对于10.05:z2 = (10.05 - 10) / (0.2/6) = 0.05 / 0.0333 ≈ 1.5
查标准正态分布表,P(-1.5 < Z < 1.5) = 2 Φ(1.5) - 1 ≈ 2 0.9332 - 1 = 0.8664。
也是因为这些,概率约为86.64%。
易搜职考网提示: 此例展示了中心极限定理最理想的情形。即使总体非正态,当n=36时,我们通常也可用此法近似。
例题2:非正态总体的应用已知某社区居民每日用电量(单位:度)的分布高度右偏,其总体均值为μ=30度,标准差σ=25度。现随机调查100户居民。试问这100户居民的平均日用电量超过32度的概率大约是多少?
解析: 虽然总体分布“高度右偏”,但样本量n=100足够大,根据中心极限定理,样本均值X̄近似服从正态分布:X̄ ~ N(μ, σ2/n) = N(30, 252/100) = N(30, 2.52)。
计算标准化值:z = (32 - 30) / 2.5 = 2 / 2.5 = 0.8。
我们需要求P(X̄ > 32) ≈ P(Z > 0.8)。查表得Φ(0.8)=0.7881,故P(Z > 0.8) = 1 - 0.7881 = 0.2119。
也是因为这些,平均用电量超过32度的概率约为21.19%。
思考: 如果只调查25户(n=25),这个近似还可靠吗?由于总体高度右偏且方差较大,n=25可能偏小,近似误差会增大。此时应谨慎使用中心极限定理,或考虑采用非参数方法。
例题3:涉及“和”的概率问题一个繁忙的收费站,已知每辆车通过收费窗口的时间相互独立,且服从均值为6秒、标准差为2秒的分布(该分布未知)。现观察50辆车。问这50辆车通过窗口的总时间介于290秒到310秒之间的概率大约是多少?
解析: 设第i辆车的通过时间为Xi秒,总时间S = X1 + ... + X50。我们关心P(290 < S < 310)。
根据中心极限定理,随机变量和的标准化形式近似服从标准正态分布。这里n=50,总体均值μ=6,方差σ=2。
S的期望E(S) = nμ = 50 6 = 300秒。
S的标准差SD(S) = √n σ = √50 2 ≈ 7.071 2 = 14.142秒。
进行标准化:
对于290秒:z1 = (290 - 300) / 14.142 ≈ -0.707
对于310秒:z2 = (310 - 300) / 14.142 ≈ 0.707
查表求P(-0.707 < Z < 0.707)。由于z值介于0.70和0.71之间,可插值或取近似。Φ(0.71)≈0.7611,Φ(0.70)≈0.7580。取Φ(0.707)≈0.760。故概率约为20.760 - 1 = 0.520。
也是因为这些,总时间在290至310秒之间的概率约为52%。
例题4:二项分布的正态近似(棣莫弗-拉普拉斯定理)中心极限定理的一个重要特例是用于二项分布。设进行n次独立伯努利试验,每次成功概率为p,成功次数X ~ B(n, p)。当n较大且p不接近0或1时(通常要求np>5且n(1-p)>5),X近似服从正态分布N(np, np(1-p))。
某次资格考试,通过率稳定在40%。易搜职考网预计今年有2000名考生参加考试。试估算通过考试的人数在780人到820人之间的概率。
解析: 设通过人数为X,则X ~ B(2000, 0.4)。np=800, n(1-p)=1200,均远大于5,满足正态近似条件。X近似服从N(800, 8000.6) = N(800, 480)。标准差√480 ≈ 21.9089。
计算概率P(780 ≤ X ≤ 820)。由于用连续分布近似离散分布,通常需要进行连续性校正以提高精度。
校正后:P(779.5 < X < 820.5)。
标准化:
z1 = (779.5 - 800) / 21.9089 ≈ -0.935
z2 = (820.5 - 800) / 21.9089 ≈ 0.935
P(-0.935 < Z < 0.935) ≈ 2 Φ(0.935) - 1。查表Φ(0.94)≈0.8264,Φ(0.93)≈0.8238,取Φ(0.935)≈0.8251。故概率约为20.8251 - 1 = 0.6502。
也是因为这些,通过人数在780至820之间的概率约为65%。
四、 在现实决策与易搜职考网教学中的应用场景中心极限定理绝非象牙塔里的抽象公式,它在各行各业都有鲜活的应用。
- 质量管理: 通过定期抽取若干产品(如n=25)测量其质量指标,利用样本均值的分布来设置控制 chart 的上下限,监控生产过程是否稳定。
- 金融投资: 投资组合的日收益率可以看作许多单个资产收益的加权和。在一定条件下,组合收益的分布会趋向正态,这为风险价值(VaR)计算提供了依据。
- 社会调查与民意测验: 这是中心极限定理最经典的应用。无论选民的政治倾向分布多么复杂,1200个随机样本的赞成率(样本比例)的分布近似正态,由此可以计算抽样误差和置信区间。
例如,“某政策支持率为55%,误差范围为±3%”这样的表述,其背后正是中心极限定理在支撑。 - 易搜职考网的教学设计: 在教授《统计学》等相关课程时,我们强调“为什么”。为什么可以用样本平均工资来推断全市平均工资?为什么模拟抽样实验时,无论初始分布如何,样本均值的直方图最终都像钟形?通过动态图表和模拟程序,我们将抽象定理可视化,让学员直观理解“大数定律决定估计的准确性,中心极限定理决定估计的分布形态”,从而彻底掌握参数估计和假设检验的底层逻辑。
在学习和应用中心极限定理时,需要警惕几个常见误区:
- 误区一:认为总体本身会变成正态分布。 定理描述的是样本统计量(如均值)的分布,而非原始总体的分布。总体可以始终保持其原有形态。
- 误区二:忽视样本量的要求。 对于小样本(如n<30),尤其是来自非正态、重尾总体的样本,盲目使用正态近似可能导致严重错误。此时应考虑t分布(当总体正态时)或非参数方法。
- 误区三:混淆不同统计量的分布。 定理主要针对样本均值或和。样本方差、样本中位数的分布并不直接适用,它们有各自的极限分布。

进阶思考会引导我们探索定理的边界:如果数据不独立(如空间自相关、时间序列),有什么替代方法?如果方差无限,应该用什么稳定分布来描述?这些思考将学习者引向更广阔的统计学天地。
通过以上系统的论述和层层递进的例题展示,我们可以看到中心极限定理如何从一个抽象的数学结论,演变为解决实际问题的强大工具。从计算一个简单的概率,到支撑起大规模社会调查的科学性,其影响力无处不在。对于易搜职考网的学员来说呢,透彻理解这一定理,不仅是为了应对考试中那些关于概率计算、置信区间构建和假设检验的题目,更是为了培养一种用统计思维看待不确定世界的眼光。它告诉我们,即使个体行为充满随机性,但在大量聚合之后,一种稳健的、可预测的规律性便会浮现。掌握它,就意味着掌握了从混沌数据中抽丝剥茧、做出稳健推断的关键能力。在数据驱动的时代,这种能力无疑是职场竞争力和科学决策力的核心组成部分。
12 人看过
10 人看过
6 人看过
6 人看过



