植物百科网
当前位置: 首页 农业百科

中心极限定理的的原理与应用(中心极限定理的的原理与应用)

时间:2023-07-05 作者: 小编 阅读量: 2 栏目名: 农业百科

中心极限定理是在统计学中除了大数定理的另一块基石,有着极为重要的意义和广泛的应用空间,本文就以通俗的案例来讲解什么是中心极限定理,中心极限定理的数据演示以及中心极限定理的应用。中心极限定理就是随机样本的均值总是围绕在总体均值周围,且呈正太分布。

中心极限定理是在统计学中除了大数定理的另一块基石,有着极为重要的意义和广泛的应用空间,本文就以通俗的案例来讲解什么是中心极限定理,中心极限定理的数据演示以及中心极限定理的应用。

什么是中心极限定理?

中心极限定理就是随机样本的均值总是围绕在总体均值周围,且呈正太分布。

先举个栗子:

现在要统计燕山大学2015年8000名毕业生三年后的平均薪资情况,把所有的毕业生都调查一遍的话成本太高,现在我们调查25组,每组40人,一共调查1000人,然后求出每一组的平均值,中心极限定理就是说,这些均值呈正太分布,而且随着每组样本的增加,效果会更好。把这些平均值相加再求均值,这个均值就非常接近总体均值了。

其中有几个点需要注意一下:

  • 不管总体是怎样的分布,最后每组的均值还是呈正太分布
  • 样本每组要足够大,但也不需要太大,取样本的时候,一般认为,每组大于等于30个,即可让中心极限定理发挥作用。

用实际数据来演示中心极限定理

注:使用python来模拟数据,不懂的同学可以略过代码

生成数据:我们用掷骰子这一概率论中经常用到的道具来演示,用python模拟掷100000次骰子,并求总体平均值。

import numpy as np

import pandas as pd

shaizi_data=np.random.randint(1,7,100000) #生成掷骰子随机数据

print(shaizi_data.mean()) #打印平均值

print(shaizi_data.std()) #打印标准差

import matplotlib.pyplot as plt

var=np.bincount(shaizi_data) #频次统计

plt.bar([1,2,3,4,5,6],var[1:],0.5) #绘制条形图

plt.show()

平均值:3.5049 ,标准差:1.697(每次生成数据都会有细微的差别)

把生成的数据用条形图图展示出来是这样的:1~6的分布都很均匀,ok~

10万次掷骰子频数分布直方图

下面就是见证奇迹的时刻,我们要在此数据集上来验证中心极限定理:

先抽取1000组数据,每组100个样本,结果见下图:

分组均值的均值:3.498,分组均值的标准差:0.167

抽样均值的分布规律

那在不同的组数与组内样本数量的情况下,是不是都是这样的呢,下边就限定组数进行对比,每组100个样本,分别抽取50组,100组,1000组,10000组来观察数据,以下是代码实现:

for m,k in zip([50,100,1000,10000],[221,222,223,224]): #限定不同的组内样本数

n=1000

s=[]

for i in range(n):

x_=0

for i in range(m):

x=shaizi_data[int(np.random.random()*100000)]

x_=x_ x

x_=x_/m

s.append(x_)

s=np.array(s)

print(s.mean())

print(s.std())

plt.subplot(k)

plt.hist(s,40,range=[3,4],edge)

plt.show()

图见下方:

相同样本数,不同组数的抽样结果

组数 均值 标准差

50 3.518 0.173

100 3.488 0.162

1000 3.495 0.172

10000 3.490 0.171

随着组数的增多,样本均值的均值就越来越靠近总体均值,也就是说,在可以的情况下,取样的组数尽可能多,那么样本均值就越能够代表总体均值。

下边再看一下组数不变的情况下,每组内样本数量不同会发生什么变化。一共取1000组,每组数据的样本数量分别限制在50,个,100个,1000个,10000个,看效果:

不同样本数量的随机样本均值分布

每组内的样本个数 均值 标准差

50 3.493 0.240

100 3.499 0.167

1000 3.494 0.055

10000 3.492 0.017

在组数不变,组内样本越来越多的情况下,样本均值的标准差越来越小,样本均值越来越向总体均值靠拢 。

中心极限定理在实际当中的应用主要有两方面:

  1. 抽样估计:这种情况是我们不能知道我们想要研究的对象的平均值,标准差之类的统计参数。中心极限动力在理论上保证了我们可以只用抽样一部分的方法,达到研究推测对象统计参数的目的。就像上文的例子中,通过调研部分毕业生的薪资水平而推算出整体毕业生的平均薪资。
  2. 假设检验:这种情况下,是我们已知总体的分布,来计算样本的置信区间,或者规定了规定了样本空间反向计算样本容量。典型的应用场景是,计算炮弹的命中几率。

中心极限定理与大数定理的关系:

大数定理证明了样本平均值趋近于总体平均值的趋势,但是却没有量化样本平均值趋向于总计平均值的概率,而中心极限定理证明了这一点,具体的说明了,随机样本平均数与总体平均数的差值不差过一定范围的概率大小问题。

    推荐阅读
  • 空气含量中最多的气体(空气含量中最多的气体介绍)

    空气中含量最多的气体是氮气,氮气约占空气体积分数的百分比约为78%。通过实验测定,空气的成分按体积计算,氮气大约占78%、氧气占21%、稀有气体0.94%、二氧化碳0.03%、其他气体和杂质0.03%,也就是说空气中含量最多的物质是氮气。氮气化学性质很不活泼,在高温高压及催化剂条件下才能和氢气反应生成氨气;在放电的情况下才能和氧气化合生成一氧化氮;即使Ca、Mg、Sr和Ba等活泼金属也只有在加热的情形下才能与其反应。

  • 文思豆腐羹如何做好吃(文思豆腐羹用什么豆腐)

    文思豆腐是一道有名的淮扬菜,需要的就是精湛的刀工,这样做出的文思豆腐会有嫩滑的口感,打造入口即化的口感。文思豆腐羹如何做好吃文思豆腐羹材料和做法步骤一、文思豆腐羹材料准备好豆腐400克,鸡脯肉,火腿还有香菇,再有准备好生菜,冬笋,调料需要准备盐和味精。

  • 结构性存款可以买理财吗(结构性存款是存款吗)

    雪球产品就是今年年初监管向信托公司进行窗口指导,要求叫停的产品。简单的说,这是一种高风险的金融衍生品,它通过持有一定结构的金融衍生品,来实现在某一特定情况下获利。这样的投资结构就能保证我不论涨,还是跌,只要在一定幅度内都可以盈利。交易期权等金融衍生品,是非常高风险的投资。

  • 正言厉色意思(正言厉色的意思)

    下面内容希望能帮助到你,我们来一起看看吧!正言厉色意思正言厉色,汉语成语,拼音是zhènɡyánlìsè,意思是形容板着脸,神情非常严厉。出自《汉书·王莽传》。宝玉突然想出一个主意,一本正经地给她讲扬州黛山林子洞耗子精偷香芋的故事,黛玉见他正言厉色,以为真有其事,后来才发现原来是在取笑她。

  • 面谈调薪酬有什么技巧(跟老板谈调薪的技巧有哪些)

    如果你在老板心目中分量很大,一般老板都会给你加薪的。和老板谈加薪时目的一定要明确,让老板知道你只是为了加薪,而不是辞职走人。和老板谈加薪后,一定要给老板一个考虑的时间,不要咄咄逼人,逼着老板加薪。老板也要有足够的思考时间,来考虑你是否值得加薪,给你加薪后对公司有没有什么影响。不仅口头上要表示感谢,工作中要更加努力,让老板觉得给你加薪是值得的。

  • 杏花有没有香味(杏花闻起来会特别香吗)

    杏树是中国著名的观赏树木,可配植于庭前、墙隅、道路旁、水边,也可群植、片植于山坡、水畔,是春季主要的观赏树种。杏花直径2至3厘米,先于叶开放。花梗短,长1至3毫米,被短柔毛。花萼紫绿色,萼筒圆筒形,外面基部被短柔毛。萼片卵形至卵状长圆形,先端急尖或圆钝,花后反折。花瓣圆形至倒卵形,白色或带红色,具短爪。

  • 减肥减肚子的方法(怎么减肚子呢)

    减肥减肚子的方法食用健康食品:酸奶与发酵的牛奶能激活消化必须的物质,有助于改善肠道微生物系统,从而防止腹部隆起。走路、喝水、按摩:走路及喝水有利腹部扁平。

  • 新坑翡翠手镯多少钱(新坑翡翠手镯的价格)

    新坑翡翠手镯多少钱?新坑翡翠手镯多少钱翡翠手镯作为大件翡翠制品,用料特别多,只有大块、质量好的翡翠原石才能打造成手镯,因此翡翠手镯的价格都比较高,商家们拿到质量比较好的原石也尽可能打造成手镯。具体到新坑种翡翠,因为大多数新坑种翡翠透明度都不高,质地也不够细腻,因此种水一般都是以糯种或豆种为主,极少出现冰种或冰种以上的种水,这样的翡翠价格价格自然不会太高,一个品质比较好的糯种翡翠手镯大概在十万以内。

  • 宁波毛蚶做法水煮几分钟(毛蚶煮多长时间可以吃)

    宁波毛蚶做法水煮几分钟毛蚬是很多人喜欢吃的食物,不过建议大家在做之前都要先用开水煮以下。强精益气,提高精液质量,增强精子活力。适用于治疗肾阳虚所致的阳痿、腰痛、小便频数及补五脏之气不足。可治疗全身水肿,小便不利等。能软化和保护血管,有降低人体中血脂和胆固醇的作用。

  • 2022洛阳湿地公园最新名单 洛阳生态公园最新消息

    国家级湿地自然保护区河南黄河湿地国家级自然保护区,面积24000公顷。国家级湿地公园嵩县陆浑湖国家湿地公园,面积4222.39公顷伊川伊河国家湿地公园,面积1384.36公顷。