摘要:大数定律和中心极限定理作为概率论与数理统计课程教学中的重点和难点之一,文章基于R语言对概率论中的大数定律和中心极限定理进行随机模拟,运用图形将模拟结果直观展示出来,可以使学生能够较好地理解和掌握大数定律和中心极限定理的本质,同时能够训练学生的编程能力,增强其动手能力。
大数定律和中心极限定理[1]是概率论与数理统计中非常重要的定理之一,在概率论的基础理论与统计学的统计推断中起着一个承前启后的作用,同时也是概率论与数理统计课程教学中的一个重点和难点。大数定律表明,随机变量的算术平均值依概率收敛于其数学期望。中心极限定理表明,不论一个随机变量是离散型的还是连续型的,也不论该随机变量服从何种分布,当这种相互独立的随机变量个数增加时,其和的分布近似地服从正态分布。因此,只要随机变量的个数足够多,便可以不用考虑和式中的随机变量具体服从什么分布,而可以利用正态分布的良好性质做近似计算,这是因为正态分布有着许多完美的结论,因此这两类极限定理在诸多领域都有着重要和广泛的应用。但值得注意的是,该类定理中的相互独立条件不能忽略[2],如果不满足相互独立条件,则结论不成立。
然而,由于这两类极限定理本身比较抽象,学生在学习的过程中表示比较茫然,不清楚定理要表达的意思。另一方面,该类定理结果的多样性也使得学生容易产生厌恶情绪,从而导致其难以较好地理解定理本质,更谈不上应用其解决实际问题。鉴于此,本文利用R语言01对概率论与数理统计中最为常见的切比雪夫大数定律和独立同分布的中心极限定理(林德贝格——勒维定理)进行随机模拟,并通过图形将模拟结果直观地展示出来,从而让学生对定理所反映的内容有更为直观和深入的理解。
1、相关定理
由于切比雪夫大数定律要求随机变量序列相互独立且具有相同的期望和方差,独立同分布中心极限定理要求随机变量序列相互独立且具有共同的分布,并且具有相同的期望和方差。为了方便模拟,对这两个定理条件进行融合得到如下定理:定理1
即当n充分大时,大数定律告诉我们随机变量的算术平均值依概率收敛于其数学期望,中心极限定理告诉我们随机变量的算术平均值近似服从正态分布。
2、语言随机模拟及实现
R语言是GNU版本的s语言实现,是一款优秀的免费统计软件,它不仅提供了丰富的数据分析技术,功能十分强大,而且与其他多数统计软件相比,R的更新速度快、使用更灵活,在实际工作和科学研究的很多领域被越来越多的人们使用,现已成为数据分析软件的主流。我们首先验证大数定律:设为来自某总体的随机样本即随机变量,模拟求样本均值即随机变量的算术平均,假设总体分别服从均值为5的泊松分布、均值为10的指数分布[10,50]区间上的均匀分布,从三个总体中分别抽取样本容量为n的样本,让n从1增加到10000,分别计算这10000个不同的样本均值,然后按照先后顺序绘制线图,生成结果见图1所示。图1样本均值的渐近过程
图1形象地描绘了随着n的增大,无论是泊松分布、均匀分布,还是指数分布,其样本均值都在逐渐接近总体均值,且当n越来越大,则样本均值与总体均值的差距可以达到无限小,从而验证了大数定律的存在性。
我们再来验证中心极限定理:继续选取上述三种不同类型的分布:泊松分布、均匀分布和指数分布分别进行验证。在模拟过程中,首先给出总体分布直方图,然后从总体当中分别抽取样本容量为2、5、10、50、100、500和1000的各5000个样本,分别绘制其频率分布直方图,添加核密度估计曲线(图中红色曲线),并与相应正态分布密度曲线作比较(蓝色曲线),从图2一图4可以看出,无论总体服从何种分布,随着n的增大,样本均值的分布均逐渐趋于正态分布(图中红色曲线与蓝色曲线逐渐重合),而且分布越来越集中,这从坐标轴的取值变化情况也可以明显看到,其原因正是由于n的增大,使得样本均值的方差逐渐趋于零,这也从另外一个方面验证了大数定律的存在。图2来自泊松总体x~P(5)的样本均值分布情况图;4来自指数总体X-E(0.1)的样本均值分布情况
3、结语
大数定律和中心极限定理作为概率论与数理统计课程教学中的重点和难点之一,在教学过程中选择使用R语言随机模拟样本均值的取值和概率分布情况,可以使学生能够较好地理解和掌握大数定律和中心极限定理的本质,同时能够训练学生的编程能力,增强其动手能力。值得注意的是,统计模拟的结果并不是一成不变的,由于抽取的随机数不同,从而每次抽取的样本并不相同,所以模拟的结果具有随机性。但是无论怎样,当n充分大时,随机变量的算术平均值依概率收敛于其数学期望并近似服从正态分布的本质始终不会改变。
参考文献:
[1]魏宗舒等.概率论与数理统计教程(第二版)[M].北京:高等教育出版社,2008.
[2]张帼奋.抽样分布的若干反例[J].数学学习与研究,2019(08):9+11.
[3]侯雅文,王斌会.统计实验及R语言模拟[M].广州:暨南大学出版社,2015.
郭林祥.两类极限定理的随机模拟[J].信息通信,2019,(9):272-273.
基金项目:本文受甘肃省高等学校科研项目(批准号:2018A-070)资助。
分享:
教学不仅是传授知识,更重要的是启智,为学生多打开几扇窗;此外,数学是一个整体,概率与现实世界关系紧密,因而是可以让学生结合所学内容做一些相关性研究课题的,譬如Berkerley大学统计系DavidAldous的创新性课程ProbabilityandRealWorld就是结合现实问题以分组课题研究形式来开展的.
2021-01-21在实分析、测度论、高等概率论等课程中,示性函数处处可见,是构造简单函数,逼近一般可测函数的基石.虽然学生在学习高等数学初期就会了解的著名的Dirichlet函数就是有理数集的示性函数,但遗憾的是,在教学中,特别是在初等概率论教学中,示性函数的作用没有得到应有的充分重视.有的教材对示性函数仅作简单应用[5],有的教材则对示性函数避而不谈。
2021-01-20《概率论与数理统计》是高等学校的基础课程,难度较大,需要较强的逻辑思维能力。另外,《概率论与数理统计》这门课知识点众多,应用场景也较多,如何较好地掌握书中的定理和定义是研究的重中之重。针对《概率论与数理统计》的教学中容易出现的诸多问题,以条件概率、全概率公式和极大似然公式为例;引入了互联网公司的就业要求以增强学生的学习意识,加强定理定义分解以改善学生对定理死记硬背的现象,增添趣味案例简化学生学习定理时的难度。
2020-12-29“穿越沙漠”游戏规定为:每名玩家在游戏开始时都会收到一定数额的资金与闯关地图,分别用来购买行进过程中必要的生活用品和规划全局路线,途中经过村庄可以用来补给资源,经过矿山并采矿能获得固定资金,玩家在探险途中还可能会遇到恶劣天气。在系统指定的时间内从起点处穿越沙漠到达终点即为通过,剩余的资金与资源越丰富获得优胜的机会越大。
2020-11-27大学数学课程是指概率论与数理统计、微积分与线性代数等一类课程,在高等教育教学中占据极为重要的地位。其中概率论与数理统计由于它的知识体系、课程性质等特点,使其具有开展思政教学改革的良好基础和明显优势。因此,本文以概率论与数理统计为对象,研究如何深入有效地开展大学数学课程思政建设,探索实施路径和有效方法。
2020-09-09本文首先用K-Means聚类算法对寿险客户进行价值细分,获得不同价值类别的客户;其次建立Logistic二分类模型进行客户流失预测,并比较细分前、细分后的预测效果。本文提出的方法,可以帮助寿险公司从宏观上预测客户流失的人数,从微观上判断客户的状态,为寿险行业的客户保留提供可行建议。
2020-09-09岩性识别是地质研究过程中非常重要的基础工作,尤其是在近地表以及深部无法直接采样区的地质研究中,准确地刻画深部岩石类型及其结构关系,可以为能源矿产勘探、深部结构与构造等研究提供重要的地质信息。因此采用什么数据、什么方法来进行岩性识别是一项极具价值的研究工作。
2020-08-10骰子模型有着广泛的应用.[1,2,3,4]苏有菊和魏首柳应用列举法、生成函数方法、母函数法、组合数法给出了投掷次数为2次或3次,点数之和为7或9时概率的具体计算例子.[5,6]本文将对生成函数法展开深入探讨,给出一个结构优美的计算公式,进一步给出任意面体的推广“骰子”,在n次投掷后的点数之和为m的概率计算公式.
2020-08-10本研究使用“基于源分析的形态学测量”方法[13],利用数据驱动的自适应脑区划分方法,通过对AD患者、轻度认知障碍患者及正常对照人群的脑结构磁共振图像进行特征提取,并采用机器学习的方法对给定数据进行分类。比较本研究中获得的特征提取方式与其它基于既有脑模板的分类效力,验证其在AD、MCI、NC人群鉴别分类中的性能。寻找能反映和区分AD发展中脑结构变异的潜在的新影像学特征。
2020-07-09文中介绍了因果推论到直接效应和间接效应的相关概念,针对中介有多个的情况,引用了Baron和Kenny(1986)与TylerJ.VanderWeele和Vansteelandt.的中介模型,建立多中介变量模型,并重新定义了多中介变量模型的直接效应和间接效应的概念。利用新建立的多中介变量模型对直接效应和间接效应进行模拟研究,在估计直接效应和间接效应时,采用了不同的方法进行模拟。
2020-07-08人气:2215
人气:1617
人气:1610
人气:1482
人气:1445
我要评论
期刊名称:信息通信技术
期刊人气:652
主管单位:中国联合网络通信集团有限公司
主办单位:中国联合网络通信集团有限公司
出版地方:北京
专业分类:科技
国际刊号:1674-1285
国内刊号:11-5650/TN
创刊时间:2007年
发行周期:双月刊
期刊开本:大16开
见刊时间:10-12个月
影响因子:0.407
影响因子:0.095
影响因子:0.500
影响因子:0.497
影响因子:0.353
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!