
摘要:人们对小概率事件和微小误差存有错误的认知,会将看似精确的概率计算引入歧途。精确有时候并不意味着准确,客观事实和我们对概率的直观感受往往是存在差异的。统计学原理并不复杂,但它仍然是一项严肃的科学,需要时刻带着客观、严谨的思维去审视数据和风险,下文就当前统计学进行了阐释,强调用辨证思维解读统计学。
回归分析是一种非常强大的统计学方法,专门用来分析那些影响因素很多的复杂问题。简单来说,回归分析就是通过一个已知的现象,来找到未知的原因。它可以通过严格的数学分析,复原出每种原因对结果的贡献比例。
伦敦大学公共卫生学院曾经主持过一项著名的“白厅”研究。医学家们发现,英国政府里低级别的公务员,患上心脏病的概率比他们的上司更高,白厅研究就是要找出这背后的真实原因。这个研究显然不能用随机抽样的方法实现,因为我们不可能把志愿者强行分配到各个工作岗位工作几年,然后再看哪些人因公殉职了。研究员只能在很长一段时间里,对数千名公务员进行详细的数据采集,来比对各类导致心脏病的可能因素。
低阶公务员的学历普遍偏低,会不会是影响因素?烟民比例多呢?还是不能享受到高水平的医疗服务?或者是加班多,锻炼时间少?这些都是导致心脏病高发的变量,那么到底哪一个才具有决定性的影响呢?这么庞杂的数据里有太多错综复杂的因素,显然会干扰研究员的判断。这时候就要用到回归分析这个工具,它的作用好比一个可以调节孔径的筛子,能在综合考虑其他变量效果不变的情况下,把其中一个变量的效果分离出来。
回归分析的数学过程比较复杂,好在现在有了成熟的多元线性回归方程模型可以套用。我们要做的,就是把多个变量的取样结果代入回归方程式,计算结果就会显示出,我们关注的变量和心脏病发病率的线性关系。通过统计推断,我们就能知道这个变量到底在多大程度上影响了发病率。实验结果表明,造成心脏病高发的真正原因,是对工作缺乏控制力和话语权。而这类存在感较低的岗位,在低级别职位中更常见。现在,“低控制力”已经成了一个专有名词,专指那些精神负担重、决策水平低的工作。
事实上,当前科学界绝大多数的研究结论都是以回归分析作为基础的。尤其是回归分析软件的普及,让建立模型和解析方程变得很简单。但同时也要注意,电脑永远不能代替人的工作,如果我们在进行回归分析时遗漏了变量,或者忽视反面因素,回归分析就会得出危险的结论。
上世纪90年代,哈佛大学医学院对12万名女性开展了纵向调查,经过严格的回归分析证实,定期摄入雌激素的女性,突发心脏病的概率只有其他女性的1/3。医学机构支持了这个观点,医院开始定期为中老年妇女进行雌激素的补充治疗。然而后来的临床试验发现,补充雌激素的副作用会导致乳腺癌和血栓病高发,这是科学家们没有考虑到的重大疏漏。最终,因为接受雌激素治疗而死亡的女性患者达到上万人。你看,一旦出现变量遗漏,错误的回归分析结果甚至会杀人。
统计学原理虽然看似简单,但却不是人人都能做数据分析师。因为它既能给我们的观点找到严谨的数据支持,但有时也会给一个错误的结论,披上合理的外衣。先来说说著名的“黑天鹅事件”。通过这个例子我们可以了解,忽视那些小概率事件,会造成多么严重的后果。“黑天鹅”一般用来指那些影响很大,但难以预测的小概率事件。2008年美国次贷危机爆发前,整个北美金融行业都在使用同一个风险价值模型来预测投资风险。这个模型的强大之处在于它非常精确,它能把华尔街每家公司的资产都进行严格的概率学分析,给出预期收益和损失值。它还能把这些海量的市场信息整合成一个简洁的风险指标,提供给美联储和财政部参考。比如分析了以往的市场变动数据后,金融分析家会根据这个模型,给出某项投资在特定周期内可能让公司蒙受的损失,而这种预测可以涵盖高达99%的市场风险。
然而,这个模型有一个被忽略的致命问题,那就是它的概率学模型参照的是过去20年的市场行为,不能对未知的意外情况做出预测。所以,它预测不了“黑天鹅”的出现。这只“黑天鹅”就是2007年美国商业银行房贷业务的崩溃,虽然它发生的概率只有不到1%,但悲剧的是,它确实发生了。这直接导致了一次全球大范围的金融危机,失业率数字达到了10%,很多国家和政府都陷入了债务危机。
这就是小概率重大事件的破坏力。是概率学本身出问题了吗?显然不是,模型已经告诉了我们有1%的风险无法预测,可人们仍然选择了无视。作者认为,最大的风险从来就不是那些我们能看得见、算得出的,而是那些看上去似乎概率很小,我们认为一辈子都不可能发生的风险。它们的确会发生,而且比我们想象的要频繁得多。
除了“黑天鹅”,还有一个我们容易忽略的问题,那就是统计误差。统计学虽然有着严谨的数学计算,但它并不是完美无缺的,我们通过分析数据推断出的结论,永远不会是100%正确的。这是因为,只要数据分析建立在抽样调查之上,样本的统计结果和真实情况之间就会存在误差。虽然随着样本容量的增大、试验次数的增多,这样的误差会接近于0,但即使误差再小,也不能忽视它的存在。
在现实中也一样,对于那些意义重大的科研结论,人们往往对概率计算有特别精确的要求。比如物理学家在探测引力波是不是真的存在时,总计花费了数十亿美元、用20多年的时间来建造探测器,目的就是必须要把实验误差控制在一个极其微小的数量级。事实上,这个探测器能探测到小数点后21位,这个尺度上的引力波变化。爱因斯坦一个世纪前的这个预言,才最终得到了有说服力的证明。
人们对小概率事件和微小误差的错误认识,会让看似精确的概率计算误入歧途。精确有时候并不意味着准确,客观事实和我们对概率的直观感受往往是有差异的。统计学原理虽然不那么复杂,但它仍然是一项严肃的科学,需要时刻带着客观、严谨的思维去审视数据和风险。
参考文献:
[1]张健.用统计学观念思考海关风险式通关以及数据审核[J].统计与咨询,2008,(06):46-47.
[2]胡璐,胡铃,王吉如.从统计学角度看大数据与金融风险防范[J].金融世界,2018,(01).
[3]康卉妍.统计学在精算与风险管理领域的应用[J].财讯,2017,(22).
王晔.浅析统计学的风险[J].中国科技投资,2019,(4):288.DOI:10.3969/j.issn.1673-5811.2019.04.265.
分享:
大数据和人工智能、云计算、区块链、物联网等数字技术的发展,为收集、分析、处理和利用实时数据、快速优化配置资源提供便利,推动统计学理论、方法和技术的发展与应用,促进统计学与不同学科和行业领域的交叉融合。在大数据信息快速发展的时代,利用统计技术与方法整理数据和处理信息显得尤为重要[1]。
2023-11-06随着信息技术的不断发展,大数据对各个行业所带来的影响越发深远。经济统计工作与人们的生活息息相关,政府相关部门在制定相应的政策时,需充分结合完善的经济数据,才能保证政策更加合理。在这一过程中,离不开经济统计学的应用,将经济统计学与大数据相结合,进一步改善现阶段存在的问题,提高经济统计的效率和质量。
2021-12-14大数据时代,统计学已经广泛应用于生物学、社会学、心理学、经济学、大数据等各个领域,也已经与许多学科形成交叉学科。为了了解统计学在大数据时代背景下在相关领域的现状以及未来的发展趋势,研究统计学的进一步发展方向。通过使用打破以往学科研究发展趋势以综述为主的方法,以数据统计分析对统计学发展趋势进行实证研究。
2021-07-08我国一直致力于提高科技期刊发行质量,使其为学术科研创新提供更高动力。在数字出版模式之下,中文医学期刊文章内容的学术性,将会受到统计学应用成效的影响。因此,在实践中基于数字出版模式,研究中文医学期刊读者和作者对统计学服务需求十分重要,将会为提高医学期刊整体质量带来极大帮助。
2021-01-08大数据在数据的采集、清洗、分离、分析、展示等过程中需要使用统计学的基本原理和分析方法。大数据的发展为统计学提供更快捷更方便的数据分析和可视化工具。在大数据时代,高校经济管理类专业学生必须能够广泛应用数据分析技术,能够从大量数据中提取有用的数据,并运用一系列统计分析方法对数据进行整理分析,然后得出结论,做出科学决策。
2020-12-17金融统计已进入金融业综合统计新阶段,开展大国金融数据管理,是以实际行动贯彻落实好党的十九届四中全会精神的新担当,是扎实做好新时期党中央、国务院关于加强金融业综合统计工作要求的新作为。这迫切要求企业集团财务公司金融统计相关部门在强化认识的基础上,学深悟透金融统计相关制度法规,从而真正实现理论与实践相结合,切实履行财务公司数据管理职责。
2020-09-28新冠肺炎疫情发生以来,以消费活力迅速下滑为起点的经济回落蔓延我国和几乎世界上所有国家,邯郸市也经历了“居民居家隔离全力抓疫情防控”到“统筹推进疫情防控常态化和经济社会发展两手抓”的艰难历程。在党中央领导下,经过全国人民和武汉人民艰苦卓绝的战斗,疫情蔓延形势得到有效控制,经济发展各项指标逐步恢复、持续向好。
2020-09-28企业基层统计工作是基础,也是前提。基层统计工作不仅可以直接反映当地的经济社会状况,而且会对统计数据的质量产生直接影响。除此之外,基层统计工作常常能为领导决策提供依据。尤其是一些国家政策的制定,都需要基层统计数据的支持。企业的发展也建立在基层统计工作的基础上。企业倘若对自身的产品销售情况、生产能力等都没有搞清楚,又何谈长久发展呢?因此,基层统计工作具有非常重要的实际意义。
2020-09-28以下为近期核心期刊收录的统计学相关论文题目,有需要在核心期刊投稿的统计学相关工作人员可以参考借鉴,更多其他类别题目,请查看本网站相关文章。1、数字经济的统计挑战与核算思路探讨2、建设新经济统计,赋能数字经济,助力智能时代一一关于开展新经济统计研究与实践的思考大数据在国库统计分析中的探索与应用3、经济统计学专业课程教学模式探索一一基于“威斯顿一格兰顿”教学方法应用视角4、企业经济统计学提高企业经济效益的相关对策
2020-09-23随着我国经济水平的不断提升,人工智能已逐渗透于人们的日常生活。为了更深层次地了解我国经济并促进其稳定发展,可以以人工智能为背景,并利用宏观经济展开了具体分析。然而,由于实际的经济统计过程会存在一定的不足,因此会干扰对我国经济数据的真实性。本文以宏观经济统计为研究对象,分析了其研究指标和诊断模型,并钻研了经济统计的影响因素。
2020-07-03我要评论
期刊名称:统计与信息论坛
期刊人气:3972
主管单位:陕西省教育厅
主办单位:西安财经学院,中国统计教育学会高教分会
出版地方:陕西
专业分类:社会
国际刊号:1007-3116
国内刊号:61-1421/C
邮发代号:52-153
创刊时间:1986年
发行周期:月刊
期刊开本:大16开
见刊时间:一年半以上
影响因子:0.212
影响因子:0.000
影响因子:0.000
影响因子:0.000
影响因子:0.177
400-069-1609
您的论文已提交,我们会尽快联系您,请耐心等待!
你的密码已发送到您的邮箱,请查看!