91学术服务平台

您好,欢迎来到91学术官网!业务合作:91xueshu@sina.com,站长邮箱:91xszz@sina.com

发布论文

论文咨询

新型冠状病毒感染预测模型概述

  2024-04-22    15  上传者:管理员

摘要:新型冠状病毒感染(COVID-19)给世界经济和卫生保健服务带来了前所未有的挑战。基于模型的传染病预测预警研究已成为公共卫生系统关注的热点,世界各地的研究者都在利用数学、统计学、算法与算力、深度学习方法和模型对COVID-19的演变进行预测预警。本文对5种常用的COVID-19预测模型进行综述,为后续政策制定和COVID-19疫情防控提供科学依据。

  • 关键词:
  • 严重急性呼吸综合征
  • 人畜共患
  • 新型冠状病毒感染
  • 防控策略
  • 预测模型
  • 加入收藏

严重急性呼吸综合征冠状病毒(severeacuterespiratorysyndromecoronavirus,SARS-Co V)和中东呼吸综合征冠状病毒(MiddleEastrespiratorysyndrome coronavirus,MERS-Co V)是两种高致病性和高传染性的人畜共患冠状病毒,分别于2002年和2012年在人类中暴发,是致命的呼吸道传染病。冠状病毒感染已经成为了21世纪备受关注的公共卫生问题[1]。

2019年底首次报告并迅速在全球范围内传播的新型冠状病毒感染(coronavirusdisease2019,CO-VID-19)是一种具有极高传染性的流行病[2]。无论是感染人数,还是流行范围,COVID-19的影响远远超过了SARS和MERS。COVID-19的暴发对全球公共卫生构成了极其严峻的威胁,根据WHO推算,截至2023年9月21日,COVID-19疫情已经在全球造成7亿多人感染、695万人死亡[3]。

我国实施COVID-19“乙类乙管”政策后,疫情防控工作进入了新阶段。基于模型的传染病预测研究已成为公共卫生系统关注的焦点,其主要目标是根据传染病传播的动态特征构建适当的数学模型,并对传播过程进行定性和定量分析以及计算机模拟。当前,国内外广泛采用时间序列模型、灰色动态模型、人工神经网络模型、线性回归模型和传播动力学模型等方法进行预测[4,5,6,7,8]。英国在口蹄疫暴发期间依靠数学建模取得了巨大成功[9,10],这表明在突发公共卫生事件应对工作中,建立合适的预测模型可以从被动预防转变为主动预防。针对当前COV-ID-19流行情况,研究人员开展了各种复杂的数学建模工作,旨在评估新型冠状病毒(severeacuterespiratorysyndromecoronavirus,SARS-Co V-2)的传播能力以及干预措施效果。本文简要概述了目前常用的5种COVID-19预测模型。


1、传播动力学模型


传播动力学模型是用于COVID-19的经典的传染病预测和预警模型。传染病的传播动力学模型假设种群可以被划分为几个不重叠的区室,主要包括易感-感染模型(susceptibleinfectedmodel,SI)、易感-感染-恢复模型(susceptibleinfectedrecovered model,SIR)、易感-感染-易感模型(susceptibleinfectedsusceptiblemodel,SIS)、易感者-潜伏者-感染者-康复者模型(susceptibleexposedinfectedrecoveredmodel,SEIR)和易感-感染-恢复-易感模型(susceptibleinfectedrecoveredimmunemodel,SIRS)。

由于各模型之间的区室不同,每种传播动力学模型所适用的条件也并不完全一致。其中,最为简单和基础的模型为SI模型,它的假设条件是如果一个人属于易感群体并与已感染者有效接触,那么这个人将会被感染并变成一个新的感染者,在此过程中无潜伏期、治愈情况以及免疫力的变化。然而,由于COVID-19存在潜伏期及免疫力等方面的变化,因此其应用相当有限。SIR模型主要用于预测个体在感染后可获得永久免疫的疾病;SIS模型用于个体感染治愈后无法获得永久免疫的疾病;SIRS模型用于个体在感染后一段时间内可以获得免疫力的疾病;SEIR模型适用于有潜伏期的疾病。传播动力学模型中的一个关键参数是基本繁殖数(R0),即当一个受感染个体进入一个所有个体都易感的群体时,该受感染个体平均感染下一代病例的数量[11],如果R0>1,传染病会逐渐扩散;如果R0<1,传染病会逐渐消失。由于COVID-19具有潜伏期,且在潜伏期内有传染性,因此,使用SEIR模型更加合理。

SIR模型被认为是流行病学动力系统的基础房室模型,因此常将它用于预测COVID-19的发生与发展。相比于SIR,SEIR模型则拥有一个额外的仓室“E”(exposed),这个额外的仓室显示出传染周期的灵活性。在COVID-19疫情暴发初期,不少研究通过改进SEIR模型,对疫情发展进行预测,并取得了一些预测结果。例如,COVID-19疫情早期,由于患者缺乏症状表现以及筛查能力有限的原因,导致一些感染病例无法确诊。于是,研究者们在SEIR模型中加入一个未确定病例的仓室,形成SEIRU模型[12]。该模型成功应用于探索由于核酸检测能力不足而未确诊病例的数量。WuJT等人[2]1使用SEIR模型对COVID-19疫情进行了建模,研究者估计,疫情的初期阶段,COVID-19疫情的R0为2.68。除了考虑到不同的疾病状态和阶段,对个体的干预会改变传染病的传播动态,在COVID-19疫情暴发早期,中国政府采取了综合干预政策控制SARS-Co V-2的传播,传播动态发生了变化。考虑到隔离策略,研究者们在SEIR模型的基础上建立了带有隔离仓室的模型,称之为SEIR+Q,这种模型主要是将在检疫中心或家中隔离的易感人群、在潜伏期隔离的个体和被隔离的感染者等人群纳入仓室[13,14,15,16],并进行进一步的处理和分析,这些研究表明,严格的干预措施极大的控制了COVID-19的传播。研究者们还利用来自世界卫生组织(WorldHealthOrganization,WHO)、约翰霍普金斯冠状病毒资源中心(The JohnsHopkinsCoronavirusResourceCenter)和以数据看世界(OurWorldinData)的疾病监测系统数据,采用SEIR模型估计12个受COVID-19影响最严重的南美国家的感染致死率、感染发病率和R0,研究者发现,南美洲国家之间的R0因新冠疫苗接种、药物干预的依从性、医疗保健标准和社会经济地位的差异而有所不同,提高新冠疫苗接种率可能有助于抑制南美的大流行[17]。

在SARS-Co V-2防控新阶段,利用传播动力学模型监测COVID-19的发展尤为重要。研究者们利用各种介质对COVID-19进行监测,基于废水的监测成为一种监测人群SARS-Co V-2感染的公共卫生工具。废水中聚集了受感染个体排泄的SARS-Co V-2颗粒,研究者可以在COVID-19病例出现症状之前捕捉到病毒的脱落情况,估计社区病毒感染的真实程度[18]。ProverbioD等人[19]在SEIR模型中添加了一个变量,使得模型拟合跟踪那些主动脱落SARS-Co V-2的个体,并通过使用一个恒定的病毒脱落率,将感染病例数与废水中的病毒浓度联系起来监测病毒感染情况。PhanT等人[20]通过将污水监测数据整合到SEIR-V模型中,V代表着废水中的累积病毒载量,并将下水道温度对病毒的影响纳入到整个的模型框架中,建立了估算COVID-19流行率和预测SARS-Co V-2传播的定量框架,SEIR-V模型成功地再现了废水中SARS-Co V-2病毒载量的时间动态,其预测的病例数比报告病例数提前6~16d达到峰值,预测效能良好。在COVID-19疫情早期阶段,由于潜伏期、无症状感染者等因素,COV-ID-19患者从感染疾病到医院确诊期间存在一定的滞后期,可能会导致疫情在社区传播,研究显示,COVID-19患者在感染数天内即可通过其粪便排出病毒[21],因此,将废水监测数据导入到预测模型中可以帮助卫生工作者提前发现疫情的暴发,以便及时采取措施。未来,废水监测可能成为各种传染性疾病的关键监测对象,帮助卫生工作者快速识别判断早期的COVID-19流行,评估辖区COVID-19疫情的变化趋势。


2、差分自回归移动平均模型(autoregressiveintegrated moving average model,ARIMA)


Box和Jenkins于20世纪70年代初提出了著名的时间序列预测模型,称为Box-Jenkins模型,简称为ARIMA模型。该模型的基本思路是将非平稳时间序列转化为平稳时间序列,然后将应变量与其滞后值以及随机误差项的现值和滞后值进行回归建立模型。自回归综合移动平均是一种单变量回归分析方法,ARIMA时间序列模型基于过去的数据,假设残差的正态性,因此这些模型并不适合研究非线性和复杂的现象。作为一种自回归移动平均模型(auto-regressiveandmovingaveragemodel,ARMA)的扩展,ARIMA被拟合到了时间序列数据中,以便更好地理解数据或预测这些序列中即将到来的时点。AlzahraniSI等人[22]使用ARIMA模型预测沙特阿拉伯COVID-19每日感染人数,结果优于自回归模型和移动平均模型,报告的均方根误差(root-meansquareerror,RMSE)、平均绝对误差(meanabsolute error,MAE)、确定系数(R2)和平均绝对百分比误差(meanabsolutepercentageerror,MAPE)的值分别为21.17、14.93、0.99和2.16,其预测效能较好。ChakrabortyT等人[23]也提出了一种基于ARIMA模型和基于小波预测模型的混合预测模型,这种模型可以对加拿大、法国、印度、韩国和英国的每日病例量进行短期的预测。SciannameoV等人[24]通过ARIMA、SIR、广义相加模型和贝叶斯等多种模型对2020年2月24日以来的意大利COVID-19的大流行数据进行了分析,结果显示,在疾病暴发早期,ARIMA、广义相加模型和贝叶斯模型对于预测疫情峰值的效能较好,在疾病发展后期,ARIMA模型和贝叶斯模型更适合后期新病例的发现,此研究表明,对于新病例的发现,ARIMA模型在疾病暴发的不同时期,均具有良好的效能。


3、自适应神经模糊推理系统(adaptive neurofuzzyreasoning system,ANFIS)


Jang于1993年提出了ANFIS,目前已经成为应用最广泛的神经模糊系统之一,它是建立在TakagiSugeno模糊推理系统基础上的一种人工神经网络。ANFIS的体系结构有5层,即将输入信号模糊化的模糊化层,计算各条规则适用度的层(规则层),归一化计算规则适用度的层,接收归一化值和结果参数作为输入的层,以及最终输出值的层。Al-Qaness等人设计了一种在优化器海洋捕食者算法(marine predatoralgorithm,MPA)上升级的ANFIS模型,使用MPA对ANFIS参数进行了优化,用来估计意大利、伊朗、韩国和美国4个国家COVID-19病例数量,通过与其他的模型如单独的MPA模型和ANFIS模型比较,改良的MPA-ANFIS模型有更好的RMSE、MAE、MAPE和R2[25],预测效能更好。在另一项研究中,研究者通过使用SalpSwarm算法,结合改进的花授粉算法(flowerpollinationalgorithm,FPA)提高ANFIS的精度,使用从WHO网站检索的官方数据对FPASSA-ANFIS模型进行评估,其预测效能较好,使用每周流感病例的两个不同数据集评估所建立模型的准确性,也显示出了良好的性能[26]。AlsayedA等人[27]使用SEIR模型预测马来西亚COV-ID-19的流行高峰,同时使用ANFIS模型对COVID-19数量进行短期预测,结果表明干预措施对于推迟流行高峰到来有一定影响,研究者建议延长干预期可能会降低高峰期的流行严重程度,此研究报道的RMSE、R2和MAPE值分别为46.87、0.9973和2.7921,模型的性能极佳。BehnoodA等人[28]使用了病毒优化算法和ANFIS的集合评估气候相关参数和人口密度对COVID-19传播的影响,结果表明人口密度对其模型性能有显著影响,研究强调了社会距离在降低COVID-19感染率和传播方面的重要性,该模型报道的RMSE、MAE和R2值分别为22.47、7.33和0.83。JithendraT等人[29]使用AN-FIS-RSA的方法建立COVID-19疫情预测模型,利用从WHO获取的中国(2020年1月21日至2021年2月18日)和印度(2020年11月3日至2022年1月1日)的庞大数据集进行测试,将其中75%的数据作为训练集,25%的数据作为测试集,与传统的单一ANFIS方法相比,ANFIS-RSA有效性更强,统计效能更好。


4、长短期记忆网络模型(long and short termmemory network model,LSTM)


LSTM是一种人工循环神经网络方法,主要用于深度学习策略,LSTM模型的主要优点在于其能够解决循环神经网络中存在的长期依赖问题,使得网络能够更好地处理长序列的输入数据。除了处理单个数据节点外,LSTM还可以处理完整的数据序列[30]。AoraP等人[31]在印度一个COVID-19患者数据集中使用LSTM模型预测阳性病例的数量,应用LSTM模型对每日和每周COVID-19病例进行预测,模型预测确诊数的误差率分别约为3%和8%。随后,研究者位根据实际阳性病例数量和每日增长率升级模型,将印度各邦划分为不同的区域。Fokas AS等人[32]应用双向LSTM提高前馈神经网络的鲁棒性和泛化性,该方法已在意大利、西班牙、法国、德国、美国和瑞典用于预测新发COVID-19趋势。研究者使用ARIMA和LSTM模型对摩洛哥的SARS-Co V-2感染与COVID-19死亡数据进行拟合和预测[33],使用2020年9月22日至2020年11月22日的真实数据训练和测试模型,再通过模型对未来2个月摩洛哥COVID-19的发病和死亡情况进行预测,两种模型都显示,未来2个月摩洛哥的COVID-19确诊病例和死亡病例将继续增加,通过比较两种模型的预测误差,研究者可能更倾向于选择LSTM模型预测COVID-19。


5、多层感知器(multilayer perceptron,MLP)


MLP是一种前馈人工神经网络,包括输入层、隐藏层和输出层3个节点,除了输入节点外,其他节点都使用了非线性激活函数的神经元。MLP使用了反向传播监督学习方法训练,MLP的主要优点在于其简单性和易训练性。由于其结构相对简单,MLP的计算效率较高,并且易于实现。Car等人[34]使用了一个公开可用的数据集,其中包含51d内406个地点的SARS-Co V-2感染、康复和死亡患者的信息,并将其转换为回归数据集,用于训练MLP和ANN模型,其中设计最好的模型有4个隐藏层,每个隐藏层含有4个神经元,该模型对死亡病例和确诊病例的预测效能较强,但对康复患者的预测稳定性较低[34]。PintérG等人[35]还使用了ANFIS和MLP的混合机器学习方法建立预测COVID-19病例和死亡人数的时间序列模型,短期观测数据证实了该模型的准确性,研究者认为,在非特殊情况下,该模型能够保持其准确性。QureshiM等人[36]使用ARIMA模型和MLP模型对2020年2月25日至2022年3月23日巴基斯坦每日COVID-19死亡病例进行建模,基于RMSE、均方误差和MAE的结果选择最佳的模型,关键性能指标表明,MLP模型优于ARIMA模型,具有20个隐藏层的MLP模型是预测巴基斯坦未来每日COVID-19死亡人数最合适的模型。


6、小结


针对COVID-19疫情的预测,基于模型的传染病预测研究已成为公共卫生系统关注的热点,大量的研究通过建立合适的传染病预测模型帮助管理部门制定政策。这些数学模型是解决当前由SARS-Co V-2传播引发COVID-19流行的有效工具,基于流行病学模式构建的数学模型可以描述相互作用,解释感染和恢复的动态关系,预测由于采取社交距离和隔离等措施可能出现的发展趋势。然而,随着COVID-19防控措施的改变,需要通过其他更加客观的数据例如污水监测等数据构建科学准确的COV-ID-19数学预测模型,实时分析COVID-19传播态势,优化防控策略,实施较小代价的常态化疫情防控,对制定SARS、MERS、甲型H1N1流感和其他新发传染病等控制的有效决策非常重要。同时,各模型之间由于适用条件以及所需研究资料类型的差异,需要研究者根据研究需要选择合适的模型进行拟合分析,并调整关键参数,从而找到真正合适的模型。当前,这些模型有助于帮助一些项目和公共政策的决策和实施,从而达到减缓病毒传播、最大限度地减少可能导致卫生系统崩溃的严重病例的目的。


基金资助:2022年安徽省新冠病毒科研应急攻关项目(2022e07020071);


文章来源:储修杰,宋丹丹,侯赛,等.新型冠状病毒感染预测模型概述[J].安徽预防医学杂志,2024,30(02):113-116+133.

分享:

91学术论文范文

相关论文

推荐期刊

网友评论

加载更多

我要评论

安徽预防医学杂志

期刊名称:安徽预防医学杂志

期刊人气:1728

期刊详情

主管单位:安徽省卫生厅

主办单位:安徽省卫生健康委员会,安徽省疾病预防控制中心

出版地方:安徽

专业分类:医学

国际刊号:1007-1040

国内刊号:34-1154/R

创刊时间:1995年

发行周期:双月刊

期刊开本:大16开

见刊时间:7-9个月

论文导航

查看更多

相关期刊

热门论文

【91学术】(www.91xueshu.com)属于综合性学术交流平台,信息来自源互联网共享,如有版权协议请告知删除,ICP备案:冀ICP备19018493号

400-069-1609

微信咨询

返回顶部

发布论文

上传文件

发布论文

上传文件

发布论文

您的论文已提交,我们会尽快联系您,请耐心等待!

知 道 了

登录

点击换一张
点击换一张
已经有账号?立即登录
已经有账号?立即登录

找回密码

找回密码

你的密码已发送到您的邮箱,请查看!

确 定