首页 > 编程知识 正文

新冠肺炎疫情预测模型(武汉)

时间:2023-05-04 15:34:47 阅读:86850 作者:2471

转载:绿色油墨社区

正文2713个字,建议读5分钟。

本文介绍了利用国家发布的疫情数据,建立动力学模型,预测全国、武汉和上海新型肺炎的流行情况和关键节点时间。

在千千万万网民的关注下,雷神山医院建筑工人正在分秒必争、殊死搏斗,但在看不见的地方,许多科研力量也已经突破了紧急难关,绝了后患。 在这前所未有的黑天鹅事件下,每个人都有伸出援手、团结、共同克服困难的力量。 作为其中的一员,我们也想贡献自己的微薄之力。 武汉加油! 中国加油!

标题中央电视台

我们是普通的研究者们,用掌握的知识掌握疫情的发展动态,试图了解周围每一个人和国家为控制疫情而努力的效果。 为此,我们利用国家发布的疫情数据,建立动力学模型,预测全国、武汉和上海新型肺炎的流行情况和关键节点时间。 结果表明,该模型理论上可以提前一天预测全国和重点城市疫情爆发人数。

基于截至1月30日疫情数据的预测结果如下。

主要发现1

全国疫情将在2月5日-8日左右达到爆炸性增长的拐点,预计3月20日有可能基本结束。

主要发现2

各地政府的有效防控措施,减少了易感人群的暴露,切实有效地减少了易感人群的数量。

P1 .模型拟合和预测误差评估

模型采用1月16日至1月27日[1]国家卫生应急办公室和湖北省卫健委发布的疫情数据[2]。 为了验证模型的有效性和稳定性,小组在27日完成建模后,继续进行了28-30日[3]疫情的预测跟踪。

结果表明,1月16-27日疫情数据对全国疫情模型的解释程度(R2 )达到99.7%。 基于这一拟合,估计全国疫情拐点将于2月8日左右出现,这与钟南山院士[4]判断的“正月15日前出现拐点”一致,也与明理自行车院士提出的疫情出现后“潜伏期有一两人出现拐点”一致。 另外,模型估计疫情有可能在3月20日左右基本结束。

武汉疫情适宜度为84.5%[5],误差相对较高。 由于武汉医疗资源相对紧张,确诊速度不稳定,确诊统计量可能受到干扰。

下图显示了1月16日至27日实际疫情和初始模型的预测结果。

注:黑色表示实际数据,蓝色表示模型预测数据,横轴表示2020年第n天,纵轴表示感染人数(确诊数)

然后,小组根据28-30天的实际情况每天检查模型的预测有效性。 结果显示,模型预测确诊数的误差率分别为7.3% (全国)和10.8% (武汉)。 模型证明了未来24小时确诊数的预测比较准确。

注:对于28-30日的预测,分别采用16-27、16-28、16-29日的实际疫情进行模型参数的估计。

小组还考察了模型对未来48小时疫情确诊数的预测效果,预测误差分别为19.7% (全国)和16.1% (武汉),表明我们的模型48小时预测精度相对较低,但仍在20%的误差范围内。

注:对29-30日的预测分别采用16-27、16-28日的实际疫情情况进行了模型参数的估计,即48h预测。

P2 .全国和武汉疫情预测

确认模型的有效性后,用16-30天的数据预测了未来。 最终结果如下。

1

与16-27日数据所得模型结果比较,模型对全国疫情的适宜度提高到99.9%,

2

疫情拐点提前至2月5日-2月6日,预计高峰人数将明显减少。

这可能是由于各地政府的有效防控措施,减少了易感人群的曝光,从而切实有效地减少了全国整体的高峰人数,加快了拐点。

p>

而武汉疫情拟合度提高到了97.2%,说明随着武汉数据的持续发布,武汉疫情越来越可以被我们的模型拟合。但同时我们也关注到,武汉的拐点时间并没有改变,而拐点的感染峰值人数反而在提高,仍有待每日保持紧密和持续的关注。

P3. 上海疫情预测

除了湖北武汉以外,北上广重作为武汉近期重点人员输出城市,具有最高的疫情爆发风险。但这5座城市确诊数据的时间跨度较短,缺乏20日之前的确诊病例数。我们以上海为例进行早期确诊数据填充来粗略估计疫情发展。

基于1月18日至1月28日的确诊数量[6]我们进行模型估计后。结果显示:上海疫情的峰值拐点将在2月6日左右出现, 3月20日左右基本结束,和全国情况相似。

在预测效果上,我们同样以1月29-30日为验证,模型预测确诊病例数分别为101和121,与实际疫情的平均误差率2.7%。下图展示了我们对上海疫情的最新预测。

P4. 尾声

总的来说,我们对疫情防控的发展充满积极乐观的态度,因为我们已经发现和证实各地政府有效防控措施带来的积极效果,对我国人民众志成城打赢这场疫情也充满信心。

但同时我们也在担心:随着春运返程人流的增加,易感人群暴露率可能会增加,疫情很有可能出现反复。在此,我们也真诚地希望大家,信任和积极配合政府所做的各项疫情防控措施,注意采取自我保护措施,在接下来的几天里坚持做好防控,共同促进拐点的提前,在下周能安心地踏上春运的返程。

最后,我们承认工作的局限性。由于模型仅采用有限公开数据进行预测,尽管已经取得了较好的预测效果,但不排除增加更多数据(如人口流动率、医院就诊病患信息、检查周期等)时可以开发更好的模型进行预测。

团队感想

我们在除夕当天获悉全国疫情信息后就自发地收集数据和构建模型,中间得到很多同事朋友的关心和关注。在研究的同时,我们也作为普通人,在上海、成都、武汉、昆明等地切实感受着政府的积极防控措施、周围群众到位的防控意识,以及无数像我们一样的医疗、科研、政府工作人员在春节默默工作。

烦闷工作之余,就是刷刷各地的春节防控段子,感受各地群众乐观向上、百折不挠的生活态度。为了确保研究的严谨性,尽管我们在27号做好了模型和测试,但仍旧留了3天,每天和真实数据对比。除了预测效果的确不错外,还发现推断的拐点在不断提前,峰值人群不断下降。只要不出现异常复发(比如春运返程),我们是积极乐观的,也希望这份晚到了三天的乐观能传播出去,为我们每日生活的祖国带来更加多的正能量 :)

我们计划接下来每日持续改进模型和更新预测数据,为我国打好此次疫情的攻坚战,帮助社会了解到国家为疫情控制所做努力的成效,帮助广大人民群众科学了解疫情的未来发展,尽到自己的一份力量。

一群共同努力着的普通研究者:邓皓文、张诚、英俊的含羞草、sddjm、sqdxj、lylf和王琳。

附注:

[1] 国家卫生应急办公室自1月20日才开始公布全国确诊病例数,其中武汉外共33例,故用武汉1月16日至19日的确诊数代表全国以增加数据量。武汉15日之前的确证病例数与疫情扩散通常呈现的指数增长趋势不符,暂忽略。

[2] 全国卫生应急办公室http://www.nhc.gov.cn/yjb/new_index.shtml,

湖北省卫生健康委员会 http://wjw.hubei.gov.cn/

[3] 29日的预测基于模型在更新28日数据的基础上改进参数后的结果,30日的预测基于模型在更新29日数据的基础上改进参数后的结果,以此类推。

[4] https://tech.ifeng.com/c/7tdDNY8MUGA

[5] 从武汉疫情数据来看,前期披露数据近似线性增长,但近日出现指数型上涨,和全国疫情扩散规律不太一样。

[6] 上海市卫生健康委员会 http://wsjkw.sh.gov.cn/

—完—

关注清华-青岛数据科学研究院官方微信公众平台“ THU数据派 ”及姊妹号“ 数据派THU ”获取更多讲座福利及优质内容。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。