使用 Stata 分析世界疫情数据

使用 Stata 分析世界疫情数据

这篇教程中的部分代码和之前那篇对中国的分析一样,所以我仅仅简要讲解一下其中的新知识点。

数据获取

获取疫情数据的方式很多,下面的分析中我使用的是从 CSSEGISandData/COVID-19: Novel Coronavirus (COVID-19) Cases, provided by JHU CSSE 下载的疫情数据。所有分析中使用的数据我都已经放在了附件中,下载即可学习。

知识星球附件链接:https://t.zsxq.com/zbYBubm

可视化分析

各国现存确诊人数变化

实际上我们知道面板数据可以使用 xtline 命令快速绘制分面图:

全球每天的总数

当前确诊人数与每日新增确诊人数

lpolyci 命令可以用户绘制多项式拟合曲线。bw() 选项用于指定窗宽(如果你学过非参的一些东西你应该你能够理解这些概念)。

死亡和治愈病例数量

病死率

病死率的计算需要非常谨慎,因为我们要考虑状态未决的观测值的问题。有两种情况:情况一,正在治疗的患者都不幸去世了;情况二:正在治疗的患者都非常幸运的存活了。

在情况一中,使用我们的数据集计算得到的病死率低于真实的病死率,因为:

$$\frac{病死人数}{治愈数 + 病死数} \leq \frac{病死人数 + 正在治疗的病例}{治愈数 + 病死数 + 正在治疗的病例}$$

在情况二中,使用我们的数据集计算得到的病死率高于真实的病死率,因为:

$$\frac{病死人数}{治愈数 + 病死数} \geq \frac{病死人数}{治愈数 + 病死数 + 正在治疗的病例}$$

所以估计病死率我们应该使用区间估计,区间上限对应的病死率是情况一的死亡率,区间下限对应的死亡率是情况二。还有一个死亡率的测度是每日的病死率:

$$每日病死率 = \frac{当日病死人数}{当日病死人数 + 当日治愈人数}$$

各国病死数量和确诊数量的关系

部分国家病死率变化

地理分布

绘制地图可以使用我之前介绍过的方法。

总确诊人数:

也可以绘制白底的:

现存确诊病例的分布

知识星球附件链接:https://t.zsxq.com/zbYBubm

#

评论

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×