如何更快的将新冠疫情数据读入 Stata 里面?

如何更快的将新冠疫情数据读入 Stata 里面?

即日起,使用 cuse 命令可以直接获取新冠肺炎的疫情数据了!考虑到国内的用户访问 GitHub 的速度很慢,甚至连接不上,所以我把 cuse 数据库搬到我的服务器上了!

如果你实在无法通过 cuse 命令调用,可以直接使用下面两个链接下载:

  1. 世界各国的历史数据:https://tidyfriday.cn/cuse/w/world-covid19.dta
  2. 中国各市的历史数据:https://tidyfriday.cn/cuse/c/china-covid19.dta

重新安装 cuse:

1
net install cuse.pkg, from("https://tidyfriday.cn/cuse/") replace force

导入全球各国疫情数据:

1
2
cuse world-covid19.dta, c w
*> (全球新冠疫情数据(数据来源:https://github.com/CSSEGISandData/COVID-19): 2020-04-28)

有如下变量:

  • iso: 三位的 ISO 代码;
  • country: 中文国家名称;
  • country_en: 英文国家名称;
  • date: 日期;
  • confirmed: 累计确诊人数;
  • recovered: 累计治愈人数;
  • deaths: 累计死亡人数。

导入中国的市级数据:

1
2
cuse china-covid19.dta, c w
(中国新冠疫情数据(数据来源:https://github.com/canghailan/Wuhan-2019-nCoV): 2020-04-28)

有如下变量:

  • date: 日期;
  • provcode: 省级行政区划代码;
  • prov: 省;
  • citycode: 市级行政区划代码;
  • city: 市;
  • confirmed: 累计确诊人数;
  • recovered: 累计治愈人数;
  • deaths: 累计死亡人数;

cuse 命令

cuse 命令是我自己编写的命令,主要功能是用于存放我的教程中的一些示例数据,运行 cuselist 可以查看该仓库中的所有数据:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
cuselist

*> 【0】
*> ----------------------------------------------------------------------
*> 1. 000001.dta: 平安银行历史股票数据
*> 【a】
*> ----------------------------------------------------------------------
*> 1. amricancellmapdata.dta: 美国蜂窝地图各个省份的位置坐标
*> 【c】
*> ----------------------------------------------------------------------
*> 1. cellmapdata.dta: 中国蜂窝地图各个省份的位置坐标
*> 1. countycode.dta: 中国各省市区县编号(即身份证前六位号码)
*> 2. china_label.dta: 中国地图标签
*> 3. china_map.dta: 中国地图数据
*> 4. china_city_spatial_distance.dta: 中国地级地图数据集
*> 5. china_province_spatial_distance.dta: 中国省级地图数据集
*> 6. cjd1617.dta: 金融学16和17年成绩单
*> 7. cpi.dta: 中国CPI2008/1-2017/11
*> 8. countrysexratio.dta: knoema各国总人口性别比例数据
*> 9. ctbc2.dta: 中债国债2002-2017年国债到期收益率
*> 10. cnstockholiday.dta: 上交所与深交所休市日期
*> 11. cnstockincome.dta: 1989年-2017年所有上市公司的基本收入状况
*> 12. china-covid19.dta: 中国新冠疫情数据(数据来源:https://github.com/canghailan/Wuhan-2019-nCoV)
*> ----------------------------------------------------------------------
*> 【d】
*> ----------------------------------------------------------------------
*> 1. echarts_worldmap.dta: ECharts世界地图各国中英文名称对照
*> 【g】
*> ----------------------------------------------------------------------
*> 1. gdpjdlj.dta: 中国GDP季度累计2006/第一季度-2017/第三季度
*> 2. gini_prov.dta: 1995-2010中国各省份Gini系数
*> 【h】
*> ----------------------------------------------------------------------
*> 1. huaihe.dta: 2017年淮河供暖政策对人预期寿命的影响模仿数据集
*> 2. houseprice.dta: 中国百城房价数据集
*> ----------------------------------------------------------------------
*> 【j】
*> ----------------------------------------------------------------------
*> 1. jdcourse2018a.dta: 2018年上半年暨南大学排课选课表
*> 2. jd2017zsjh.dta: 暨南大学2017年各省招生人数
*> ----------------------------------------------------------------------
*> 【l】
*> ----------------------------------------------------------------------
*> 1. life_expentancy.dta: 2010年中国各省市自治区人口出生时预期寿命
*> 【m】
*> ----------------------------------------------------------------------
*> 1. moneysupply.dta: 2008/1-2017/11中国货币供应量M0M1M2
*> ----------------------------------------------------------------------
*> 【p】
*> ----------------------------------------------------------------------
*> 1. pm10.dta: 2017年淮河供暖政策对人预期寿命影响的原始数据集
*> 2. population.dta: 2010年中国各区县人口
*> 3. population_prov.dta: 2002-2014年全国各省市年末人口
*> 4. pjw.dta: 分城市人口、就业与工资(1990-2016)
*> ----------------------------------------------------------------------
*> 【s】
*> ----------------------------------------------------------------------
*> 1. station.dta: 中国所有火车站车站代码
*> 2. smoking.dta: 合成控制法的美国39个洲的香烟销售量数据集
*> 2. sexratio.dta: knoema各国总人口性别比例数据
*> ----------------------------------------------------------------------
*> 【t】
*> ----------------------------------------------------------------------
*> 1. titanic.dta: 泰坦尼克号生存数据集
*> 2. tourism.dta: 旅游事业发展情况
*> ----------------------------------------------------------------------
*> 【w】
*> ----------------------------------------------------------------------
*> 1. world-covid19.dta: 全球新冠疫情数据(数据来源:https://github.com/CSSEGISandData/COVID-19)
*> ----------------------------------------------------------------------
*> 【书籍数据集】
*> 注意!如果你想调用的数据集的名字里含大写字母,你需要把它的首字母调成小写才能调用!
*> 1. 《计量经济学及Stata应用》——陈强著
*> 2. 《高级计量经济学及Stata应用》——陈强著
*> 3. 《An Introduction to Stata Programming, Second Edition》——Christopher F. Baum著

使用 cuse 即可调用这些数据,除了疫情数据,例如 titanic.dta: 泰坦尼克号生存数据集

1
cuse titanic, clear web

这个命令有三个选项:

  • clear: 可以简写为 c;
  • web: 可以简写为 w,表示从远端仓库调用数据集;
  • savetosystem: 可以简写为 s,使用该选项时会将该数据集保存到系统文件夹中,这样下次调用该数据的时候就不需要从远端仓库调用了,直接使用 sysuse 调用即可。
1
2
3
4
5
6
sysuse titanic, clear
*> file "titanic.dta" not found
*> r(601);

cuse titanic, clear web savetosystem
sysuse titanic, clear

数据更新

人工更新。

接下来我会每天早上起来更新下数据,如果你发现我忘记更新了,可以私信提醒我,谢谢。

应用

知识星球附件链接:https://t.zsxq.com/mYnqNJm

#

评论

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×