图说七普(二)

图说七普(二)

上次的推文 图说第七次人口普查(更正) 中我用 Stata 绘制了一些精美的图表来展示第七次人口普查的主要数据情况。

今天我们再来绘制一些图展示人口的地区分布、年龄结构和性别比例。

本文中的所有图表均使用 Stata 绘制。

各地区的人口

通常把中国分成四个区域:东部区域、西部区域、中部区域和东北地区。四部分的人口占比如下图所示(比起之前出的 Stata 绘制省级地图数据,这个数据里面多了区域的分界线):

在除去港澳台的 31 个省份中,人口超过1亿人的省份有 2 个,在 5000 万人至 1 亿人之间的省份有 9 个,在 1000 万人至 5000 万人之间的省份有 17 个,少于 1000 万人的省份有 3 个。如下图所示:

各省市的人口分布

下图展示了第七次人口普查结果中的各省市人口分布:

其中广东是人口最多的省份,1.26 亿,山东第二,刚刚超过 1 亿:

河南的人口竟然掉下 1 亿了!

人口性别结构

下图展示了历次人口普查中的男女性人口数量和总人口性别比:

各省市的人口性别比如下图所示:

广东的男女比最高,113:100;吉林的男女比最低,99.69:100。

人口年龄结构

下图展示了第七次人口普查中各省市的人口年龄结构:

广东省 15~59 岁的人口比例最高,为 68.8%,河南的最低,为 58.79%。

数据的爬取

本文中使用的数据爬取自国家统计局网站,爬取代码可以参考:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
library(rvest)
library(tidyverse)
read_html('http://www.stats.gov.cn/tjsj/zxfb/202105/t20210510_1817179.html') %>%
html_table(fill = TRUE) -> table

table[[2]] %>%
as_tibble() %>%
select(1:2) %>%
slice(-3:-1) %>%
set_names(c("地区", "人口数")) %>%
type_convert() %>%
add_row(
tibble(地区 = c("香港", "澳门", "台湾"),
人口数 = c(7474200, 683218, 23561236))
) %>%
haven::write_dta("七普各省市人口数.dta")

read_html('http://www.stats.gov.cn/tjsj/zxfb/202105/t20210510_1817181.html') %>%
html_table(fill = T) -> table2

table2[[3]] %>%
select(1:4) %>%
set_names(c("地区", "group1", "group2", "group3")) %>%
slice(-4:-1) %>%
haven::write_dta("各地区人口年龄结构.dta")

read_html('http://www.stats.gov.cn/tjsj/zxfb/202105/t20210510_1817180.html') %>%
html_table(fill = T) -> table3

table3[[2]] %>%
as_tibble() %>%
set_names(c("地区", "男性比例", "女性比例", "性别比")) %>%
slice(-3:-1) %>%
type_convert() %>%
haven::write_dta("全国各省市性别比.dta")

作者

Painter

发布于

2021-05-17

更新于

2021-05-31

许可协议

评论