分享好友 站长动态首页 网站导航

第七次人口普查数据可视化分析实战——基于pyecharts(含数据和源码)

2022-06-02 08:06 · 头闻号编程技术

文章目录

写在前面

国家统计局发布的第七次人口普查数据较为宏观,未能较好的体现各地区人口指标的分布情况。本文基于Pyecharts初步分析各地区人口普查数据的分布情况😉。
# 导入相关库import pyechartspyecharts.globals._WarningControl.ShowWarning = Falseimport warningswarnings.filterwarnings('ignore')import pandas as pdfrom pyecharts.charts import Mapfrom pyecharts import options as opts

🥝1.数据集导入

df = pd.read_csv(r'C:UsersDELLDesktopStatistic learning数据分析案例第七次人口普查pop.csv')df.head()
provinceTotalMaleFemalesex-ratioAging-rateAHPEdu-levelGDPCR
0北京2189.3111201070104.6513.302.3111.8736102.5586.20
1天津1386.60714672106.3114.752.4010.8114083.7380.43
2河北7461.0237683693102.0213.922.759.4636206.8945.59
3山西3491.5617811711104.0612.902.5210.0217651.9349.79
4内蒙古2404.9212281177104.2613.052.359.9417359.8257.04

这里是我对第七次人口普查数据进行了基本处理后得到的数据集,感兴趣的小伙伴可以下载👉:数据下载地址

上述数据包含十个指标,分别如下

🍓2.总人口统计

# 总人口统计df['Total'][df['province']=='全国']
31    141178.0Name: Total, dtype: float64

根据第七次全国人口普查结果,我国人口达14.1178亿,突破14亿大关。那么各个地区的人口分布情况如何呢?来看看你的家乡属于第几梯队🙋‍♂️

'''导入地图和数据'''m1=Map()m1.add("总人口", [list(z) for z in zip(df.province, df.Total)], "china",is_map_symbol_show=False)'''自定义间隔'''pieces = [        {'max': 500, 'label': '500以下'},        {'min': 500, 'max': 1000, 'label': '500-1000'},        {'min': 1000, 'max': 2000, 'label': '1000-2000'},         {'min': 2000, 'max': 5000, 'label': '2000-5000'}, # 有下限无上限        {'min': 5000, 'max': 10000, 'label': '5000-10000'},        {'min': 10000, 'label': '10000以上'} ]'''全局设置'''m1.set_global_opts(             title_opts=opts.TitleOpts('第七次人口普查各地区人口总量分布图'),#设置图标题            visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=pieces))#热力图相关设置m1.render_notebook()

在这里插入图片描述

可以看出人口分布的整体趋势是由东南沿海逐渐向西北内陆地区递减

🍅3.性别比统计

这里的性别比为
男 性 人 口 / 女 性 人 口 × 100 % {男性人口}/{女性人口}times100 % 男性人口/女性人口×100%

# 全国性别比情况df['sex-ratio'][df['province']=='全国']
31    105.07Name: sex-ratio, dtype: float64

可以看出,全国性别比为105.07%,我国已经成为世界上性别比失衡较为严重、持续时间较长的国家。这里一部分原因是受到了传统重男轻女思想的影响,导致男性人口基数较大,可能要在很长时间才有望达到平衡。这也意味着将会有一部分🤦‍♂️男性较难脱单😥。接下来我们来看看各地区的性别比例吧

'''导入地图和数据'''m2=Map()m2.add("性别比例(%", [list(z) for z in zip(df.province, df['sex-ratio'])], "china",is_map_symbol_show=False)'''自定义间隔'''pieces = [        {'max': 100, 'label': '100以下'},#有上限无下限        {'min': 100, 'max': 105, 'label': '100-105'},        {'min': 105, 'max': 110, 'label': '105-110'},         {'min': 110, 'label': '110以上'}# 有下限无上限       ]'''全局设置'''m2.set_global_opts(          title_opts=opts.TitleOpts('第七次人口普查各地区性别比分布图'),#设置图标题            visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=pieces))#热力图相关设置m2.render_notebook()

在这里插入图片描述

从上面这个性别比热力图,我们发现一个有意思的规律。

🍒4.老龄化率

根据国际标准,65岁以上人口占比7-14%为轻度老龄化14-20%为中度老龄化21-40%为重度老龄化。👵

# 全国老龄化程度情况df['Aging-rate'][df['province']=='全国']
31    13.5Name: Aging-rate, dtype: float64

此次人口普查结果显示我国65岁以上人口占比已经达到13.5%,这意味着中国已经处于中度老龄化的边缘,面对老龄化程度不断上升,国家也在不断推进“三胎”政策来缓解老龄化程度。接下来我们来看看各地区的老龄化情况

'''导入地图和数据'''m3=Map()m3.add("65岁及以上人口比例", [list(z) for z in zip(df.province, df['Aging-rate'])], "china",is_map_symbol_show=False)'''自定义间隔'''pieces = [        {'max': 7, 'label': '非老龄化'},#有上限无下限        {'min': 7, 'max': 14, 'label': '轻度老龄化'},        {'min': 14, 'max': 20, 'label': '中度老龄化'},         {'min': 20, 'label': '重度老龄化'},        ]'''全局设置'''m3.set_global_opts(            title_opts=opts.TitleOpts('第七次人口普查各地区老龄化程度分布图'),#设置图标题            visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=pieces))#热力图相关设置m3.render_notebook()

在这里插入图片描述#pic_center

从上面这个热力图可以看出

🍑5.人均受教育年限

人均受教育年限是衡量一个地区文化水平的重要指标,在第七次人口普查数据中,统计了大专及以上、高中、初中和小学的人数,这里做如下处理后得到人均受教育年限

# 全国受教育情况df['Edu-level'][df['province']=='全国']
31    8.88Name: Edu-level, dtype: float64

可以看出我国平均受教育年限为8.88,这说明我国九年义务教育基本完成保障(上个世纪一部分人受教育程度较低)。下面我们来看一下各地区的受教育年限分布情况

'''导入地图和数据'''m4=Map()m4.add("人均教育年限", [list(z) for z in zip(df.province, df['Edu-level'])], "china",is_map_symbol_show=False)'''自定义间隔'''m4.set_series_opts(label_opts=opts.LabelOpts(is_show=True))pieces = [        {'max': 8, 'label': '8年以下'},#有上限无下限        {'min': 8, 'max': 9, 'label': '8-9年'},        {'min': 9, 'max': 10, 'label': '9-10年'},         {'min': 10, 'label': '12年以上'}     ]'''全局设置'''m4.set_global_opts(             title_opts=opts.TitleOpts('第七次人口普查各地区人均受教育年限分布图'),#设置图标题            visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=pieces))#热力图相关设置m4.render_notebook()

请添加图片描述

从上述热力图可以看出:

🍎6. 城镇化率

df['CR'][df['province']=='全国']
31    63.89Name: CR, dtype: float64

根据第七次人口普查结果可以看出,我国城镇化率达到63.89%,新型城镇化和城乡融合发展工作取得新成效,农业转移人口市民化加快推进,城市群和都市圈承载能力得到增强。根据联合国的估测,世界发达国家的城市化率在2050年将达到86%,我国离这个数字还有一定的距离。下面我们来看看各地区城镇化率分布情况

'''导入地图和数据'''m5=Map()m5.add("城镇化(%", [list(z) for z in zip(df.province, df['CR'])], "china",is_map_symbol_show=False)'''自定义间隔'''pieces = [        {'max': 30, 'label': '30以下'},#有上限无下限        {'min': 30, 'max': 50, 'label': '30-50'},        {'min': 50, 'max': 60, 'label': '50-60'},         {'min': 60, 'max': 80, 'label': '60-80'},         {'min': 80, 'label': '80以上'}       ]'''全局设置'''m5.set_global_opts(            title_opts=opts.TitleOpts('第七次人口普查各地区城镇化率分布图'),#设置图标题            visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=pieces))#热力图相关设置m5.render_notebook()

请添加图片描述

从热力图来看,城镇化率也基本呈现由东部沿海向西部递减的趋势。不同地区的城镇化率差距明显

🥭7.GDP

上述是第七次人口普查的基本分析情况,下面我们来看看大家特别关注的一个指标GDP

df['GDP'][df['province']=='全国']
31    1013567.0Name: GDP, dtype: float64

可以看出2020年,我国GDP总额超过100万亿。这是一个里程碑的数字。那么各个地区的GDP分布情况如何呢,来看看你的家乡属于哪一档的。

'''导入地图和数据'''m6=Map()m6.add("GDP(亿元", [list(z) for z in zip(df.province, df['GDP'])], "china",is_map_symbol_show=False)'''自定义间隔'''pieces = [        {'max': 10000, 'label': '10000以下'},#有上限无下限        {'min': 10000, 'max': 20000, 'label': '10000-20000'},        {'min': 20000, 'max': 50000, 'label': '20000-50000'},         {'min': 50000, 'max': 100000, 'label': '50000-100000'},         {'min': 100000, 'label': '100000以上'}]'''全局设置'''m6.set_global_opts(          title_opts=opts.TitleOpts('第七次人口普查各地区生产总值分布图'),#设置图标题            visualmap_opts=opts.VisualMapOpts(is_piecewise=True,pieces=pieces))#热力图相关设置m6.render_notebook()

请添加图片描述
从上图发现东南地区GDP要远高于其他地区,其次是中部地区。西部地区和东北地区GDP总值相对较低

🍍总结

文章对第七次人口普查数据进行了初步分析,主要是运用可视化技术,分析各地区的各项人口指标总体情况。并进行一定总结,后续将进一步做各个指标的结构分析时间序列分析,敬请期待

本章的介绍到此介绍,如果文章对你有帮助,请多多点赞、收藏、评论、关注支持

免责声明:本平台仅供信息发布交流之途,请谨慎判断信息真伪。如遇虚假诈骗信息,请立即举报

举报
反对 0
打赏 0
更多相关文章

评论

0

收藏

点赞