统计部门数据发布要慎重,某些年份人口存活率逐年提高、某些年代夭折数据急剧上升,肯定是统计错误
CWP
早就听到有人指出,按照《第五次全国人口普查公报》中各年龄段人数来计算,显然,与1960年前后出生的人口数很有问题,另外有人指出1995年全国人口1.04%抽样调查也存在着同样的矛盾。
那时我就提出,如果给我1957年到1963年以外的历年出生人数,再给我《第五次全国人口普查公报》或1995年全国人口1.04%抽样调查中各年龄段的存活人数,我就可以把1957年到1963年出生的人数相当准确地计算出来。
——注意!要的是所有年份的数据,包括1950年到1956年,也包括1964年到1972年,不是一年都不能缺,但年份越多越好。而1957年到1963年的人口出生数据倒可有可无。如果有,可以验证其可靠性,没有也不过不能做这样的验证。当然这几年在以后年份如2000年统计的存活人数是完全必要的,不然也算不出来当年的出生人数。
自然还要求数据个个精确。在以后某年,比如2000年存活的1957年到1963年的出生人数,也就是37到43岁的人必须绝对精确,其误差将完全影响计算结果。其他年份,1950年到1956年出生的人数以及1964年到1972年的出生人数也需精确,其精确度也将严重影响到计算结果。但是这些年份略有误差问题不大,并且可以根据它们的精确度算得1957年到1963年出生人口的精确度(误差)和置信度。
计算方法如下:
首先必须算得各年的存留率%。比如2000年人口普查中各年的存留率(%)=存留人口÷出生人口×100%
同样道理,对于1990年第四次人口普查、1982年人口普查以及1995年的全国人口1.04%抽样调查得到的全国分年龄人口统计也可以算得与该年统计有关的各年的存留率%。这些数据和年份必然存在着一个相关关系。这个关系可以计算出回归方程,这个回归方程不是线性的,但必然是年龄越大存留率越低,存在一个单调下降趋势。在坐标图上它们表现为一条回归曲线。即使缺若干年份,如1957年到1963年,这条回归曲线仍然可以相当准确地得出这七年的存留率。它们的精确度不会亚于已知的点——即已知的年份。根据这七年中的存留人口就可以精确地计算出这七年的出生人数来。
计算公式如下:某年出生人口=存留人口÷存留率(%)×100%
经过搜索我终于在网上得到各个统计数据。有2000年第五次全国人口普查、1995年全国人口1.04%抽样调查、1990年第四次全国人口普查以及1982年的全国人口普查的全国分年龄人口统计表。主要是在中国人口信息网得到的,有的是在其他网站上搜索到的。
中国人口信息网网址:
http://www.cpirc.org.cn/
可是官方没有给我们提供各个年份的人口出生数量,这样就不太好了。但是1982年还是提供了各年份的出生率,也给我们提供了各年的人口数。我们可以据此来计算各年份的出生人口。
许多人提出无论是他们提供的出生率还是年末人口数都矛盾百出,而且这两套数据也是相互矛盾的,这儿我们不予理会。就算以前的数据有问题,并且可以归罪于“极左干扰”,那么改革以后的各年份的数据自然应该相信了。官方提供的数据如未特别指明都来源于《1949年以来五十年统计资料汇编》,其中第三次人口普查以前的数据,和官方,由薛暮桥和李成瑞1982年提供的完全相同。
官方对主要统计指标中出生率等的解释如下:
人口数是:指一定时点、一定地区范围内有生命的个人总和。年度统计的年末人口数:指每年12月31日24时的人口数。年度统计的全国人口总数内未包括香港、澳门特别行政区和台湾省以及海外华侨人数。
出生率(又称粗出生率) 指在一定时期内(通常为一年)一定地区的出生人数与同期内平均人数(或期中人数)之比,用千分率表示。本资料中的出生率指年出生率,其计算公式为:
年出生人数
出生率=—————————×1000‰
年平均人数
式中:出生人数指活产婴儿,即胎儿脱离母体时(不管怀孕月数),有过呼吸或其他生命现象。年平均人数指年初、年底人口数的平均数,也可用年中人口数代替。
这样计算的结果具有四位有效数字,因为他们提供的各年出生率为四位有效数字,各年人口有效数字就更多了。按这样计算照理我们得出的非线性回归方程精确度是相当高的。以2000年第五次全国人口普查为例,各年龄人口精确到八位有效数字,就是1995年全国人口1.04%抽样调查六位有效数字也足足有余了。所以计算的结果完全可以达到和各年出生率相同的甚至更大的精确度(在回归方程中,误差可以相抵,精确度可以提高)。
现在我们就来计算各年份的出生人口。见下表。表中年中人口就等于该年初(也就是上一年底)与该年底总人口的平均数。
表一:各年份出生人口表
年份 年底总人口 出生率 以官方数据计算
年中人口 算得出生人口
(万人) (‰) (万人) (万人)
1949 54167 36.00
1950 55196 37.00 54681.5 20232155
1951 56300 37.80 55748.0 21072744
1952 57482 37.00 56891.0 21049670
1953 58796 37.00 58139.0 21511430
1954 60266 37.97 59531.0 22603921
1955 61465 32.60 60865.5 19842153
1956 62828 31.90 62146.5 19824734
1957 64653 34.03 63740.5 21690892
1958 65994 29.22 65323.5 19087527
1959 67207 24.78 66600.5 16503604
1960 66207 20.86 66707.0 13915080
1961 65859 18.02 66033.0 11899147
1962 67295 37.01 66577.0 24640148
1963 69172 43.37 68233.5 29592869
1964 70499 39.14 69835.5 27333615
1965 72538 37.88 71518.5 27091208
1966 74542 35.05 73540.0 25775770
1967 76368 33.96 75455.0 25624518
1968 78534 35.59 77451.0 27564811
1969 80671 34.11 79602.5 27152413
1970 82992 33.43 81831.5 27356270
1971 85229 30.65 84110.5 25779868
1972 87177 29.77 86203.0 25662633
1973 89211 27.93 88194.0 24632584
1974 90859 24.82 90035.0 22346687
1975 92420 23.01 91639.5 21086249
1976 93717 19.91 93068.5 18529938
1977 94974 18.93 94345.5 17859603
1978 96259 18.25 95616.5 17450011
1979 97542 17.82 96900.5 17267669
1980 98705 18.21 98123.5 17868289
1981 100072 20.91 99388.5 20782135
1982 101654 22.28 100863.0 22472276
1983 103008 20.19 102331.0 20660629
1984 104357 19.90 103682.5 20632818
1985 105851 21.04 105104.0 22113882
1986 107507 22.43 106679.0 23928100
1987 109300 23.33 108403.5 25290537
1988 111026 22.37 110163.0 24643463
1989 112704 21.58 111865.0 24140467
1990 114333 21.06 113518.5 23906996
1991 115823 19.68 115078.0 22647350
1992 117171 18.24 116497.0 21249053
1993 118517 18.09 117844.0 21317980
1994 119850 17.70 119183.5 21095480
1995 121121 17.12 120485.5 20627118
1996 122389 16.98 121755.0 20673999
1997 123626 16.57 123007.5 20382343
1998 124810 16.03 124218.0 19912145
1999 125909 15.23 125359.5 19092252
根据官方的数据,我们做全国分年龄人口统计表如下:
这儿列了四套数据,2000年第五次人口普查、1995年10月1日抽样调查(抽样比为1.04%)、1990年第四次人口普查以及1982年人口普查。