人文社会・单身汉
「2025 年时中国将有 3700 万单身汉」的数据靠谱吗?有什么解决办法?
chenqin
谢谢邀请,在回答这个问题前,先把「单身汉」定义清楚。首先看两个极端定义。
第一个极端是「达到了法定婚龄且保持未婚的男性」。按照这个极端标准,中国 2010 年就有 6000 万 22 岁以上的未婚男性,占所有达到法定婚龄男性的 13.1%。
第二个极端是「活过法定婚龄,且直到死亡都保持未婚的男性」。按照这个标准,2009 到 2010 年一整年里死亡了 416 万名 22 岁以上男性,其中 19 万终生未婚,占比 4.7%。
第一个极端定义,显然是大大高估了单身汉的数量。而第二个极端定义,其实就是 @SlowMover 的回答所提到的情况,如果在同龄女性里找不到配偶,就往别的年龄段找。如果始终找不到,然后就这么死了,那就成了「真正的单身汉」。我们今天就计算这样一个数字:在性别比高达 120:100 的情况下,2000 年出生的男性(在 5 年后逐渐进入婚姻市场),有多少比例会成为第二种定义下的「真正单身汉」。
一、分年龄结婚概率
首先可以画出下图:
上图显示了 1960、1970 和 1980 年出生的男性这三组人口的随年龄变化的初婚概率。其中前两组来自 2005 年人口小普查,第三组来自 2010 年人口普查数据,因此一些数据为空值。可以看到,随着时间推移,男性的累计初婚概率逐渐降低。1960 年出生男性的 30 岁初婚率为 93.1%,1970 年出生的男性 30 岁的初婚率为 89.1%,1980 年出生的男性的 30 岁初婚率进一步下降到 86.1%。
将三组人口的累计结婚率差分后再相除,可以算出每一个年龄未婚男性在该年龄的结婚概率,如下图。可以看到,25 岁到 26 岁是男性结婚的高峰:1985 年时,一名 25 岁的未婚男性(1960 年出生)有 28.7%的概率在当年结婚;而在 2005 年,一名 25 岁的未婚男性(1980 年出生)只有 22.5%的概率在当年结婚。
二、分年龄结婚概率的影响因素——人口性别比
从上图可以看到,不管何时出生,男性的结婚概率总是先升高再降低。那么,是什么因素导致了分年龄的结婚概率变动呢?当我们只考虑人口性别比时,一个很直接的想法是,对于 25 岁未婚男性来说,如果年龄在 25 岁左右的未婚女性越多,那么他们在当年结婚的概率就越高。
上图显示了 2010 年时所有夫妻的岁数差分布。数据显示,2010 年的夫妻中男性平均高于女性 2 岁,男女同岁比例为 18.3%,女年长于男比例为 17.4%,剩下 64.3%都是男年长于女。男性比女性小 5 岁直到男性比女性年长 15 岁包括了所有夫妻情况的 99%。
以相近年龄的未婚女性数量为自变量,我们可以假设这样一个模型:
其中,Male^{age}为在 age 岁的未婚男性在当年结婚的概率,P^{age}_{f}和 P^{age}_{m}分别表示为 age 岁未婚女性和未婚男性的人口数量,\beta_{i}表示系数,这个函数可以算出一个 0 到 1 之间的数字。
该式的含义为:某年龄未婚男性在当年结婚的概率,等于当年比他小 15 岁的女性未婚人口直到当年比他大 5 岁的女性未婚人口和该年龄男性未婚人口比值的一个函数。当然,结婚年龄不能过小,一个 22 岁的未婚男性的结婚概率肯定不会受到 7 岁未婚女性数量的影响,我们在这里将低于 18 岁的未婚数量全部置为 0,无论男女。
接下来,使用多次人口普查数据整理后,我们可以对这个方程进行回归,计算每一个\beta_{i}的概率边际后,可以得到下图:
上图表示未婚女性与未婚男性的人口比值每增大 1%时,该年龄男性在当年结婚概率的上升程度。将小 15 岁到大 5 岁的 21 个变量全部画在图上,可以发现影响比较显著的年龄段处在[-5 岁,+1 岁]这 7 个年龄区间内,显著性最高的点为-1 与-2 岁。意味着这些年龄段的未婚女性人口数量对于该年龄的未婚男性结婚概率影响最为显著。
用通俗的语言来说的话,假设你是一名 30 岁未婚男性,那么:
当 29 岁的未婚女性数量对 30 岁未婚男性数量的比值上升 1%时,你在当年结婚的概率上升 0.054%;
当 28 岁的未婚女性数量对 30 岁未婚男性数量的比值上升 1%时,你在当年结婚的概率上升 0.017%;对你的结婚概率有显著影响的是 25 至 31 岁未婚女性数量。因此,即使 20 岁的未婚女性数量对 30 岁未婚男性数量的比值上升许多,你结婚概率不会有多少变化——当年龄差别太大时,处对象毕竟还是比较困难一点。
这个 21 个变量的模型能够解释所有年份出生的男性在各个年龄结婚概率变动的 67%。因此,我们有把握说,使用人口模型预测出的各年份未婚人口数量,结合这个模型的 21 个系数,将能够很好地预测各年龄的结婚概率。
例如,上图蓝线为 1970 年未婚男性各年龄结婚概率的真实值,红线是用 21 个变量预测出的拟合值,模型预测的结果相当好。最终计算中,我们还加入了年龄哑变量,这可以将整个拟合优度提高到 75%。
三、结婚概率预测
使用 2000、2010 年人口普查数据,可以将 1990 到 2010 年间出生的人口在未来数十年的存活数量推算得十分准确。结合刚才算出的模型,我们可以逐年推算出各年度、各年龄的未婚人口,再逐年推算当年的各年龄结婚概率。
具体来说,使用 2010 年各年龄的未婚男女数量比值,可以算出 2010 年的各年龄结婚率,因此可以推出 2011 年各年龄的未婚男女数量比值,又可以推出 2011 年的各年龄结婚概率。
以此类推,将所有年度的各年龄结婚概率算出来后,取出 2018 年的 18 岁男性结婚概率,2019 年的 19 岁男性结婚概率……即 2000 年男性在各年龄的结婚概率。用 1 减去之后再连乘,就得到了「真正单身汉」比例。
下图为 2000 年出生的男性在各年龄的结婚概率:
可以看到,2000 年出生的男性的结婚概率比 1960 年到 1980 年出生人口的结婚概率都要更低,在结婚概率最高的 26 到 28 岁,也仅有 15%左右的人口能够摆脱单身,而在 1960 年出生的人口中,该年龄段的结婚概率高达 28%,1980 年出生的人口在该年龄段也能够有 20%左右的结婚率。
在这组概率的连乘下,2000 年出生的男性将有 14.1%在 2050 年仍然单身,约为该年龄人口的七分之一——作为对比,一个 1960 年出生的男性在 50 岁的单身率为 3.04%,而一个 2000 年出生的女性在 50 岁的单身率仅为千分之三。此时,由于几乎所有相近年龄的女性都已经结婚,50 岁以上的男性不会再有结婚的机会。
因此,如果整个婚姻模式没有大的改变,那么这七分之一男性,都将成为「真正单身汉」,单身到死。
2015-01-22
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。