3.4 基于逻辑斯蒂回归的降雨诱发山地公路地质灾害预测模型
研究山地公路地质灾害发生的概率问题可运用统计学中的相关理论来解决,首先对影响山地公路地质灾害发生的诸多因素进行分析,进而选择部分决定性因素作为因变量,地质灾害的发生概率作为响应变量,然后利用合适的数学模型进行预测即可。然而山地公路地质灾害问题有其特殊性。经验表明,若想精准地计量某个潜在地质灾害点在某时某刻将会发生灾变的概率是十分困难的。相反的,我们可以很轻松地认知如下事实:某灾害影响因素发生变化后,经过可计量的时间段后到底灾变有没有发生。
换一种思路,在拥有大量前期资料积累的情况,我们可统计某导致灾变的因变量发生变化后,其影响范围内潜在灾害点的灾变频数——产生灾变的数量和未产生灾变的数量能够识别。暂时不考虑因变量是否连续,基于上述认识后可以肯定的是我们所研究的“降雨诱发山地公路地质灾害”问题,其响应变量实为离散变量,变量值是“发生”或“不发生”。因此,这种问题显然不能通过线性回归分析予以解决,而Logistic回归分析为解决相应变量是离散型的问题提供了基本方法。
“极端降雨与山地公路地质灾害相关性研究”目的在于探寻降雨指标发生变化后,其影响范围内地质灾害的响应情况。在上述问题中,降雨指标(有效降雨量)是因变量,地质灾害发生或不发生是响应变量,Logistic回归分析可用于定量化描述该问题。本书将运用二值Logistic回归模型对统计到的降雨诱发重庆公路地质灾害问题进行分析,并分别研究山地公路沿线滑坡、崩塌地质灾害对有效降雨量指标的响应规律。
3.4.1 二值Logistic回归分析的适用性
表3.5是研究区内滑坡、崩塌地质灾害发生频数随有效降雨量变化统计表。从表中可以看出,山地公路沿线滑坡、崩塌地质灾害的灾变率具有随有效降雨量的增加而增长的趋势,但这是否为规律性的结果?或能否给出描述其变化规律的数学模型?要想给出明确的结论则需要对数据进行回归分析。很显然,若用灾变率p直接作为因变量y进行线性回归效果肯定不理想,原因有二:一是p值区间并非无穷区间;二是因变量和响应变量之间并非完全线性相关。因此,可在对p值进行变换的基础上对统计数据做Logistic回归分析。
1)“优势比”的定义
现定义“灾害发生”和“灾害不发生”两种结果出现的概率之比为“优势比”或“差异比”(odds ratio),数学表达式为:
当灾变率从0变化到1时,优势比从0变化到正无穷。当灾变率从不可能(p = 0)慢慢增长时,优势比逐渐增大;当事件出现概率恰好为1/ 2时,优势比将等于1,即“发生灾变”或“不发生灾变”的可能性相等;一旦灾变率大于1/ 2,优势比将大于1,即“发生灾变”比“不发生灾变”的可能性大很多;p值越来越大时,优势比也越来越大,这说明“发生灾变”比“不发生灾变”的可能性在增长,直到p→1时优势比趋于无穷,表示灾变肯定发生。
2)Logistic函数
“优势比”的取值范围从0到正无穷,根据经典数学的常识可知其对数范围覆盖整个实数轴,因此“优势比”的对数可作为回归分析的响应变量。即:
此时可建立响应变量y与因变量x(有效降雨量)线性回归方程:
反解上式后,可得:
上式被称为Logistic函数。当x从负无穷变到正无穷时,y也从负无穷变到正无穷,即它们取整个实数轴时,p从0变到1。因此上述表达式可用于描述地质灾害随有效降雨量的变化规律,由此可进一步得到降雨诱发山地公路地质灾害预测模型。
3.4.2 山地公路地质灾害发生概率的Logistic回归分析
1)滑坡灾害
以山地公路滑坡灾害为例对表3.6中的统计数据进行二值Logistic回归分析。
表3.6 滑坡、崩塌灾害灾变率与有效降雨量统计数据表
(1)Logistic回归表
二值Logistic回归分析后首先得到回归分析表(表3.7),由表中的数据可得到回归方程,同时能够在一定程度上对回归效果进行了检验。
表3.7 Logistic回归表(滑坡灾害)
表3.7首先给出了Logistic回归方程:
由此可推导出滑坡灾害灾变率预测的数学模型,如式3.12所示:
表3.7最后一行给出了“检验所有斜率是否为零”的结果,得知G统计量的值为G = 415.465,DF = 1,P值= 0.000。说明整个模型的效果是显著的,在自变量效应的检验中,其系数为0.199 1,这表示有效降雨量每增加一级,将增加0.199 1,也即优势比将增加e0.199 1= 1.01倍。
(2)拟合优度检验
从表3.8可进一步观察回归方程拟合效果,3种检验方法的p值(H0:拟合物显著差异;H1:拟合有显著差异)都大于0.05,故可以认为拟合效果是满意的。图3.5给出了实测灾变概率和模型预测灾变概率的对比图,可见两者是很接近的。
表3.8 拟合优度检验(滑坡灾害)
(3)相联度量
鉴于找到了规律性的结果离能够准确预报还差很远。因此,本书用实际观测值与预测数值之间的相联度量来衡量预测结果的准确性(表3.9)。
图3.5 滑坡灾害灾变概率与有效降雨量序列图
表3.9 实测灾变概率和预测概论之间的相联度量
在原始统计数据表中共有发生灾变的灾害点532处、未发生灾变的灾害点365处,所有可能搭配的“配对”共计532 ×365 =194 180个,然后逐一检查是否都是“有效降雨量高则灾变率高”,符合这一规律的有162 610对,占总观测值的83.7%;不符合这一规律者有20 182对,占观测值的10.4%,有效降雨量持平者(称为“结”),一共11 388对,占5.9%。由此可知,预测效果满意度很高,模型可靠。
2)崩塌灾害
对崩塌地质灾害,其回归方法和模型的检验方法与滑坡灾害基本相同,本书仅给出Logistic回归模型3.12、模型计算效果比照图3.6:
图3.6 崩塌灾害灾变概率与有效降雨量序列图
3.4.3 预测模型在危险性区划中的应用
1)单因素危险性等级划分
根据Logistic回归模型可计算出任意灾变率所对应的有效降雨量。对于目前地质灾害危险性评价的各种综合集成方法而言,评价之前均需事先对各种单因素对应的危险性等级进行定量划分,该模型的导出为上述工作奠定了基础。滑坡灾害根据数学模型和灾变概率与有效降雨量的序列图可把有效降雨量针对地质灾害的危险性等级由低到高依次划分为[0,30)、[30,80)、[80,120)、[120,170)、[170,∞);崩塌灾害的危险性等级由低到高依次划分为[0,30)、[30,70)、[70,100)、[100,160)、[160,∞)。
2)极端降雨阈值的确定
有效降雨量的预测模型可应用于山地公路地质灾害危险性区划中极端降雨阈值的确定。如:采用模糊综合评判的方法对重庆市国省干线公路地质灾害的危险性进行区划,当有效降雨量达到200 mm时,该区域内80%的路段将处于滑坡高度危险区,而80%恰是该区域的可接受水平临界值,于是200 mm的有效降雨量成为区域滑坡灾害预警的临界值,由有效降雨量反推得到的当日降雨量即为即时预报的极端降雨阈值。因前期累积降雨量是动态变化的,所以,极端降雨阈值同样为动态变化。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。