5.3.1 三方演化博弈模型的构建
本书中所阐述的运营方、员工、乘客的有限理性博弈,是指运营方企业的安全监管部门对部门员工进行监管,同时员工能够遵守运营方制订的运营规范和规章制度要求,乘客在运营过程中也要遵守现场员工的运营安排,保证乘客自身利益的实现,从而实现轨道交通运营风险防范的三方博弈均衡。
1)三方博弈的行动假设
(1)运营方的自身监管部门可以选择的行动假设为:A={认真监管、不认真监管}。
(2)员工可以选择的行动假设为:B={遵守规章制度、违反规章制度}。
(3)乘客可以选择的行动假设:C={服从运营组织安排、不服从运营组织安排}。
2)博弈模型中各博弈行为参数的设定和说明
N:乘客选择服从员工指令完成出行的基准收益;
E:乘客不选择服从员工指令出行时获得的额外收益;
L:员工选择不严格遵守轨道交通运营保障规章制度的博弈行为,乘客的不安全行为被发现时的潜在损失;
D:乘客因选择不服从博弈行为时,被员工发现受到的潜在惩罚;
a:遵守规章制度的员工对乘客不安全行为的防范能力,体现了员工发现风险的概率;
r:员工在运营管理中遵守规章制度的认真程度;
G:员工选择严格遵守轨道交通运营保障规章制度博弈行为时的基准收益;
w:乘客选择不服从博弈行为时,为员工创造的额外收益;
c1:乘客出行选择服从博弈行为时员工的遵守成本;
c2:乘客出行选择不服从博弈行为时员工的遵守成本;
y1:当运营方选择严格监管博弈行为时发现员工不认真遵守规章制度的概率;
y2:当运营方选择不严格监管博弈行为时发现员工不认真遵守规章制度的概率;
H:正常运营时运营方的收益;
M:运营方因乘客不安全行为未被发现而受到的潜在损失;
O:运营方因员工不认真遵守规章制度未被发现而受到的潜在损失;
b:运营方监管的能力;
s:运营方监管的认真程度;
n1:运营方严格监管的成本;
n2:运营方不严格监管的成本。
为建立复制动态方程,下面进行博弈分析:
(1)当运营方选择严格监管并处理、员工选择严格遵守运营的规章制度、乘客选择服从运营组织的战略组合时,乘客的收益为其基准收益N;员工收益为G-c1,即在员工基准收益的基础上减掉严格遵守规章制度而投入的成本;运营方收益为其基准收益H-n1。
(2)当运营方选择严格监管、员工选择严格遵守规章制度、乘客选择不服从运营组织安排的战略组合时,乘客的收益为(1-a)(1-b)E+N-(a+b)D,即其平均收益为不服从运营组织安排未被发现时的收益减掉不服从运营组织安排被发现的收益;员工的收益为G+(1-a)(1-b)w-C2,即基准收益加上乘客不服从运营组织安排未被发现而为员工创造的额外收益减掉员工不遵守规章制度的成本;运营方的收益为H-(1-a)(1-b)M-n1,即运营方的基准收益减掉因乘客不服从运营组织安排未被发现而带来的潜在损失。
(3)当运营方选择严格监管、员工选择不严格遵守规章制度、乘客选择服从运营组织安排的战略组合时,乘客的收益为N,即乘客的基准收益;员工的收益为a3=G-rC1-y1L,即员工的基准收益减掉不认真遵守规章制度所支付的成本和不认真遵守规章制度被运营方发现而受到的惩罚;运营方的收益为H-(1-y1)O-n1,即运营方的基准收益减掉员工不执行运营组织安排未被发现而受到的潜在损失。
(4)当选择运营方严格监管、员工选择不严格遵守规章制度、乘客选择不执行运营组织安排的战略组合时,乘客的收益为(1-ra)(1-b)E+N-(ra+b)D,即不执行运营组织安排未被发现带来的收益减掉不执行运营组织安排被发现所受到的惩罚;员工的收益为a4=G+(1-ra)(1-b)w-rC2-y1L,即基准收益加因乘客不执行运营组织安排而收到的额外收益减掉被运营方发现受到的惩罚;运营方的收益为c4=H-(1-ra)(1-b)M-(1-y1)O-n1,即运营方的基准收益减掉乘客不执行运营组织安排未被发现而受到的潜在损失,再减掉员工不执行运营组织安排未能发现而受到的潜在损失。
(5)当运营方选择不严格监管、员工选择严格遵守规章制度、乘客选择服从运营组织安排的战略组合时,乘客的收益为N,即基准收益;员工收益为G-C1,即在员工基准收益的基础上减掉严格遵守规章制度而投入的成本;运营方收益为其基准收益H-n2。
(6)当运营方选择不严格监管、员工选择严格遵守规章、乘客选择不服从运营组织安排的战略组合时,乘客的收益为(1-a)(1-sb)E+N-(a+sb)D,即其平均收益为不执行运营组织安排未被发现时的收益减掉不执行运营组织安排被发现的收益;员工的收益为G+(1-a)(1-sb)w-C2,即基准收益加上乘客不服从运营组织安排未被发现而为员工创造的额外收益减掉不严格遵守规章制度的成本;运营方的收益为H-(1-a)(1-sb)M-n2,即运营方的基准收益减掉因乘客不执行运营组织安排未被发现而带来的潜在损失。
(7)当运营方选择不严格监管、员工选择不严格遵守规章制度、乘客选择服从运营组织安排的战略组合时,乘客的收益为N,即乘客的基准收益;员工的收益为a7=G-rC1-y2L,即员工的基准收益减掉不认真遵守规章制度所支付的成本和不认真遵守规章制度被运营方发现而受到的惩罚;运营方的收益为H-(1-y2)O-n2,即运营方的基准收益减掉员工不服从运营组织安排未被发现而受到的潜在损失。
(8)当运营方选择不严格监管、员工选择不严格遵守规章制度、乘客选择不服从运营组织安排的战略组合时,乘客的收益为(1-ra)(1-sb)E+N-(ra+sb)D,即不服从运营组织安排未被发现带来的收益减掉不服从运营组织安排被发现所受到的惩罚;员工的收益为G+(1-ra)(1-sb)w-rC2-y2L,即基准收益加上因乘客不服从运营组织安排而收到的额外收益减掉被运营方发现受到的惩罚;运营方的收益为H-(1-ra)(1-sb)M-(1-y2)O-n2,即运营方的基准收益减掉乘客不服从运营组织安排被发现而受到的损失和不服从运营组织安排未被发现而受到的潜在损失。
综上所述,可以得到员工、乘客、运营方三方在不同博弈行为下的期望收益如表5.3和表5.4所示:
表5.3 运营方严格监管下的员工、乘客、运营方得益矩阵
表5.4 运营方不严格监管下的员工、乘客、运营方得益矩阵
5.3.2 期望得益及复制动态方程分析
假设在三方博弈的初始时刻,轨道交通运营管理中的员工选择严格遵守运营操作规范博弈行为的概率为x;乘客在出行过程中选择服从运营组织安排的博弈行为的概率为y;运营方选择严格监管的概率为z。
根据演化博弈论的期望收益和复制动态方程:设xi表示群体中采取纯策略i的比例,当群体的状态为x=(x1,x2,…,xk)时,任何纯策略ei∈E(E为相应的混合策略集)在随机配对中得到的收益为u(ei,x),u(x,x)=xiu(ei,x)表示群体的平均期望收益即随机从群体中抽取的收益。
根据上文分析可以得到员工、乘客、运营方三方在不同博弈行为下的期望收益为:
e11=yza1+(1-y)za3+y(1-z)a5+(1-y)(1-z)a7,
e12=yza2+(1-y)za4+y(1-z)a6+(1-y)(1-z)a8,
e1=xe11+(1-x)e12,
e21=xzb1+(1-x)zb3+x(1-z)b5+(1-x)(1-z)b7,
e22=xzb2+(1-x)zb4+x(1-z)b6+(1-x)(1-z)b8,
e2=ye21+(1-y)e22,
e31=xyc1+x(1-y)c3+(1-x)yc5+(1-x)(1-y)c7,
e32=xyc2+x(1-y)c4+(1-x)yc6+(1-x)(1-y)c8,
e3=ze31+(1-z)e32,
则xi的复制动态方程可以用如下的微分方程表示:=xi[u(ei,x)-u(x,x)],则三方以此为基础可以建立如下的复制动态系统:
5.3.3 演化稳定策略分析
本书建立的是一个员工、乘客、运营方的三方博弈,根据演化博弈的稳定策略方法:对于任何一个初始点,经过静态进化之后,静态复制系统轨线上的点只有在[x(t),y(t),z(t)]∈[0,1]×[0,1]×[0,1]时才有意义,动态复制系统平衡点所对应的策略组合为演化博弈的一个均衡。根据上文的计算结果对均衡点进行稳定策略分析。
(1)定理5.1 均衡点(1,1,1)不是进化稳定策略(ESS)。
证明:对于(1,1,1)均衡点,其复制动态方程的三个特征值分别为:
-a1+a3,-b1+b2,c5-c1,代入整理得
a3-a1=(G-rc1-y1L)-(G-c1)=(1-r)c1-y1L;
-b1+b2=(1-a)(1-b)E+N-(a+b)D-N=(1-a)(1-b)E-(a+b)D;
c5-c1=(H-n2)-(H-n1)=n1-n2>0。
因为特征值中有一个为正的,所以均衡点(1,1,1)不是进化稳定策略(ESS)。
(2)定理5.2 当(1-r)<且时,均衡点(1,1,0)是演化稳定策略。
证明:因为对于(1,1,0)均衡点,其复制动态方程的三个特征值分别为:
-a5+a7,-b5+b6,-c5+c1,
若使a7-a5=G-Rc1-y2L-G+c1=(1-r)c1-y2L<0,必有
若使b6-b5=(1-a)(1-sb)E+N-(a+sb)D-N=(1-a)(1-sb)E-(a+sb)D<0,必有
显然,c1-c5=H-n1-(H-n2)=n2-n1<0,从而,当(1-r)<且)时,均衡点(1,1,0)是进化稳定策略。
策略分析:当员工不严格遵守规章制度带来的损失大于成本一定值时,员工在运营服务中会选择严格遵守规章制度;当乘客在出行中不执行运营组织的安排所带来的损失大于成本一定值时,乘客会选择执行运营组织的安排;运营方选择严格监管运营保障服务的成本大于其不严格监管而导致的事故损失时,会倾向选择不严格监管运营保障服务。
(3)定理5.3 当1-r<,<且<(1-a)(1-s)b时,均衡点(1,0,1)是演化稳定策略。
证明:因为对于(1,0,1)均衡点,其复制动态方程的三个特征值分别为:
a4-a2,b1-b2,c6-c2,
若使a4-a2=[G+(1-ra)w-rc2-y1L]-[G+(1-a)w-c2]
=(1-ra)w-(1-a)w-rc2+c2-y1L
=aw(1-r)+(1-r)c2-y1L
=(1-r)(aw+c2)-y1L<0,
必有1-r<。
若使b1-b2=N-[(1-b)(1-a)E-aD+N-bD]
=(a+b)D-(1-b)(1-a)E<0,
必有。
若使c6-c2=H-(1-a)(1-sb)M-n2-H+(1-a)(1-b)M+n1
=(1-a)M(1-b-1+sb)+(n1-n2)
=-(1-a)M(1-s)b+(n1-n2)<0,
必有<(1-a)(1-s)b。
从而,当1-r<,且<(1-a)(1-s)b时,均衡点(1,0,1)是演化稳定策略。
策略分析:当员工不严格遵守规章制度所带来的损失比遵守规章制度的成本大于一定值时,员工会选择严格遵守规章制度;当乘客出行时执行运营组织的安排所带来的成本比不执行运营组织安排所带来的损失大于一定值时,乘客会选择不执行;当运营方严格监管的成本比不严格监管所带来的损失小于一定值时,运营方会选择严格监管。
(4)定理5.4 当1-r>,)且<y2-y1时,均衡点(0,1,1)是演化稳定策略。
证明:因为对于(0,1,1)均衡点,其复制动态方程的三个特征值分别为:
a1-a3,b4-b5,c7-c3,
若使a1-a3=(G-c1)-(G-rc1-y1L)
=rc1+y1L-c1
=(r-1)c1+y1L<0,
必有1-r>。
若使b4-b5=(1-ra)(1-b)E+N-(ra+b)D-N
=(1-ra)(1-b)E-(ra+b)D<0,
必有。
若使c7-c3=H-(1-y2)O-n2-H+(1-y1)O+n1
=(n1-n2)+O(y2-y1)<0,
必有<y2-y1。
从而,当1-r>,且<y2-y1时,均衡点(0,1,1)是演化稳定策略。
策略分析:当员工不遵守规定制度所带来的损失比严格遵守规章的成本小于一定值时,员工会选择不严格遵守规章制度;当乘客执行运营组织安排所带来的收益比不执行运营组织安排的损失大于一定值时,乘客会选择严格执行运营组织安排;当运营方严格监管的成本比不严格监管的损失小于一定值时,运营方会选择严格监管。
(5)定理5.5 当(1-sb)(1-r)Ma+(1-y2)O>0,<且<时,均衡点(1,0,0)是演化稳定策略。
证明:因为对于(1,0,0)均衡点,其复制动态方程的三个特征值分别为:
-a6+a8,b5-b6,-c6+c2,
若使
a8-a6=H-(1-ra)(1-sb)M-(1-y2)O-H+(1-a)(1-sb)M
=(1-sb)M(1-a-1-ra)-(1-y2)O
=(1-sb)M(r-1)a-(1-y2)O<0,
必有(1-sb)(1-r)Ma+(1-y2)O>0。
若使b5-b6=N-(1-a)(1-sb)E-N+(a+sb)D
=(a+sb)D-(1-a)(1-sb)E<0,
必有。
若使c2-c6=H-(1-a)(1-b)M-n1-H+(1-a)(1-sb)M+n2
=(1-a)[(1-sb)-(1-b)]M+(n2-n1)
=(1-a)(1-s)bM-(n1-n2)<0,
必有。
从而,当(1-sb)(1-r)Ma+(1-y2)O>0,且时,均衡点(1,0,0)是演化稳定策略。
策略分析:当员工不认真遵守规章制度受到的损失大于一定值时,员工选择严格遵守规章制度;当乘客执行运营组织安排所带来的成本比不执行运营组织安排所带来的损失大于一定值时,乘客会选择不执行运营组织安排;当运营方不严格监管的损失比严格监管的成本差小于一定值时,运营方会选择不严格监管。
(6)定理5.6 当,且>y1-y2时,均衡点(0,1,0)是演化稳定策略。
证明:因为对于(0,1,0)均衡点,其复制动态方程的三个特征值分别为:
a5-a7,-b7+b8,-c7+c3,
若使a5-a7=(G-c1)-(G-rc1-y2c)
=rc1+y2L-c1
=y2L+(r-1)c1<0,
必有y2L<(r-1)c1,。
若使-b7+b8=(1-ra)(1-sb)E+N-(ra+sb)D-N
=(1-ra)(1-sb)E-(ra+sb)D<0,
必有(ra+sb)D>(1-ra)(1-sb)E,。
若使c3-c7=H-(1-y1)O-n1-H+(1-y2)O+n2
=[(1-y2)-(1-y1)]O+(n2-n1)
=(y1-y2)O-(n1-n2)<0,
必有(y1-y2)O<n1-n2,>y1-y2。
从而,当且>y1-y2时,均衡点(0,1,0)是演化稳定策略。
策略分析:当不严格遵守规章制度带来的损失比严格遵守规章制度的成本小于一定值时,员工会选择不严格遵守规章制度;当乘客执行运营组织安排所带来的收益比不执行运营组织安排的损失小于一定值时,乘客会选择执行运营方的安排;当运营严格监管的成本比不严格监管的损失大于一定值时,运营方会选择不严格监管。
(7)定理5.7 当且n1-n2<(1-ra)(1-s)bM+(y1-y2)O时,均衡点(0,0,1)是演化稳定策略。
证明:因为对于(0,0,1)均衡点,其复制动态方程的三个特征值分别为:
a2-a4,-b4+b3,-c4+c8
若使a2-a4=G+(1-a)(1-b)w-c2-G-(1-ra)(1-b)w+rc2+y1L
=(r-1)c2+(1-b)w[(1-a)-(1-ra)]+y1L
=(r-1)c2+(1-b)w(r-1)a+y1L
=(r-1)[c1+(1-b)wa]+y1L<0,
必有。
若使b3-b4=N-(1-ra)(1-b)E-N+(ra+b)D
=(ra+b)D-(1-ra)(1-b)E<0,
必有。
若使c8-c4=H-(1-ra)(1-sb)M-(1-y2)O-n2-H+(1-ra)(1-b)M+(1-y1)O+n1
=M(1-ra)(s-1)b+(n1-n2)+(y2-y1)O,
必有n1-n2<(1-ra)(1-s)bM+(y1-y2)O。
从而,当11且n1-n2<(1-ra)(1-s)bM+(y1-y2)O时,均衡点(0,0,1)是进化稳定策略。
策略分析:当员工不严格遵守规章制度所受到的损失比严格遵守规章制度的成本小于一定值时,员工会选择不严格遵守规章制度;当乘客执行运营组织安排的收益比不执行运营组织安排的损失小于一定值时,乘客会选择不执行运营组织安排;当运营方严格监管时的成本比不严格监管的成本小于一定值时,运营方会选择严格监管。
定理5.8 当(1-sb)(1-r)aw+(1-r)c2>y2L,且(y1-y2)O+(1-ra)(1-s)bM<n1-n2时,均衡点(0,0,0)是演化稳定策略。
证明:因为对于(0,0,0)均衡点,其复制动态方程的三个特征值分别为:
a6-a8,b7-b8,c4-c8,
若使a6-a8=(1-sb)w(r-1)a+(r-1)c2+y2L<0,
必有(1-sb)(1-r)aw+(1-r)c2>y2L。
若使b7-b8=-(1-ra)(1-sb)E+(ra+sb)D<0,
必有。
若使c4-c8=(y1-y2)O+(1-ra)(1-s)bM+(n2-n1)<0,
必有(y1-y2)O+(1-ra)(1-s)bM<n1-n2。
从而,当(1-sb)(1-r)aw+(1-r)c2>y2L,且(y1-y2)O+(1-ra)(1-s)bM<n1-n2时,均衡点(0,0,0)是演化稳定策略。
策略分析:当员工不严格遵守规章制度的损失小于严格遵守规章制度的成本一定值时,员工会选择不严格遵守;当乘客不执行运营组织的收益比不执行运营组织安排所带来的损失大于一定值时,乘客会选择不执行运营组织安排;当运营方严格监管的成本比不严格监管的损失大于一定值时,运营方会选择不严格监管。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。