【双方演化博弈】研究理论学习

发布于:2024-09-18 ⋅ 阅读:(66) ⋅ 点赞:(0)

1. 演化基础

在这里插入图片描述

在这里插入图片描述

1.1.演化博弈常用软件

载学习软件: Matlab、Vensim PLE、 Visio

其中,Matlab和Vensim PLE主要是用做演化博弈仿真,Matlab是演化博弈最常用的仿真软件,VensimPLE是系统动力学(SD)仿真软件也是常用仿真软件之一。

Python、Netlogo等软件也可以用来做演化仿真,但用的比较少。

Visio主要是用作绘制相位图,ppt也可以绘制。

演化博弈的内容比较多,常见的可以分为以下的内容:
两方、三方、四方演化博弈理论与仿真
含有动态奖惩机制的演化博弈
随机演化博弈理论与仿真

1.2. 演化博弈的常见套路(重要的打上五角星)

1.首先确定自己的研究主题
在确定主体的基础上,分析博弈的主体,以及主体之间的博弈焦点
在这里插入图片描述
2.要提出研究研究假设,然后构建出来模型的支付矩阵。

支付矩阵的研究的基础,对后面的模型求解和仿真有重要影响。

3.模型的求解

求解的时候,需要做到单个主体的稳定性,以及系统的稳定性。(其中系统的稳定性包含就是每个主体之间交互的情况)

4.数值仿真
数值仿真,其中非常重要的一点就是参数的赋值 ,需要怎么赋值,附上哪些值都需要一定的参考和考量。

数值仿真一般只做三类的图:系统初始演化路径分析,初始值变动对演化结果的影响,参数的敏感性分析。

2. 两方演化博弈

2.1 假设

首先需要根据具体的领域和情景,提出自己的假设模型,包含了每个主体的选择策略,以及主体之间的收益与成本支出
在这里插入图片描述
在这里插入图片描述

2.2收益矩阵与复制动态方程

根据前面的假设,计算出每个主体,在不同策略下的收益,得到收益支付矩阵
在这里插入图片描述

根据每个策略下的收益策略,计算出每个主体的平均收益,平均收益收到其他主体的影响。
在这里插入图片描述
在计算出平均收益的基础上,套如公式得到主体的复制动态方程:

构建复制动态方程(复制动态方程是一种动态微分方程,可用于描述一个群体采用某一特定策略的频数或频度)|

在这里插入图片描述

2.3单个主体的稳定性分析

单个主体的稳定性分析的判定定理,要使得上文的复制动态方程等于0,且复制动态方程的导数要小于0.
在这里插入图片描述
单个主体的稳定性需要满足两个条件,一个是复制动态方程等于0,另一个是该主体的复制动态方程的导函数小于0

复制动态方程为零:表示在某个策略份额 的情况下,主体的策略份额不再变化。这意味着在这个点上,该策略的收益与其他策略的平均收益相等,主体处于均衡状态。
导函数小于零:
动态方程的导函数 <0 表示在均衡点附近,策略份额的改变会导致相反的动态变化。这意味着:
如果策略份额 略微增加,动态方程的值会略微减少。
如果策略份额 略微减少,动态方程的值会略微增加。

当复制动态=0的时候,说明要m=0,然后1-m等于0两种情况,
在这里插入图片描述
第二就是方程的导函数小于0,所以需要先对函数进行求导,这个方程是关于概率m的一个一元二次函数,所以就对m进行一个求导。后面的设置的成本收益都是常数。
在这里插入图片描述
这时候第二步要判断令导数小于0;

令求解后的导函数为一个新的函数G(n),是一个关于n的函数。因为此时函数里面只有一个n为主体概率。
在这里插入图片描述
此时,要满足当复制动态=0的时,分为两种情况进行分开讨论。

但m1 = 0 时候,原动态方程ft(m)=0,且要满足导函数f’t(m)<0 。由于1-2m>0 ,所以G(n)<0 ,才能使得导函数小于0

但m1 = 1 时候,原动态方程ft(m)=0,且要满足导函数f’t(m)<0 ,由于1-2m<0 ,所以G(n)>0 ,才能使得导函数小于0

所以要找到一个 导函数 = 0 ,时候n的值,解n的值为:
在这里插入图片描述
很好,找到这个点,我们就可以自由的找到这个点左右两边的值是如何大于或者小于0;所有我们要判断一下G(n)是增函数,还是减函数,这样我们就可以知道坐标轴上大概的情况。

如果增函数,那么大于这个n*(原来解得导函数=0时,n的值),就是大于0;反之,同理可得就是小于0
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

2.4 系统的稳定性分析

系统的均衡点分析,就是要联立多个主体的复制动态方程,使他们都等于0,进行求解
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

这时候,让这几个点都等于0,就是让m(1-m)和n(1-n)的值为0,就会得到几个组合的解,这个几个解就叫做纯策略的均衡点

当然还存在一种情况,就是[C + w1 - π(R-F)+ n(β - w1)]和[β - r + m(w2 - β)]的解=0,这就需要连立两个方程进行求解,这个解叫做混合策略均衡点。

在这里插入图片描述

在这里插入图片描述