在公共产品博弈中基于声誉和习惯的可持续合作外文翻译资料

 2022-04-10 10:04

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


在公共产品博弈中基于声誉和习惯的可持续合作

摘要:声誉可以促进人与人在公共产品博弈中的合作,而人与人之间的合作不是单纯的经济理性行为,所以习惯也会影响他们的行为。一个人的习惯可以通过日常生活中的重复行为来形成,同时也会受到习惯偏好的影响。我们旨在调查基于声誉和习惯形成的可持续合作,为了更好地调查声誉和习惯偏好对合作的演变和可持续性的影响,我们引入了三种类型的agents到空间中的公共品博弈。通过数值模拟,我们发现较大的习惯偏好使合作更容易产生和维持。另外,我们发现一定数量的想要获得更高声誉(ICs)的agents对合作的可持续性有最好的效果。最后,我们发现ICs捐赠的变化会很大程度上的影响公共品博弈的均衡性。当ICs减少他们的捐赠时,适当的贡献对维持合作行为将会更好。

1.介绍

每个人都可以自由使用的公共物品的问题曾在很多社会困境中出现(Hardin, 1968,1998;Berkes et al.,1989;Ostrom et al.,1999;Orbell and Dawes, 1996)。因此,对于研究人员来说,促进合作是一个长期的追求。演化博弈理论已经成为研究各种社会困境合作最普遍的方法之一(Nowak,2006)。在演化博弈论体系中,公共产品博弈(PGG=Public Goods Game)被认为是研究合作演化的经典模型(Binmore,1994)。在一个经典的公共产品博弈(PGG)中,选择合作的个体会为公共池贡献c,而背叛个体选择不贡献。总贡献值乘以因子r,然后分配给所有小组成员。在这里,我们就可以发现背叛总是最好的策略。合作已经成为一种社会困境(Wanget al.,2009; Axelrod and Hamilton, 1981; Wedekind and Milinski,2000; Rand and Nowak, 2013)。

习惯上,参与公共产品博弈(PGG)的agents都被认定为理性和利己主义者。然而,最近很多研究表明,无论出于何种目的,许多人都愿意为公共物品作出牺牲(Hauser et al.,2014)。为了解释合作行为的产生和维持,已经提出了许多促进合作的机制(Wu et al., 2014; Chatterjee et al., 2012; Milinski et al., 2002; Rocaand Helbing, 2011;Lu,2015;Forsyth and Hauert, 2011; Ohtsukiet al.,2015)。Hauert等人提出了PGG的自愿参与机制,并发现合作可以由孤独者推动(Hauer and Szaboacute;,2003;Hauert et al.,2002)。Santos等人指出,社会多样性可以促进和保持合作行为,并解释了基于声誉和惩罚的合作的产生(Santos et al.,2008)。Cheng-YiiXia等人介绍了有不同策略转移可能性的人可以推动合作(Zhu et al.,2014)。

更重要的是,许多理论学家已经表明合作也可以通过间接互惠来促进(Nowak and Sigmund,2005, 1998; Lotem et al., 1999)。人们通过帮助他人建立良好的声誉或者正面的形象(Nowak and Sigmund, 1998,2005; Alexander, 1987)。Milinski的研究表明,当人类的主动与间接互惠博弈交替时,这种交替能够在公共品博弈(PGG)中产生高水平的合作(Semmann et al.,2004)。Semmann等人(2005)研究表明,声誉是促进公共品博弈(PGG)合作和维持公共资源的动力,人们很有可能做出更多贡献,同时这些额外的捐赠可以提高他们的声誉(Vugt and Hardy,2010)。实际上,这与现实情况非常相似。总有一些人给公共社会捐赠为了赢得声誉,比如一些企业家。他们希望通过慈善捐赠来建立良好的声誉,然后他们可以通过良好声誉获得一定的好处,从而使他们长期受益(Wedekind and Braithwaite,2010)。事实上,人们生活在不同的社交网络中,他们的行为将在许多网络中被观察到,当不同的网络交织在一起时,由于总体收益的变化,会影响到人们的合作水平(Deng et al.,2016)。如果我们对其他人慷慨,此时那些正在观察我们的行为的,我们称之为观察者的人,会认为我们也会慷慨地对待他们。相反,如果我们很讨厌别人,观察者们在将来会希望避免与我们打交道。声誉在社交网络中发挥着重要作用,并且会创造出那些非合作者无法获得的机会(Van Vugt et al.,2007)。因此,在人们作出决定时,不仅要考虑到PGG的收益,还要考虑他们在其他网络中行为的收益。这就是我们称这些收益为长期利益,并且有人愿意贡献更多的原因。例如,许多企业家会做慈善事业,以建立良好的社会声誉。这些行为可以提高他们的品牌知名度,使他们能够获得更多的收益,就像广告一样。然而,捐赠者不会一直在现实世界中捐赠更多的公共产品,这是为了方便在某个时候减少捐赠的数量。此外,他们的声誉也将随着捐赠数量变化而变化。

因此,根据这种情况,我们这里的目标是调查合作的可持续性。现有的研究主要介绍了声誉机制可以推动合作行为。如上所述,一些人例如企业家愿意为了获得从他人来的声誉而贡献更多。这些思想促使他们在公共品博弈(PGG)中进行合作,并且他们的行为会对邻居产生影响,从而能显著促进合作。尽管如此,在现实世界中,他们捐赠的边际效用将会下降。由于敏感性下降,邻居们会慢慢适应他们的行为(Wathieu,2004),这意味着他们声誉的增加将逐渐减少。因此,他们将来会减少捐款。当时合作行为会如何改变?我们假设三种类型的agents随机分布在一个正方形格子上(Roca et al., 2009; Nowak and May, 1992; Szolnoki et al., 2009a; Liet al., 1847; Wang and Chen, 2015),包括投资者(IC),合作者(C),叛逃者(D)。投资者是想通过得到声誉而获得长期利益的人,他们总是合作,但他们可以独立地改变他们的捐款。他们将空间公共品博弈(PGG)中开始时贡献更多并且在未来减少贡献。当他们提供额外的捐赠时,他们的声誉将会增加,相反,当他们减少捐款时,声誉会减少。他们声誉的价值将受到一个参数h的影响,我们称之为习惯偏好,它表示ICs额外的贡献或减少的贡献造成的影响程度。值得注意的是,投资者贡献更多的目的是为了获得长期利益,因此我们可以将他们的声誉视为他们在PGG中获得的好处。基于上述假设,我们主要研究投资者的重要性和观察习惯偏好的影响,ICs的数量以及其捐赠变化对空间公共品博弈(PGG)合作演化的影响。本文组织如下:我们在第二部分介绍了我们的模型。在第三节中给出数值模拟结果。在第四节中提供结论。

2.具有三种类型agent的PGG模型

在具有周期性边界条件的Ltimes;L规则网格上,我们用三种类型的agents(ICs,Cs和Ds)模拟我们的模型。我们假设N个agents随机分布在方格中,每个agent i有k个邻居。最初,ICs的比例是动态的以满足实验需求。其他agents被认为是等概率的Cs和Ds。同时,每个agent将同时做出决定。

每个agent加入到G=k 1个公共品博弈(PGG)组中(Szaboacute; and Fath,2007),并根据下面的公式计算回报

(1)

其中r(1lt;rlt;N)代表协同因子(Szolnoki and Perc,2010); 表示agent i(IC,C,D)参与的公共品博弈(PGG)组的集合。j是一组公共品博弈(PGG)组中的一个。和表示分别在公共品博弈(PGG)组j中的ICs和Cs的数量。(=u)代表IC agent捐赠的数量。( = 1)表示C的捐赠。是PGG组j中中央代理的邻居数量。是公共品博弈(PGG)组j中中心agent邻居的数量。是agent i的声誉。我们假设只有ICs有声望,所以和被设置为0. 由等式(3)和(4)计算,/50是agent i通过声誉获得的的长期利益,只有ICs有这些好处。/50有两个原因,首先,从现实的角度来看,投资者可以通过声誉获得收益,然而,如上所述,收益是一种长期利益,这意味着声誉无法立即成为收益,所以这里50可以被视为声誉的时间成本。其次,就数学而言,Ri由方程式(3)和(4)计算,若的数值太大,会让演化过程损失一定的真实性,50是通过实验演化的适当值,它能够使模型更加准确。

此外,想要获得声誉的ICs始终与团队合作并给团队贡献u,随着时间的推移,他们的声誉会随之增加,他们的策略难以被其他人改变,然而Cs和Ds更容易受到ICs的影响。因此,agent Cs和Ds将通过以下列概率随机选择其邻居j(Szaboacute;和Fath,2007)更新其策略:

(2)

其中K表示邻居噪声的影响,我们在此基础上设定K=0.1(Szaboacute; and Hauert,2002)。根据这个公式我们可以知道,具有较高回报的agent将会以高概率被选择。

一开始,我们假设ICs为团队贡献u=2,同时他们的声望会随着时间增加,但声誉的增加会随着时间的推移而减少。在现实世界的系统中,像ICs这样的人也无法一直获得别人的声誉,因此他们的声誉是具有临界的数值。声誉的增加受到参数h的影响,我们称之为习惯偏好。所以我们可以按如下方式计算ICs的声誉:

(3)

当他们的声望达到最高时,声誉不会随着时间而提高。首先,系统将达到平衡,当tle;1000时,为了观察系统的稳定性,我们不会改变u的值。然后当tgt;1000时,我们降低u的数值。而ICs的声誉将会改变如下:

(4)

其中R(t)表示在t(tgt;1000)时间步长的ICs的声誉,并且R(t)的值总是正的。等式(3)和(4)是用来计算投资者每隔一个时间步长的声誉值。前者等式(3)表明声誉的提升,h表示习惯偏好,u表示ICs的捐赠,u设为2。u-1意味着如果贡献更多的钱,ICs可以获得更多的声誉,反之亦然。1-ht表示声誉增加值会随着时间的推移而减少。对于等式(4),首先,我们应该知道,当tgt;1000时,我们减少u的值,然后IC的声誉开始下降,所以当我们计算ICs的声誉时,我们需要减去1000。2-u意味着如果他们减少更多的钱,声誉会降低得更快。这两个等式都表明ICs的行为可能会失去声誉。然而,他们行为的影响会随着时间的推移逐渐减少并最终消失。

Fig.1 对于不同h值的合作者比例(P)的随时间的演变。最初,ICs的比例被设定为0.25,Cs和Ds的比例分别设为0.375,u的值设为2。当tgt;1000时,u的值为1.2,h的值设定为0.0004,0.0006,0.0008和0.001。图形中的每个数据都是在经过20次独立运行的5000个时间步长后,以平均1000多个时间步长获得的。

3.仿真和分析

在平方格上,有许多研究合作演化的仿真,以前的研究表明,只有当公共品博弈(PGG)中的r/Ggt;0.76时才能出现合作(Szolnoki et al.,2009b)。因此,主要参数设定为L=100,N=Ltimes;L=10,000,协同因子r=3(对结果的影响不明显)。冯诺依曼邻居数量k=4。其他重要参数提供如下分析:

图1显示了演化过程中不同h对应的合作的比例P。首先,我们只考虑ICs声誉的增长过程,在此期间,我们可以看到,与反叛策略对比合作战略是一种平衡方法,然后我们将u的值减小到1.2。毫不奇怪,合作者的比例会急剧下降,但随着时间的推移,合作行为会得到明显的提高。图2显示了许多agents在t=100时的反叛,只有一些小的合作集群会抵制背叛者的产生(Wang and Chen,2015)。一方面,ICs减少了他们的捐款,他们将被大多数邻居视为反叛者;另一方面,ICs仍然可以用声誉影响其邻居,所以ICs的大多数邻居都会反叛。然而,随着时间的推移,图3显示IC的声誉正在下降,这意味着他们对邻居的影响力会下降。从图3可以看出,随着ICs声誉的下降,合作者的比例将会增加。另外,图1指出agents在有较大的h的情况下会尽快达成合作。较大的h也可以慢慢地提高声望。这也意味着ICs的声誉可能会更快降低,因此较大的h可以加速合作。例如,北京政府在2014年提高了地铁票价,最初,许多公民对这项政策并不满意,但是,他们在外出时习惯于乘坐地铁,随着时间的推移,他们接受价格上涨。因为政府提供地铁是为了让公民养成习惯,这意味着它会创造了公民的需求以至于人们不想改变他们的习惯,因此他们愿意为这项公共利益付出代价。

Fig.2 系统特征快照,包括不同时间步长的ICs(黄色),Cs(蓝色)和Ds(红色)。最初,ICs的比例设定为0.25,Cs和Ds在整个正方形网格上随机分布。参数值是h=0.001,r=3,u=1.2。(a)t=0,(b)t=1000,(c)t=1001,以及(d)t=5000.(为了解释这个图例中的颜色参考,读者参考web版文章)。

Fig.3 合作者比例和ICs的声誉随时间演变。最初,参数值是h=0.001,r=3,u=2。当tgt;1000时,u的值被设置为1.2。图形中的每个数据都是在经过20次独立运行的5000个时间步长后,以平均1000多个时间步长获得的。

Fig.4 ICs的不同部分的合作者比例(P)的随时间的演变。初始时,h的值被设置为0.001并且u的值被设置为2。当tgt;1000时,u的值被设置为是1.2,IC的比例设定为0.1,0.2和0.3。图形中的每个数据都是在足足20次独立运行的5000个时间步长之后,以平均1000多个时间步长获得的。

Fig.5 不同的u对应的合作演化。最初,ICs的比例设定为0.25。Cs和Ds的分数分别设定为0.

全文共8049字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[14324],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。