排队论中有关消费者和服务者的均衡行为外文翻译资料-外文翻译网

英语原文共 46 页

排队论中有关消费者和服务者的均衡行为的文献很多，然而缺少对这方面的综合研究。而且已出版的文献缺乏连贯性，遗留下很多未解决的问题

本书主要目的之一为整合现有文件，另一目的是以统一的形式编辑已知结论，将他们归类，并辨别他们在哪些方面有联系、如何联系，用新的结论弥补某些空白。在一些领域，我们明确提出了开放性问题，我们希望调查能促进深入研究，使研究者认识到开放性问题的重要性。

本书描述的许多想法是经济学中博弈论一般理论的特例。我们通常引用一些参考文献，包括对一件事更通常的处理办法，但我们并未深究细节。

对本书涉及的每一话题，在我们看来，结论是最重要的。我们也呈现了关于相关结论的简单讨论。以下每张内容均简要涉及。

第一章是导论，包括基本定义、模型、解决方法及方法概念等贯穿全书。本章也进一步提出（）简单模型，旨在阐明本书某些重要主题。

第二章研究了基本模型，消费者在观察排队长度之后决定是否加入排队。个体组织（纳什均衡）、社会组织和盈利最大化的不同很重要？我们会讨论规制排队论的许多方式及引导消费者以社会期望的方式行事

第三章展示了与第二章相同的模型，不同的是这次消费者在做决定前无法看到排队长度。我们还讨论了模型的其他特点，如;消费者清楚其准确的服务需求；消费者群体单一化？排队的原则是排队并非谁先到先得。

第四章在消费者享有不同优先权的基础上分析排队问题，在一些模型中，优先权根据顾客类型被设定；在其他模型中，消费者可选择购买优先权，后一种模型主要问题在于如何选择价格能使消费者承担适合的优先权水平，以达到总利润最大化。

第五章关注两类行为，第一种，在等待条件恶化的情况下，消费者有权选择放弃排队。在一个可视化系统中，如果队列过于拥挤，消费者可能放弃排队。在非可视化系统中，放弃排队会导致等待成本增加。这种行为的第二种类型允许消费者在队列中移动，并购买最短队列的相关信息。

第六章解释了一模型，该模型及时提供了在给定点出排队状态的信息。消费者在观察长队列及稍后重试后，短暂离开如服务系统在指定时间开关，提供预订服务及消费者在观察长队列及重试后暂离系统的模型。

第七章研究服务提供商之间的竞争，他们力求在吸引消费者的同时获利最大。我们讨论了价格、优先权及信息是如何用于实现目标的。

第八章讲述服务者关于服务水平的长期经营决策，更好的水平意味着更好的服务，并能吸引更多消费者，但对服务者来说通常意味着较高的成本。

本书的中心问题是，如何减少个体花在排队上的时间。这是一种令人满意的目标，因为等待时长通常被认为是徒劳的，尽管情况并非总是如此。一个作者R.H.回忆起20年前的一个偶然。当排队等待时，他在Ivrine的加利福尼亚大学从他的朋友和同事Ami Glazer那里第一次看到了Naor的著作，自此为本书播下第一粒种子。

第一章

为使财富最大化，服务系统中的消费者的行为是独立的，然而消费者的选择行为受系统内经营者及其他消费者影响。结论是一种聚合均衡的行为模式，从社会整体的角度来看并非最优。长期以来，经济学家已取得类似发现，但在排队论理论方面作出明确解释的仅有1969年Naor论文之后的出版物。早于Naor论文的排队论范畴深受1964年出版的leeman的《Letter to Editor》。它以如下摘录结尾：

有点让人惊讶的是在资本主义经济中，排队论会让自身局限于为减少队列而做出的行政措施的中，有人也许期望在计划经济中遵循此法，然而其在价格和市场主导的经济中并不能担此重任。

Leeman 认为通过为排队系统定价可达到三个目标。第一，通过集中建立优先权来转变来自于时空瓶颈和分配的需求，以此改善现有服务设施的配置，而不是根据先到先得原则。第二去中心化的经营决策，最后是对长期投资决策的引导。Leeman漏掉的第四个重要目标曾被naor开创性论文讲述过，即如果没有这样的措施去规制需求过程，就易造成设施的过度使用。

紧随naor其后的是有关最佳排队控制的广泛研究。我们将关注naor论文的另一领域，即排队系统中的均衡行为。然而，值得注意的是，均衡的概念并非Naor的中心，这里只是含蓄地处理。

基本经济学原理中阐述道：稀缺资源的最优配置，需要这些资源的使用者付出成本。Knudsen注意到在随机排队模型中，意义的缺失比在经济学理论静态确定的模型中更广泛。如果对服务的期望需求小于系统的服务能力，在确定模型中，资源不被视作稀缺。再者，消费者付出的成本可能会增加社会财富，这是因为在任何时候都有一个绝对的可能性：服务水平被充分利用，及时到达率低于服务率时（服务者可容纳所有到达者），会因服务多样性何到达时间间隔的不同而形成队列。一个队列可能被视为系统为保证服务利用而需要付出的代价。因此，经济学最优化的标准在随机和确定两种模型中截然不同。

在我们所述的导论剩余部分，我们讨论了全书将用到的概念，我们也介绍了一个简单模型，其阐明了排队决策中的许多微妙之处。

基本概念

均衡的概念是本书的中心思想，在这一章呈现了重要的背景资料。

贯穿全书的均衡为纳什均衡。

1. 策略、报酬和均衡

非合作博弈定义如下：N表示特定参与者，Ai表示参与者可能的行为。参与者的纯策略行为取自Ai，混合策略和概率相关，其表示一种从Ai中选择行为的随机性。用Si表示对于参与者i的可用策略。

策略组合是属于集合SI中的元素si应用于每个参与者i，每个参与者协助一个真正的报酬函数。函数代表参与者获得的不同报酬，表明策略组合适用于参与者们。

P2公式

我们假设均衡不一定总是存在，实际上，在2.11 ，5.1和7.3节中，我们展现的模型都是均衡不存在的。

在消费者决策之前，我们通常依据能否观测到队列长短将其分类。我们分别举出观察型队列和非观察型队列。在观察型队列中，消费者面临着应对系统状况、由于给定指令作出应对而被召唤的状况。对行为、策略、报酬和均衡的定义也可被延伸至状态独立模型。

比如，一种状态和系统中的许多消费者相符合，行为设置可能包括作为普通消费者加入，作为优先消费者加入，或者根本不加入。纯策略规定了每种状态的一种行为。策略组合及初始状态包括所有状态的概率分布。参与者i取得的报酬取决于状态，他的行为和他人选择的策略。参与者i只对他期望的报酬感兴趣，期望由状态及每种状态下消费者i的行为策略掌控。

1. 稳定状态

当评估一个个体的期望薪酬时，其运用策略x以应对其他使用了策略y的人，我们假设稳态是能够达到的。在大部分模型中都存在着潜在的马尔可夫过程，他的跃迁概率由被所有人选择的共同策略诱发。因此，稳态包含有限概率的标准含义，且对于个体来说服从状态分布。

为了说明这一观点，我们假设出M/M/1排队模型（见第四章），单位时间可能到达四个顾客，单位时间的服务率为五个顾客，顾客进入的概率是0.75。在稳态状态下，考虑加入排队的顾客通过1/(5-4*0.75)来估测他期望的等待时间。当然，如果顾客是第一个或者第二个到达初始为空队列的系统，他的评估可能会有所不同。

当决策者面临不止一种可能的状态时，情况会更所。比如，看看上述决策问题的可视化系统，这种情况下顾客在决策是否加入队列之前就观察了其长短。

1.3子博弈精炼均衡

博弈概念通常的缺点归咎于存在情况不唯一的可能性。我们在此描述，下一部分将作出两点改进，用于减少情况的数量。不同状态间的跃迁概率通常取决于顾客采取的不同策略。特别地，对于一种给定策略和初始状态，某些状态达到稳态状态的可能性为零。当计算顾客期望报酬时，这些状态所获权重为零。因此，对于这些情况规定的行为来说，检验给定策略是否为最好回应是不重要的。比如，（空）这个事实通常导致多点均衡，其中一些是反直觉的。

子博弈精炼均衡规定了所有状态的最好响应，包括那些稳态概率为零的情况。5.2部分准确通过一个子博弈精炼均衡给出了一个多点均衡的例子。有关排队论系统的更多概念参见Hassin和Haviv。

1.4演化稳定策略

根据定义，（对称型）均衡策略是针对自身的最好回应。然而，并不需要独一无二的最好策略。特别地，用y表示均衡策略，

1.5 布雷斯悖论

新的路段增加也许会导致新的均衡，使得所有个体情况恶化。以下的报酬矩阵描述了著名的囚徒困境，（所述的（x，y）表示，x代表行参与者的报酬，y代表列参与者的报酬）

在唯一均衡中，两个参与者都选A。然而，如果他们选B，两者都会得到更高的收益。如果B是唯一选择，他们最终都会得到2，但是一旦选择A出现，得到的新的均衡对两者均有害。

布雷斯以运输模型的内容为例介绍了这一现象，表明增加一条新的路径也许会导致路网中所有出行者的出行时间增加。这种现象通常被称为布雷斯悖论。

这个悖论也表明当参与者的可用信息增加时，会导致所有情况变得更糟。实际上，越多的信息意味着越多决策，因此这种现象和布雷斯悖论一致。在3.2和3.8节将讨论信息增加的带来的影响以及排队系统的布雷斯悖论。

1.6 避免从众还是随波逐流？

在许多排队模型中，策略可以由一个单一数值表示。比如说，4.5节提到的贿赂模型，策略规定服务需要支付多少。在这样的情况下，下列问题会变得有意义。

对一个个体的最好响应是由其他顾客做出策略的单调递增（或递减）函数吗？

F(x，y)表示其他人都选策略y时，选择策略x的顾客的报酬。假设对于任何一个y存在唯一一个最佳对应值x。

函数

我们对关于y的函数x连续、严格单调的情况很感兴趣。图1.1表示策略符合非负的情况。它描述了当一条x（y）单调递减时，另一条在单调递增。ATC和FTC分别称为避免从众和随波逐流。术语背后的基本原理是在FTC中，他人选择的价值越高，其最佳响应越高。

均衡策略y满足函数x（y）=y，换句话说，函数x为固定点。确定模型为ATC或FTC是有趣的，因为很明显，在ATC模型中最多存在一个均衡点，额而在FTC的情况下存在多点均衡。

阈值策略

在这部分我们描述一种阈值策略，这在排队系统中很常见。假设到达的顾客在观察过系统状态的特征值为非负整数变量后，面临两个选择A1和A2。比如，情况也许是队列的长度，行为可能是加入或者犹豫不前。

临界值为n的纯阈值策略规定了（0,1，·········hellip;,n-1）每种状态下的行为为A1,A2hellip;以此类推。

在许多情况下，寻找纯阈值策略的均衡是很自然的。然而，通常可能构建一个实例，比如人群中每个个体使用的临界值为4，则对个体的最好响应是5.如果人群中每个个体采用临界值5，那么最好响应为4。这用到了图1.2中较高的函数。在这种情况下，确定均衡的阈值策略也许不存在。结果是，阈值策略的定义被延伸至如下定义：

临界值为x=n p的阈值策略规定n和n 1的两种纯策略的混合，策略n所占权重为1-p，策略n 1所占权重为p，结果是，在所有选定的结果中，当i lt;=n-1时，选择A1；当i=n时在A1和A2之间随机选择，A1的可能性为p，A2的可能性为1-p，当igt;n时选择A2。如果x是一个整数（p=0），策略为纯策略。否则为混合策略。

让我们感兴趣的是，针对任一策略x，对于个体有最好回应的模型是纯阈值策略：对于整数k，如果属于（0,1,hellip;n-1），则选择A1。否则选择A2。下面的情况很典型：k（x）可能有间断点，每一单位可能上升或下降。在间断点x处，针对x，所述的两种纯策略均能作出最好响应。因此两者混合对于x来说也能作出最好响应。不论整数x还是x的左右领域，都可能达到均衡。在上述两种情况，如果所有的顾客都采取纯阈值策略x，也能达到最好响应，没有人有偏离其他策略的动机。简单来说，这就是均衡策略。

回顾1.6节，非单调增长函数k（x）被视为避免从众（ATC模型），这就意味着其他人采用的阈值越高，对于指定顾客给出的最好响应的阈值越低。同样地，当k（x）代表非单调递减函数时，被视作随波逐流（FTC模型），意味着当其他人采取更高阈值时，对于指定顾客，给出的最好响应的阈值越高。

下面两种情况有很大的不同。在ATC下最多有一个固定点，它可能代表纯策略或混合策略。图1.2表示两条非增长函数，其中，x1包含的均衡策略是单纯的，x2包含的策略是混合的。FTC所含情况更为广泛，其可能含有多点均衡。可以从图1.3中看出k（x）有多个固定点。如果k（x）以整数x的形式出现，并且无跳跃，数据则不会退化。令x1，x2hellip;为固定值。从图1.3中我们可以看出，对于k取1,2，hellip;x（2k 1）时，相对应的是纯策略，而对于x（2k）时，对应混合均衡策略。当我们允许数据退化时，也许会出现连续的纯均衡策略。如果均衡是独一无二的，则为纯策略。

成本和目标

顾客收益的计算要扣除来源于服务的直接成本和来源于等待的间接成本。直接成本与间接成本之和被视为全价，我们假定涉及到的顾客为在报酬和收益相关领域的风险中立者，以便他们使期望价值最大化。

在大部分情况下，假定每个顾客的单位时间价值为常数（记为C），在时间t内花费的总成本为Ct，C的价值因顾客而异。

排队系统也可以从社会的角度来思考。当我们采取这个观点时，我们假定控制系统的目标是使社会财富最大化，这里定义的社会财富是社会成员总体期望的净收益，既包括消费者也包括服务者。从这种方法来看，人群中个体间的财富转移对社会财富的影响为零，因此不会影响系统优化。因此，社会的目标为使得服务的总收益最大化，同时使得等待成本和经营成本最小化。

在一些情况下，我们

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可： Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版

注册

找回密码

排队论中有关消费者和服务者的均衡行为外文翻译资料

您可能感兴趣的文章

登录

注册

找回密码

您可能感兴趣的文章