加密经济学的机制设计(一)

“加密经济学”的基础概念

加密经济学的机制设计(一)

注:本文由 Alex Evans 撰写, Steven Mckie 校对,提供 Blockchannel 栏目使用。

如果你在2017年花时间了解过加密货币,你可能会对“加密经济学”一词有些印象。如果没有也不要紧,毕竟在数字货币领域有太多有趣的新名词被创造出来。由 Nick Tomaino 撰写的文章和由 Vitalik Buterin 发布的视频可以帮助你加速理解。

简单来说,加密经济学将密码学和经济激励结合在一起,以此设计足够健壮的去中心化协议和应用。比特币之所以取得其他去中心化协议未曾取得的成功,不是因为它使用 Proof-of-Work、去中心化现金,或是它采用的容错共识;比特币的成功源于将加密经济学当作其共识协议的核心。因此加密经济学的宏观愿景,是将这种成功的加密经济激励模式,扩展到各个方面——包含交易、计算、存储、预测、能源等领域。

区块链赋予我们将稀缺事物价值化的能力,并打破无法在某些地方进行价值流转的桎梏,从根本扩大了能使用经济激励的场景。从这个角度来看,加密经济学系统是能够激励人类行为的全新方法,有着巨大的发展潜力。

虽然理论容易理解,但是真正在设计经济激励的时候却困难重重。事实上,有一整个经济学的支派在研究如何设计满足真实社会场景的激励协议,这也称为机制设计(mechanism design)。虽然过去几个月里关于加密经济学的高谈阔论屡见不鲜,我们仍然没什么证据能证明完整的的机制设计方法已经被今天蓬勃发展的新区块链协议用上。(有些值得注意的例外后续会提及。)

委婉地说,机制设计还是个未被完全发掘的领域。当然,也有一些比较强硬的论调表示机制设计是不可或缺的一环:

加密经济学的机制设计(一)

本文目的在于介绍机制设计的基本概念,并带着读者感受机制设计在加密货币世界的用途。如果你正好在开发区块链协议或应用,本文也将提供一些介绍性的资源,方便对机制设计相关研究有需求的人查阅。我希望各位在读完本文后能有如下收获:1)同意在开发一套健壮的去中心化系统时,机制设计是极为重要的环节;2)在开始之前,我先简短地说明几个关键词和机制设计的定义、用大家都能理解的方式介绍基本的机制设计的“方言”,以便后续进行关于加密货币的讨论。这还不是正式介绍机制设计,如果想要更好地了解机制设计,可以预先学习下面的资料:

具备足够的机制设计学习资源,以满足个人工作上使用需要。声明一下,作者并非密码学或机制设计的专家,所以非常欢迎各位读者给与本文读后反馈。

Vincent Conitzer 写的这个章节; Matthew Jackson 写的这篇文章和与他人合作完成的两阶段课程;还有 Fundenberg 和 Tirole 共同完成的博弈论书籍。

这只是我找到的能帮助理解机制设计的一小部分资源,因为机制设计是已成型的研究领域,我相信能找到的资源远不止于此。如果你推荐其他的材料,麻烦罗列在留言区。

什么是机制设计(Mechanism Design)

我们可以将机制设计想象成一种反向博弈论。在博弈论中,我们将博弈过程视为给定的,并分析参与者能获得的效益。在机制设计中,我们先定义理想的结果,然后倒推回去创建博弈过程,以激励手段引导参与者走向设计好的结果。另一种简单的理解,可以将博弈论和机制设计视为同一枚硬币的正反面。

举例来说,你正在设计一场拍卖会,目标是将一件物品分配给对该物品评价最高的参与者。假设该物品对每个人来说都具有一定的效用,那么参与者有激励撒谎(内心评价没那么高却声称很高)。你要怎么设计拍卖规则,使得每个人都诚实公布自己对该物品的效用评价呢?比如,公开拍卖或私下拍卖?升序出价或降序出价?又或者是,得标者应该支付最高出价或是其他价格?

以此类比,在设计投票过程时,我们选择获胜的候选人到底该基于简单多数还是绝对多数?是否需要进行多重投票?投票者应该选择一位候选人,还是按照喜好排序?这些都是机制设计中典型的问题。

关键词定义

机制(Mechanism),包含一组有限的参与者集合及一组潜在社会决策集合。可以这么想象这个场景:有一组投票者,以及一群可以通过社会行动进行挑选的潜在候选人。参与者掌握着私人信息,也被称作信号( signals)类型( types )。每个人的类型代表参与者的偏好,比如他们偏好候选人A还是B,或是他们在拍卖中对于某样物品的估计;类型也可以经过编码来代表其他私密信息,比如参与者是否知道某物品的质量是好是坏。我们也拥有一些先验知识,比如这些类型的概率分布。所谓先验可以这么理解:你虽然不知道玩家手里的牌,但你知道手牌在一副52张的扑克牌组中出现的概率。再来,因为“最优”决策不可避免地取决于个人类型,我们也要定义决策规则,将类型映射为社会行动。

个人的效用也被当作记录类型(即他们自述的类型/偏好,这些信息未必是真的)、实际类型、输出结果的衡量指标。除此之外,我们还会频繁提到

支付函数;支付函数定义了可转移的物品(一般而言可以视为 token)如何用于激励参与者,一般而言,这是通过描述参与者的行为给其他人施加的外部性(Externalities)来实现的。借此,我们可以设想一种社会选择函数,可以通过分离货币和非货币部分,将记录类型映射为结果。下文我们谈到“准线性”效用,即对货币/支付的偏好是线性的,说的实际上就是社会选择函数。

实际上,作为设计者我们可以控制机制的选择,而不能选择参与者以及他们的类型,这些给定的条件元素称为设定( setting)。加入机制使得这些服从贝叶斯分布的设定转化为博弈(也叫做“博弈形式”)。那么正式的表述是,机制是一组信息/策咯的空间集合,同时能够把信息/策略映射为社会决策或支付结果。我们可以设计确定的机制,也就是说,给定相同输入,会输出相同的决策;也可以基于相同的规则设计带有概率/随机性的机制。

机制设计的中心思想:设计一种机制,激励理性的参与者,在各自保有私人信息的情况下进行特定行为,最终产生符合社会预期的效果。

一般来说,机制被称为社会选择函数的“实现”,即是说,在均衡状态下,由类型到结果的映射与社会选择函数的映射结果相同(由此可见,你可以把机制设计视为一种“实施理论”)。我们可以让均衡状态的社会选择在占优策略(Dominant Strategies)(某种会使某参与者无视其他参与者的策略选择而一贯选择的策略)中实现;也可以使其在贝叶斯-纳什均衡(Bayes-Nash Equilibrium)(对任一参与者来说,基于他们对其他参与者类型和策略的认识,偏离当前策略无利可图)中实现。前者显然更强力,或说是更有强制性的假设。

显示性原理

机制设计的基本成果之一是所谓的显示性原理(Revelation Principle)。我们宽泛的描述一下这种状态——由任意机制或是诚实可信、直接显示性的机制来实施社会选择函数可以得到同样的均衡结果。在所谓的直接显示性机制(Direct-revelation Mechanism)中,参与者会向机制明白声称自己的类型,并引出一种决策和相应的支付集。如果诚实地记录自己的偏好是占优策略,那么直接显示性机制就是可信的(我们可以直接相信在贝叶斯-纳什均衡下,这个假设成立)。你会看到一些机制被称为是

真实的(Truthful)、兼容激励的(Incentive Compatible),或是防串谋的(Strategy-proof ),而显示性原理具有更加强大的含义。简单来说,如果你可以证明在这些机制中某件事是真的,那么你可以在其他所有机制中证明其为真。我们来看看为什么上述成立,假设一个随机的非真实机制,它有个交互层,可以取得你发的偏好并策略性地与机制互动使你得到的支付最大化(就像委托人),那么你不会希望你真实的偏好和策略被错误记录,否则你只能得到一个次优的支付。本质上,你不需要撒谎,因为这个随机的机制已经替你撒谎了。基于普遍性,我们关注的必定是真实的、直接显示的机制,因为它们的结果才是关键结果,能推动整个机制运行。否则你就不得不证明理论对大多数非直接的、非真实的机制也是有效的,这会让机制设计这一科目在实践中毫无用处。

机制设计作为约束条件下的最优化

上面我们已经定义了一些基本的词汇,接下来我们要讨论:我们可以使用机制设计去产生什么类型的输出结果?什么样的机制是“好的”,我们又该如何确定选中这类的机制?你可以将这个问题想象成最优化问题,即,我们要在约束条件下,使得

目标函数(比如你的收益)最大化。接下来会介绍一些常见的约束。

激励兼容性(Incentive Compatible),也许是你会见的最频繁的条件约束。其他常见的约束还有个体理性(Individual Rationality ),也就是说参与者一定不会因为参与机制而遭受损失;以及效率(Efficiency)——个体效益总和一定是最大值(不包含货币转移)。预算平衡(Budget Balance)将机制可在人际间转移的净值限制为零,而弱预算平衡(也被称为feasibility)只要求机制支出不能多于收入。还有一个机制设计理论中的关键问题逐渐浮出水面,像是预算平衡、效率、个体理性等等约束,常常无法同时满足激励兼容性和其他几个不可能性定理。一般来说,机制的特征被参与者的三种状态所保证:事后(ex-post)——与参与者的类型无关;中间法(ex-interim)——给定参与者的类型,以及对其他参与者的类型的预期;事前法(ex-ante)——预想自己的和其他人的类型。回到扑克牌游戏,在发牌前你先预期你能做的决定,这时候属于事前法;如果我们只知道自己的手牌那就属于中间法,如果所有牌都已经揭开那就属于事后法。

加上约束,这时你就只能从数个机制的集合中进行选择,这也就将机制设计问题转变为最优化问题。举例来说,在拍卖会中,你会试图找到一个兼容激励的、个体理性的机制来最大化你的收益。同时这个机制的效率能被计算出来,在复杂的多社会目标过程也能公平分配利益。这样的例子无穷无尽,而且我们能发现,在一些例子中,如何更正式的方式描述需求,这会成为机制设计中更大的难题。

维克里-克拉克-格罗夫斯机制

我们还会经常见到一套非常强大的机制—— 维克里-克拉克-格罗夫斯机制(Vickrey-Clarke-Groves mechanisms)。为了更好地解释,我们假设拍卖会上只有一种单一的商品在售卖。也许最简单的方法就是:让所有竞拍者在小纸片上写下他们的出价。出价结束后,价高者得。但这种明显不是一种激励兼容方法,因为其他竞拍者即使报了真实的心里价格,最终效益仍然为零。另一种比较好能够兼容激励的做法是:价高者得到该物品,但他只需要付次高的价格。这种方法叫做维克里拍卖法( Vickrey auction )。在这种情况下,每个竞拍者都有动机进行真实报价。

另一种重要的机制,也是维克里拍卖法的扩展,叫做克拉克机制 Clarke mechanism,也被称为VCG 机制( 虽然 VCG 表示的机制更为广泛)。它是这么运作的:针对每个个体,每次我们先将其排除在外,并根据其他参与者记录的类型,挑选出可以使这些参与者效用最大化的结果;接着我们将这个个体加进来,再次运行同一个机制,并选出一个结果。每个参与者都要支付(或是得到)前后两种状况中其他参与者总效用的差额。.显然,这一支付会等同于个体的社会成本或社会收益。因为个体在被排除在外时无法影响整体效益,所以每个个体都会尽可能使自己和其他人的效用总和最大化。但这就等于是最大化社会总效用!用这种方式调整激励,不只保证激励兼容性,同时保证了效率。基于此,即使附加一些软性的假设条件,我们也能很容易以事后法找到个体理性且弱预算均衡的机制。我们也可以为个人不能影响的支付附加任意的条件而不改变底层的激励机制(比如不论结果如何,都持续给每个人一定报酬)。这种更符合需求的方法叫做

格罗夫斯机制(Groves Schemes),这是一种占优策略激励兼容的机制。在诚实是占优策略的情况下,这是唯一有效率的机制。

虽然格罗夫斯计划是个强大的机制,但它很容易受到参与者间的勾结所影响。我们后面会讨论这对加密经济学造成怎样严重的问题。


分享到:


相關文章: