加密經濟學的機制設計(一)

“加密經濟學”的基礎概念

加密經濟學的機制設計(一)

注:本文由 Alex Evans 撰寫, Steven Mckie 校對,提供 Blockchannel 欄目使用。

如果你在2017年花時間瞭解過加密貨幣,你可能會對“加密經濟學”一詞有些印象。如果沒有也不要緊,畢竟在數字貨幣領域有太多有趣的新名詞被創造出來。由 Nick Tomaino 撰寫的文章和由 Vitalik Buterin 發佈的視頻可以幫助你加速理解。

簡單來說,加密經濟學將密碼學和經濟激勵結合在一起,以此設計足夠健壯的去中心化協議和應用。比特幣之所以取得其他去中心化協議未曾取得的成功,不是因為它使用 Proof-of-Work、去中心化現金,或是它採用的容錯共識;比特幣的成功源於將加密經濟學當作其共識協議的核心。因此加密經濟學的宏觀願景,是將這種成功的加密經濟激勵模式,擴展到各個方面——包含交易、計算、存儲、預測、能源等領域。

區塊鏈賦予我們將稀缺事物價值化的能力,並打破無法在某些地方進行價值流轉的桎梏,從根本擴大了能使用經濟激勵的場景。從這個角度來看,加密經濟學系統是能夠激勵人類行為的全新方法,有著巨大的發展潛力。

雖然理論容易理解,但是真正在設計經濟激勵的時候卻困難重重。事實上,有一整個經濟學的支派在研究如何設計滿足真實社會場景的激勵協議,這也稱為機制設計(mechanism design)。雖然過去幾個月裡關於加密經濟學的高談闊論屢見不鮮,我們仍然沒什麼證據能證明完整的的機制設計方法已經被今天蓬勃發展的新區塊鏈協議用上。(有些值得注意的例外後續會提及。)

委婉地說,機制設計還是個未被完全發掘的領域。當然,也有一些比較強硬的論調錶示機制設計是不可或缺的一環:

加密經濟學的機制設計(一)

本文目的在於介紹機制設計的基本概念,並帶著讀者感受機制設計在加密貨幣世界的用途。如果你正好在開發區塊鏈協議或應用,本文也將提供一些介紹性的資源,方便對機制設計相關研究有需求的人查閱。我希望各位在讀完本文後能有如下收穫:1)同意在開發一套健壯的去中心化系統時,機制設計是極為重要的環節;2)在開始之前,我先簡短地說明幾個關鍵詞和機制設計的定義、用大家都能理解的方式介紹基本的機制設計的“方言”,以便後續進行關於加密貨幣的討論。這還不是正式介紹機制設計,如果想要更好地瞭解機制設計,可以預先學習下面的資料:

具備足夠的機制設計學習資源,以滿足個人工作上使用需要。聲明一下,作者並非密碼學或機制設計的專家,所以非常歡迎各位讀者給與本文讀後反饋。

Vincent Conitzer 寫的這個章節; Matthew Jackson 寫的這篇文章和與他人合作完成的兩階段課程;還有 Fundenberg 和 Tirole 共同完成的博弈論書籍。

這只是我找到的能幫助理解機制設計的一小部分資源,因為機制設計是已成型的研究領域,我相信能找到的資源遠不止於此。如果你推薦其他的材料,麻煩羅列在留言區。

什麼是機制設計(Mechanism Design)

我們可以將機制設計想象成一種反向博弈論。在博弈論中,我們將博弈過程視為給定的,並分析參與者能獲得的效益。在機制設計中,我們先定義理想的結果,然後倒推回去創建博弈過程,以激勵手段引導參與者走向設計好的結果。另一種簡單的理解,可以將博弈論和機制設計視為同一枚硬幣的正反面。

舉例來說,你正在設計一場拍賣會,目標是將一件物品分配給對該物品評價最高的參與者。假設該物品對每個人來說都具有一定的效用,那麼參與者有激勵撒謊(內心評價沒那麼高卻聲稱很高)。你要怎麼設計拍賣規則,使得每個人都誠實公佈自己對該物品的效用評價呢?比如,公開拍賣或私下拍賣?升序出價或降序出價?又或者是,得標者應該支付最高出價或是其他價格?

以此類比,在設計投票過程時,我們選擇獲勝的候選人到底該基於簡單多數還是絕對多數?是否需要進行多重投票?投票者應該選擇一位候選人,還是按照喜好排序?這些都是機制設計中典型的問題。

關鍵詞定義

機制(Mechanism),包含一組有限的參與者集合及一組潛在社會決策集合。可以這麼想象這個場景:有一組投票者,以及一群可以通過社會行動進行挑選的潛在候選人。參與者掌握著私人信息,也被稱作信號( signals)類型( types )。每個人的類型代表參與者的偏好,比如他們偏好候選人A還是B,或是他們在拍賣中對於某樣物品的估計;類型也可以經過編碼來代表其他私密信息,比如參與者是否知道某物品的質量是好是壞。我們也擁有一些先驗知識,比如這些類型的概率分佈。所謂先驗可以這麼理解:你雖然不知道玩家手裡的牌,但你知道手牌在一副52張的撲克牌組中出現的概率。再來,因為“最優”決策不可避免地取決於個人類型,我們也要定義決策規則,將類型映射為社會行動。

個人的效用也被當作記錄類型(即他們自述的類型/偏好,這些信息未必是真的)、實際類型、輸出結果的衡量指標。除此之外,我們還會頻繁提到

支付函數;支付函數定義了可轉移的物品(一般而言可以視為 token)如何用於激勵參與者,一般而言,這是通過描述參與者的行為給其他人施加的外部性(Externalities)來實現的。藉此,我們可以設想一種社會選擇函數,可以通過分離貨幣和非貨幣部分,將記錄類型映射為結果。下文我們談到“準線性”效用,即對貨幣/支付的偏好是線性的,說的實際上就是社會選擇函數。

實際上,作為設計者我們可以控制機制的選擇,而不能選擇參與者以及他們的類型,這些給定的條件元素稱為設定( setting)。加入機制使得這些服從貝葉斯分佈的設定轉化為博弈(也叫做“博弈形式”)。那麼正式的表述是,機制是一組信息/策咯的空間集合,同時能夠把信息/策略映射為社會決策或支付結果。我們可以設計確定的機制,也就是說,給定相同輸入,會輸出相同的決策;也可以基於相同的規則設計帶有概率/隨機性的機制。

機制設計的中心思想:設計一種機制,激勵理性的參與者,在各自保有私人信息的情況下進行特定行為,最終產生符合社會預期的效果。

一般來說,機制被稱為社會選擇函數的“實現”,即是說,在均衡狀態下,由類型到結果的映射與社會選擇函數的映射結果相同(由此可見,你可以把機制設計視為一種“實施理論”)。我們可以讓均衡狀態的社會選擇在佔優策略(Dominant Strategies)(某種會使某參與者無視其他參與者的策略選擇而一貫選擇的策略)中實現;也可以使其在貝葉斯-納什均衡(Bayes-Nash Equilibrium)(對任一參與者來說,基於他們對其他參與者類型和策略的認識,偏離當前策略無利可圖)中實現。前者顯然更強力,或說是更有強制性的假設。

顯示性原理

機制設計的基本成果之一是所謂的顯示性原理(Revelation Principle)。我們寬泛的描述一下這種狀態——由任意機制或是誠實可信、直接顯示性的機制來實施社會選擇函數可以得到同樣的均衡結果。在所謂的直接顯示性機制(Direct-revelation Mechanism)中,參與者會向機制明白聲稱自己的類型,並引出一種決策和相應的支付集。如果誠實地記錄自己的偏好是佔優策略,那麼直接顯示性機制就是可信的(我們可以直接相信在貝葉斯-納什均衡下,這個假設成立)。你會看到一些機制被稱為是

真實的(Truthful)、兼容激勵的(Incentive Compatible),或是防串謀的(Strategy-proof ),而顯示性原理具有更加強大的含義。簡單來說,如果你可以證明在這些機制中某件事是真的,那麼你可以在其他所有機制中證明其為真。我們來看看為什麼上述成立,假設一個隨機的非真實機制,它有個交互層,可以取得你發的偏好並策略性地與機制互動使你得到的支付最大化(就像委託人),那麼你不會希望你真實的偏好和策略被錯誤記錄,否則你只能得到一個次優的支付。本質上,你不需要撒謊,因為這個隨機的機制已經替你撒謊了。基於普遍性,我們關注的必定是真實的、直接顯示的機制,因為它們的結果才是關鍵結果,能推動整個機制運行。否則你就不得不證明理論對大多數非直接的、非真實的機制也是有效的,這會讓機制設計這一科目在實踐中毫無用處。

機制設計作為約束條件下的最優化

上面我們已經定義了一些基本的詞彙,接下來我們要討論:我們可以使用機制設計去產生什麼類型的輸出結果?什麼樣的機制是“好的”,我們又該如何確定選中這類的機制?你可以將這個問題想象成最優化問題,即,我們要在約束條件下,使得

目標函數(比如你的收益)最大化。接下來會介紹一些常見的約束。

激勵兼容性(Incentive Compatible),也許是你會見的最頻繁的條件約束。其他常見的約束還有個體理性(Individual Rationality ),也就是說參與者一定不會因為參與機制而遭受損失;以及效率(Efficiency)——個體效益總和一定是最大值(不包含貨幣轉移)。預算平衡(Budget Balance)將機制可在人際間轉移的淨值限制為零,而弱預算平衡(也被稱為feasibility)只要求機制支出不能多於收入。還有一個機制設計理論中的關鍵問題逐漸浮出水面,像是預算平衡、效率、個體理性等等約束,常常無法同時滿足激勵兼容性和其他幾個不可能性定理。一般來說,機制的特徵被參與者的三種狀態所保證:事後(ex-post)——與參與者的類型無關;中間法(ex-interim)——給定參與者的類型,以及對其他參與者的類型的預期;事前法(ex-ante)——預想自己的和其他人的類型。回到撲克牌遊戲,在發牌前你先預期你能做的決定,這時候屬於事前法;如果我們只知道自己的手牌那就屬於中間法,如果所有牌都已經揭開那就屬於事後法。

加上約束,這時你就只能從數個機制的集合中進行選擇,這也就將機制設計問題轉變為最優化問題。舉例來說,在拍賣會中,你會試圖找到一個兼容激勵的、個體理性的機制來最大化你的收益。同時這個機制的效率能被計算出來,在複雜的多社會目標過程也能公平分配利益。這樣的例子無窮無盡,而且我們能發現,在一些例子中,如何更正式的方式描述需求,這會成為機制設計中更大的難題。

維克裡-克拉克-格羅夫斯機制

我們還會經常見到一套非常強大的機制—— 維克裡-克拉克-格羅夫斯機制(Vickrey-Clarke-Groves mechanisms)。為了更好地解釋,我們假設拍賣會上只有一種單一的商品在售賣。也許最簡單的方法就是:讓所有競拍者在小紙片上寫下他們的出價。出價結束後,價高者得。但這種明顯不是一種激勵兼容方法,因為其他競拍者即使報了真實的心裡價格,最終效益仍然為零。另一種比較好能夠兼容激勵的做法是:價高者得到該物品,但他只需要付次高的價格。這種方法叫做維克裡拍賣法( Vickrey auction )。在這種情況下,每個競拍者都有動機進行真實報價。

另一種重要的機制,也是維克裡拍賣法的擴展,叫做克拉克機制 Clarke mechanism,也被稱為VCG 機制( 雖然 VCG 表示的機制更為廣泛)。它是這麼運作的:針對每個個體,每次我們先將其排除在外,並根據其他參與者記錄的類型,挑選出可以使這些參與者效用最大化的結果;接著我們將這個個體加進來,再次運行同一個機制,並選出一個結果。每個參與者都要支付(或是得到)前後兩種狀況中其他參與者總效用的差額。.顯然,這一支付會等同於個體的社會成本或社會收益。因為個體在被排除在外時無法影響整體效益,所以每個個體都會盡可能使自己和其他人的效用總和最大化。但這就等於是最大化社會總效用!用這種方式調整激勵,不只保證激勵兼容性,同時保證了效率。基於此,即使附加一些軟性的假設條件,我們也能很容易以事後法找到個體理性且弱預算均衡的機制。我們也可以為個人不能影響的支付附加任意的條件而不改變底層的激勵機制(比如不論結果如何,都持續給每個人一定報酬)。這種更符合需求的方法叫做

格羅夫斯機制(Groves Schemes),這是一種佔優策略激勵兼容的機制。在誠實是佔優策略的情況下,這是唯一有效率的機制。

雖然格羅夫斯計劃是個強大的機制,但它很容易受到參與者間的勾結所影響。我們後面會討論這對加密經濟學造成怎樣嚴重的問題。


分享到:


相關文章: