1、纳什和博弈论如何变革了经济学?
日前一位重要的博弈论大师约翰·纳什去世了,由此引起了很多人对博弈论的更大兴趣。之所以用《博弈与社会》这个题目是因为没想到更合适的,我今天要讲的主要内容是简单给大家概括一下我认为有意思的东西。当然,一个多小时的时间也不可能讲太多,而且我希望能够给大家留些时间去提问题。
首先我们来看经济学由于纳什或纳什均衡发生的革命性变化。在古希腊时代,经济学是道德哲学的一部分。我们知道,亚当·斯密创立了现代经济学,但他的第一本书是《道德情操论》,斯密本人是格拉斯哥大学的伦理学教授。在斯密之后,纳什之前,经济学被简单地理解为有关物质财富的生产和配置的理论。
在纳什之后,经济学研究扩展到了社会制度中的激励理论,或者简单说经济学研究的是制度和激励问题。经济学关注资源配置理论的时候,主要的研究对象就是财富如何生产,如何分配。当经济学关心一般的社会制度和激励机制时,关注的核心就是人与人之间的相互合作。在这样一个转变中,纳什均衡的提出发挥了革命性作用。
我们再往前看以资源配置理论为核心的传统经济学,这个经济学的核心就是价格理论。我们过去说,懂不懂经济学就看你懂不懂价格理论。比亚当·斯密更早的人,如威廉·配第(William Petty)这些人研究经济学,他们更喜欢用数学方式,用线性代数的方式分析问题。用这种方式分析问题最容易分析的就是物质财富,因为物质财富在物理上有一个量,从货币的角度看也有一个量。
物质财富生产特别适用于定量分析法,所以新古典经济学也越来越转向研究物质财富的生产和分配。在这个理论中,每个人决策时面临的是非人格化参数。我在决定买什么不买什么,或者找这个工作还是那个工作时,我有一个偏好,剩下就是各种参数,比如价格参数,苹果或桃的价格啦,工资的多少啦,我不需要考虑其他人的想法。
但是我们知道,社会关系是人与人之间的关系。在新古典经济学中,我们假定市场中,人与人之间的关系完全通过价格来体现,或者说价格是一个参数,对所有人都一样,每个消费者都有自己的最优选择,然后就形成需求函数;每个生产者有自己利润最大化的选择,于是就形成供给函数。在市场当中,似乎总有一只无形之手来让需求和供给相等,于是达到了所谓的均衡,这就是传统经济学的基本理论。
所谓均衡,在传统经济学里是指价格处于这样的状态:需求等于供给,每个消费者达到效用最大,每个生产者达到利润最大。在均衡状态下是没有经济利润的,所有的收益都是成本。如果大家记得经济学思维中的成本是指机会成本的话,均衡情况下就没有利润。这是我们传统的经济学思维。这种思维进一步简化就变成了成本-收益分析,或者叫供求分析。萨缪尔森的书里有一句话:“只要会说需求和供给,鹦鹉都能变成经济学家。”这是传统的经济学。
经济学家在发展出了这套非常成熟的价格理论之后,做出的数学模型确实非常完美,非常漂亮。将这些理论应用于分析其他社会问题,我们一般叫做理性选择理论。但当我们这样去分析社会问题时,就会面临很多困难。其中一个困难就是大量的经济行为其实是没有价格的。最简单的例子,政治谈判和竞选就没有价格,这里的没有价格是指没有用货币表示的价格。
另外,人们在实际行为中关心的不仅仅是物质利益,比如我找工作并不是只关心工资,我还关心其他的东西,如工作环境、对我未来职业选择的影响,还有这个职业的社会声誉,等等。有些职业的工资可能不高,但是它使我们有成就感,比如媒体。媒体的工资不算高,但是为什么好多人愿意做呢?它有着很高的成就感。我们通过媒体知道每天发生的事情,媒体人往往有另外一种追求,而不只是为了赚钱。经济学家其实也是这样。这个是传统经济学难以分析的。
还有,人在决策当中,面临的不一定只是非人格化的参数,还面临其他人的决策。有时候,我做还是不做某件事,依赖于你做还是不做;或者我愿意选择什么,依赖于你会选择什么,而不是简单的只面临一个价格或收入等非人格化参数。
举一个例子,两个人讨价还价,在这个过程,我出什么样的策略,我的价码是多少,依赖于我判断你的价码是多少,而不是说我通过一个确定的价格参数来机械性地选择。即便应用于最简单的例子——去地摊上买东西,传统价格理论的局限还是很大。
传统经济学假定,一个生产者在决策时,首先要要素价格给定,产品价格给定,然后最小化成本,选择最优生产组合,再选择最优产量。假定中产品价格是给定的,但竞争中并非如此。
比如寡头企业决策时,价格不是给定的,价格多少不仅取决于他,还取决于于对方。这时传统的价格理论就没有办法分析。这点也说明,为什么我们现在要把寡头竞争的博弈论模型追溯到年法国数学家古诺1838年做出的分析,他是第一个真正用数学模型分析寡头竞争的人,而不局限于一个我们所谓的完全竞争市场。
当然了,这些局限性并没有阻碍经济学家试图把传统价格理论应用于非经济问题的研究,这方面的典型是诺贝尔经济学奖得主、芝加哥大学教授加里·贝克尔(Gary Becker),他试图用经济学分析方法去分析所有的人类行为问题。另外我们知道,法经济学也是试图用成本-收益方法来阐述法律制度。
现在来看,这些研究总体上并不令人满意,这时就迫切需要一种新的更为一般化的分析方法来克服刚才讲的价格理论的缺陷:它可以分析非价格、非物质的东西,可以分析人与人之间的相互关系或互动情况,这个理论就是博弈论。
在纳什之前,也有其他的经济学家提出过类似理论,比较有名的像刚才讲的古诺,像计算机的发明人冯·诺依曼,还有他的合作者摩根斯特恩(Oskar Morgenstern),但博弈论真正成型还要归功于纳什。所以一般我们认为,非合作博弈的创始人就是纳什,他把之前已经发展出来的理论组装起来。纳什对博弈论的贡献,某种意义上就像亚当·斯密对经济学的贡献,在斯密之前也有好多经济学理论,亚当·斯密第一个把它们组成为系统理论。
我们知道,纳什发展出的最重要的概念就是纳什均衡。我在这里稍微给大家介绍一下。首先我要纠正一点,一般我们讲的博弈论就是非合作博弈论,但在中文里特别容易误解,让人觉得非合作博弈是研究人怎么不合作的。事实不是这样,非合作博弈研究的是每个人独立决策的结果会是什么样。我们恰恰是希望用非合作博弈理论来解释人们为什么不合作,只有搞明白了为什么不合作,才能更好促进合作。
先来给大家做一个简单概述,什么叫博弈论。博弈论指的是研究人与人之间行为互动的一般理论。所谓社会,就是互动。很多经济学家对博弈论的应用范围评价极高,比如诺贝尔奖得主奥曼(Robert Aumann)。另外一个经济学家哈特(Sergiu Hart)在文章里说,博弈论可以视为整个社会科学理性一脉的总括。我们研究的人的行为有理性的有非理性的,博弈论为理性行为分析提供了一个统一场理论。
这里我们讲的社会,可以广泛地理解,既包括人类个体组成的社会,也包括其他各种个体组成的群体,比如公司、国家,动物、植物、计算机这些都可以应用博弈论分析。我们研究国家之间的关系,研究中央政府和地方政府的关系,都符合我们讲的社会范畴。
博弈论不像经济学或政治科学等学科其他分析工具那样,采取不同的就事论事的框架,来对各种具体问题进行分析,如完全竞争、寡头、垄断、国际贸易、税收、选举、遏制,还有动物行为等等;相反,博弈论是先提出一些一般的原理,这些原理适用于所有互动的情况,然后考察这些方法具体应用会产生何种结果。
博弈论为我们分析整个社会变化和社会结构提供了一个微观基础。曾获得诺贝尔经济学奖的迈尔森(Roger Myerson)教授曾说,发现纳什均衡的意义可以和生命科学中发现DNA双螺旋结构的意义相媲美,纳什构造了经济分析新语言的基本词汇。另一位经济学家这样认为,越来越多地,博弈论语言变成了经济学语言,纯理论指的就是博弈论,我们现在讲的社会科学的纯理论就是指博弈论。这种评价是相当高的,但并没有言过其实。
有了这样的理论,所以在纳什之后,我们的经济分析不再是简单的资源配置理论,不再是简单的价格理论,而是可以分析各种各样的制度的理论,包括市场制度。传统经济学只分析市场制度,我们现在要分析大量的非市场制度;传统的经济学只分析物质生产和分配,我们现在不仅分析物质的,也分析非物质的,不仅分析经济问题,也分析社会、政治、文化问题以及它们之间的相互关系。我们还可以分析制度是怎么演化的,这个传统经济学没有办法分析,有了博弈论之后,制度演进分析变得容易。
所以博弈论使得经济学发生了根本性转型,也正在使得其他社会科学发生这种转型,包括政治科学,包括法律,甚至包括最基础的像心理学,社会学等等,包括对动物的研究,动物学,都在发生一些重要的变化。
我讲的一个基本问题是,从博弈论或者以纳什划分为界,纳什之前和纳什之后,经济学是很不一样的。现在大学教科书里边,基本的经济学原理主要是资源配置理论或价格理论,这个过去叫微观经济学。博弈论作为单拎出的一部分,有些教科书会把它放进去,但是并不是所有都放进去,放进去的份量非常有限,比如曼昆(Gregory Mankiw)的教科书《经济学原理(微观部分)》有一点博弈论的内容,但是大部分内容仍然是以传统价格理论为主。
2、纳什均衡的制度含义
接下来稍微给大家介绍一下纳什均衡,为什么这个均衡如此重要,如此有意义。简单地说,纳什均衡是一种分析和预测互动情况下理性人行为的概念工具,我们假定人们是理性的,然后在相互作用的情况下,研究他们会有的行为和后果。
我们先从预测人的行为说起。在传统经济学的价格理论里,一个人的效用函数依赖于自己的选择,比如你买了几个苹果,买了几个梨,对你的效用产生了怎样的影响。在博弈论里,一开始就改变了这个效用函数,一般讲我们消费者的偏好,不仅依赖于你的行为,而且依赖于别人的行为,所以在这里我们看到的跟传统经济学不一样,第一要看到自己的行为,第二还要看别人的行为,别人可能是一个人,也可能是好多人,可能是N个人,这是非常重要的一点。
我们假定每个人都是独立做出决策,然后来研究什么样的结果最可能出现。纳什均衡就是这样最可能出现的结果,或者说最可能出现的一种策略或者策略组合,每个人都根据自己情况选做出最优选择,如果一个策略或者一个行动选择变成纳什均衡,意味着什么?意味着给定别人的选择,没有任何人有积极性改变自己的选择。举例来说,今天晚上在这里,每个人来的时候都要选择自己的座位,我们现在都已经各自坐好,你可以说我们现在就是纳什均衡,因为没有人有积极性跑到另外一个地方去。
现在我们把纳什均衡理解为一种制度安排来思考一下。如果一个制度是纳什均衡意味着什么?意味着所有人都要遵守它;反过来说如果一个制度不是纳什均衡,至少有一部分人不会遵守它,也可能所有人都不遵守它。这就是为什么纳什均衡对我们分析社会制度和制度演化如此重要的一个原因。我这样讲比较抽象,下面我们会用简单的例子说明这点。
首先,纳什均衡是没有价值判断的,它不告诉你这个制度安排是好还是不好,它只告诉你如果每个人都选择自己认为的最优行为,会造成什么样的结果。当然了,如果我们主观上给纳什均衡本身加一个价值判断的话,可能有好的纳什均衡,也有不好的纳什均衡。什么叫好的纳什均衡什么叫不好的纳什均衡,依赖于我们用什么标准衡量。传统的经济学里我们会用社会福利函数,或者帕累托效率标准来衡量,如果这个制度达不到帕累托均衡,我们说这是不好的,达到了就是好的。
我想,衡量好还是不好,更一般的标准就是合作。为什么这样讲呢?因为人类的所有进步,每个人利益的改善都来自相互的合作。所以什么叫好的纳什均衡?如果这个纳什均衡达到了一个合作的目的,合作是纳什均衡,我们就说这是好的纳什均衡,否则就是坏的纳什均衡。我们先从坏的纳什均衡讲起,如果学了一点博弈论就知道,这是教科书上常提的囚徒困境。为了下面要讲的内容,我稍微为大家复习一下。
假如两个人组成的社会,每个人都有两个选择,可以选择合作,也可以选择不合作。当然了,这个概念可以作为一般应用,也可以理解为在团队中的努力还是不努力,合作是努力,不合作是不努力。你也可以讲合作就是诚实,不合作就是欺骗。为了方便简洁我们简单地用合作和不合作。这样的话,每个人最终会得到什么,不仅依赖于你选择合作或不合作,还依赖于别人的选择。
在两个人情况下,有四种可能性:第一种两个人都合作;第二种两个人都不合作;第三种是第一个人合作,第二个人不合作;第四种第一个不合作,第二个人合作。对应这四种可能性,每个人的报酬,或者说叫效用,或者博弈论中叫支付,是不一样的。我们先从个人讲起,因为博弈论是从个人的决策开始的,先要研究对单个人来讲,什么是最好的。
在这个案例里面,对单个人来说最好就是别人合作,他不合作,他就赚便宜了。比如别人好好干活,你偷懒,你分享别人的成果,你赚了;其次是两个人都合作;再其次是两个人都不合作;最糟糕的是你合作,别人不合作,你被别人骗了。凡是满足这样一个条件的,都叫囚徒困境。
图一:囚徒困境
图一用具体的数值描述了这个博弈。在这里,从A的角度来看,如果B合作,他不合作,他得到4;其次是两个人都合作,他得到3;再其次是两个人都不合作,他得到0;最糟糕是什么?他合作, B不合作,结果他得到-1。图一里边的第一个数字代表第一个人的报酬,第二个代表第二个人的报酬,这是表述的惯例。
我们看到,如果是这样情况,每个人出于自己的利益选择,他会选择什么呢?从A的角度出发,如果B合作,他最好是不合作,他得到4;如果B不合作,他合作的话就亏了,不合作是0,所以从他的利益出发,最好选择不合作。从B的角度讲也是一样,所以每个人的最优选择都是不合作,结果是每个人都得到0。而我们作为局外人,明明看到这样更好:如果两个人都合作得到3。这就是我们过去讲的个人理性与集体理性的矛盾,这就是囚徒困境的意思。
两人都不合作的纳什均衡显然是坏的均衡,从这里我们就可以体会到制度的意义。一个制度其实是某种游戏规则,实际上就是博弈规则,这就是制度的含义。它不仅在影响人的行为,还决定着什么样的纳什均衡会出现。什么叫好的制度?好的制度就是能使得合作变成纳什均衡的制度;反过来,坏的制度就是使得不合作变成纳什均衡的制度。在刚才这个例子当中,我们可以设想这也许就是人民公社制度,大家吃大锅饭,谁好好干活谁吃亏,谁耍奸谁得到好处,最后结果是大家没饭吃。
图二:包产到户下的纳什均衡
我们现在看制度改变起什么意义?假如人民公社变成包产到户,在包产到户的情况下,你赚不了别人的便宜,你只能吃自己地上打的粮食。以前,如果农民两人都合作,每人可以得到3,俩人都不合作,得到0。现在就变化了,如果第一个农民A努力,第二个人偷懒的话,农民A自家能拿到3,B只能拿到0;反过来说,如果B努力,A偷懒的话,A只能得到0,B得到3。你看,在这样的制度下,纳什均衡是大家都会合作。
从A来讲,不管B合不合作,我自己一定会好好干活,B最后选择也是好好干活。结果就从前面坏的纳什均衡变成了好的纳什均衡,即合作的纳什均衡,这就是我们讲的制度的意义:制度影响纳什均衡,一个好的制度鼓励人们合作,一个不好的制度使大家不合作。
但我们马上遇到一个问题了,农业是由于生产落后,不需要实际上物理上的合作,每个人自己种自己的地就好。当然,互助组合作社之类的我们先不讲它。但是,任何一个工业企业不可能分成个体生产,如果你把一个大企业分成一个个个体户的话,公司的价值就没有了,我们需要这个公司本身就是因为它可以创造出单个人创造不出的东西,也就是说N个人放在一块创造的价值大于每个人创造的价值乘以N,这才是我们需要团队的原因。所以我刚才这个例子,并不能完全概括我们面临的问题。
图三:私有产权下的纳什均衡
如果在集体当中,囚徒困境一定会存在的话,怎么解决它?现在来看,私有产权就能解决它。
这里的私有产权可以这样设想,还是一个博弈,如果现在企业有一个老板,一个雇员,老板合作,雇员也合作的话,每个人得到3;如果老板合作,雇员不合作的话,老板就可以处罚雇员,雇员只能得到0,老板还能得到2;如果雇员合作,老板不合作的话,老板照样付雇员3的工资,老板就亏了。从这里可以发现,一个人干活只能创造2的价值,两个人干活可以创造6的价值,于是企业的价值就出现了。这时候,雇员和老板都会选择合作,如图三所示。
所以,在有了私有产权的博弈当中,我们看到合作就变成一个纳什均衡了。为什么现代企业制度能够出现并且持续存在,即便它有好多诸如偷懒这些问题,就是因为有私有产权制度,简单说有老板。如果一个企业没有老板就会变成囚徒困境博弈,纳什均衡就是没人合作,这就是国有企业的问题。如果一个企业有老板了,那就改变了制度,改变了游戏规则,合作就变成了纳什均衡。这就是前面讲的制度的意义。
再进一步,一方面人们是在给定博弈规则的情况下做出选择,我们可以预测纳什均衡是什么;另一方面,纳什均衡本身可以反过来分析游戏规则本身,因为游戏规则也是人类博弈的结果,它不是由一个外在力量给我们强加的,哪怕计划经济也是人类博弈的结果。当然在这个结果当中,可能我们发现我们犯了错误,我们可能会改正它。我现在要跟大家介绍一下,好多情况下,我们可以用纳什均衡理解制度本身,甚至分析制度的演化。
17世纪有本很重要的书——霍布斯(Thomas Hobbes)的《利维坦》,《利维坦》描述了一个没有政府的自然世界里充斥着人与人之间的战争,即所谓丛林规则。丛林规则就是我们刚才讲的囚徒困境。霍布斯认为,为了走出丛林规则,我们就需要一个政府,有了这个政府以后,我们有一个统一的意志,强加一个统一的规则,不能通过伤害别人得到好处,结果对所有人都好。
霍布斯的这个解释从博弈论角度看,就是通过设立政府使一个社会走出了囚徒困境,变得可以合作,这是他最早分析制度的含义。尽管他本身并没有用博弈论的概念,但现在我们完全可以用纳什均衡的理论去理解它。
我们来把一般的制度框架概括一下。我刚才讲的制度就是游戏规则,我们分析制度要看制度是怎么产生的,是怎么执行的,这是两个最重要的维度。无论产生还是执行,都有两种类型,一个是分散的,或者非专业化的;另外一个是集中的、专业化的。分散的、非专业化的就是我们社会当中自发的从上到下,集中的、专业化叫从下到上。
如果这样,我们就看到有四种可能的制度,第一种制度无论是产生还是执行,都是分散出现的,你不知道谁设计的它,你也找不到有专门的人去执行它,这个就叫做社会规范;第二种,无论它的产生还是执行,都是有集中的、专业化的机构做的,这个我们叫法律,或者立法,我们有专门的立法机关来造法,在中国是全国人大,也有专门的机构来执行它,包括警察,法院。
但是一般的社会规范,我们找不到谁制造了它,我们不知道谁执行它,在人类长期历史演化中每个人都可以执行,每个人都可以不执行。你看到一些违反社会规范的行为,你可以谴责,你也可以睁一只眼闭一只眼。总之,我们最重要的游戏规则,就是社会规范和法律。
另外在介于这两者之间的还有其他类型,一类的产生是自发的,分散的,非专业化的。但是它的执行有一定的专业化,比如英国的习惯法。习惯法不是任何一个机构制定的,但是它是法院执行的。
我们中国传统的“礼”,可能介于社会规范和立法之间。“礼”不是政府制定的,但另一方面,大家觉得好像是儒家制定的“礼”,儒家是一批专业化的人才。在礼的执行当中,既有分散的,如大量的“礼”是民间执行的,也有一部分得到了法律的认可,比如县太爷在判案的时候,传统的“礼”是判案的依据。所以它介于这法律和社会规范二者之间。
我们还可以更多地细分,我们的社会制度或者游戏规则简单地说就是这样一些东西,都可以归结这几类,包括我们的文化也可以说是社会规范。
3、社会规则的基本功能:激励与协调
下面我简单给大家分析一下社会规则的基本功能。这里要讲的有些是在某种制度情况下人们如何行为,有些是这些制度本身是如何形成的。我大体归结了人类所有的制度、游戏规则的四大作用:第一是激励功能,提供正确的激励,当然也可能是错误的激励;第二是协调功能;第三是承诺功能;第四是信号功能。
图四:作为激励机制的社会规范或法律
先看一下激励功能。刚才已经谈到的私有财产制度就有激励功能,包产到户就是激励机制。现在更一般的来讲,在博弈当中,如果没有这些游戏规则的话,我们得到就是不好的纳什均衡。法律是来干什么得呢?如图四,假如说合作是一个合同,我们大家都要合作,如果你不合作的话,你直接得到4,但这个时候你要受到一点惩罚,就是y(或x),从你的所得中减去,因为你违反了合同,要补偿人家。
我们先假定不去考虑图中的a和b。只有这个惩罚y和x足够大,人们才可能去合作。在这里,只要y大于1,x大于1,当你预计你不合作之后,带来的好处要扣除你要承担的惩罚,你觉得不如合作的话,你就会选择合作。这个时候这种法律就可能使得合作成为纳什均衡。
社会规范也一样,社会规范不像法律那么有强制性,但就像我刚才讲的,我们人不只重视物质的东西,也重视非物质的东西,当别人鄙视你的时候,你会有不愉快的感觉。比如,你看到别人的东西,你抓过来自己吃,人家不打你,甚至骂都不骂你,人家只瞪你一眼,你会有什么感觉?你心里会有点不舒服,这就是一种成本。如果有了规范,所有人都要遵守这个规范,你违反这个规范的话,就相当于你要付出一种成本。
这个成本多大?在这里要看人的脸皮薄厚,如果这个人的脸皮很薄,意味着a或b很大,这样的话,别人瞪你一眼你就很痛苦,一晚上睡不着觉。但如果你这个人脸皮厚的话,那你可能不在乎这个东西,这就意味着a或b很低,社会规范对你起不到惩罚作用。
一个社会规范要发挥激励机制的功能,它一定要使得这个惩罚像刚才讲的法律一样,达到一定的程度。当然,对每个人来说,a和b的大小,依赖于社会规范得到普遍遵守程度。如果这种规范大家都违反的话,就没人觉得是一种惩罚了,如果所有人都违反规范的话,意味着每个人脸皮都会变厚。
以腐败为例,如果这个社会只有少数腐败分子的话,一个腐败分子被揭露出来,他就抬不起头来,即使不用使用法律对他惩罚,他的同事,他的朋友,都看不起他,他就不敢怎么腐败。但是如果这个社会腐败普遍,任何一个腐败官员被揭露出来以后,都不觉得有什么,不会受到声誉上道德上的谴责。
本来一个人干了坏事,有两个东西惩罚他,一个是法律,另一个是社会声誉。现在在中国情况下,因为腐败太普遍了,所以声誉机制不太起到约束作用,只能靠法律,这就是为什么监管就变得越来越难的原因。好多腐败官员被审判的时候都是一脸无辜的样子,好多观众也觉得他怎么这么倒霉。我没时间分析更深的东西,我只是说,在这里边a或者b究竟多大,它有一个均衡,这个均衡依赖于遵守或违反法律和社会规范的普遍性。
像我们国家社会问题就非常严重,不仅是腐败问题。比如我们的大学生的推荐信经常造假,我们中国人真的不觉得这是一个问题了,而且觉得很正当。找一个有影响力的老师给你写推荐信,即便这老师不了解你,但这孩子出国,写一个推荐信也不麻烦,自己写好,老师签字就行了,大家觉得这是很自然的事。
同样的事情如果在国外,会被认为是非常丢人的事,不诚实是最丢人的。但在中国,因为大家普遍说谎,没人认为说谎是不诚实的,所以我们造假东西就会这么多,这意味着我们社会规范破坏到如此程度,不大可能是一个合作型社会。
人类走出囚徒困境,或者从不合作走向合作最重要机制,也许就是博弈论研究的重复博弈导致的声誉机制,时间关系不能细讲。简单说,一个社会人们越是有积极性从事重复博弈,人们就越愿意合作。你骗一次人家,得到一次好处,但损害了未来声誉,大家以后不跟你合作,你就没有机会得到合作的好处了,你会觉得骗人划不来。反过来说,一个社会中大家只注重眼前利益,没有重复博弈、长期博弈的可能性,这个社会一定坑蒙拐骗横行。
一个社会是不是有重复博弈的可能性,很大程度上取决于产权制度,在有明确的私有产权界定的情况下,我们从事的就是长期博弈。最简单的例子就是挖矿,如果这个矿的产权是清楚的永久的,你自己不挖还可以卖给别人,这个时候你开矿就会非常注意安全。为什么?出现安全事故损害的是自己。如果这个矿是集体的,国家的,今天让挖,明天可能就不让挖了,能挖的时间你一定会疯狂采挖,掠夺性开采,你也不会买那么多安全设备,事故就会不断发生。
这是非常重要的一点,传统经济学的价格理论只能解释市场是一只看不见的手,它没法解释我这里讲的市场是一双隐型的眼睛,你干了好事,市场能记得住,你干了坏事,市场也能记得住,你不要以为你骗了人家就真的会获得便宜,你早晚会得到报应,所谓天网恢恢疏而不漏,这就是市场。市场不仅是看不见的手,也是隐型的眼睛,这个理论对我们理解中国社会是非常非常重要的。
好多人误解了市场,只从价格理论角度理解市场,没有按照我刚才讲的从博弈这样的角度理解市场,就说所有的坑蒙拐骗问题,最后唯一的解决方式是由政府来管制,政府就成立了各种审批机构,监管机构。你看我们有食品医药局,工商局,安检局,等等。但这种机构越多,骗子反倒越多,因为这种机构本身消灭了社会声誉机制,一个社会没有人在乎自己声誉的时候,你靠政府监管是没办法解决问题的。
图五:作为协调预期的社会规范或法律
制度的第二个作用,是协调机制。协调机制我也用一个简单的博弈来讲(图五)。假如我们有一个门,比较小的一个门,一次只能进一个人。现在有两个人同时到了门口,那现在就有一个问题,如果两个人都急着往进走,谁都进不来,如果两个人都谦让的话,也是谁都进不来,最好是一个先走,一个后走。
图五中,我们假定如果两个人同时抢着进门,撞在一起,每个人亏了1;如果两个人都谦让,延误了进门,也亏了1;但是如果第一个人先走,第二个人让一下后走,第一个人到了2,第二个人得到1,反过来如果第二个人先走,第一个人先走,第一个人得到1,第二个人得到2。
我们再想象,如果你碰到一个人,你预期这个人会先走的话,你的最优选择是什么?后走,你让他一下。反过来说,你预期他后走,你的最优选择是什么?先走。一个人先走,另一个人后走,无论哪一个人先走,哪一个人后走,都是纳什均衡,在这个博弈当中,有两个纳什均衡。
我们人类博弈的最大难题不是有没有纳什均衡,而是有太多纳什均衡,现在我们就面临两个纳什均衡,那怎么办?怎么协调?谁先走,谁后走,我们就得有一个规则。
最典型的例子,如果一个老人和一个年轻人都到了门口,一般让谁先走?老人先走。一个年轻人和一个小孩在门口,谁先走?小孩先走。我们中国人讲一句话叫“尊老爱幼”,这句话就是游戏规则,就是一种文化,一个制度,有了这个游戏规则我们就知道,当一个老龄人和年轻人遇到一起,我们知道怎么处事。我们还有“尊师重教”,老师和学生到门口,老师先走!
这就是游戏规则。有了这些游戏规则以后,我们就可以避免冲突。没有这样的游戏规则,没有这样的文化或习惯的话,可能两个人都谦让,也可能两个人都抢着走,对谁都不好。同样类似的例子还有交通规则,我们在路上开车,靠左行还是靠右行?如果预计错了,你以为别人靠左你也靠左,而他以为你认为他靠右,结果两个人撞在一块,所以我们需要协调,制度就起这样的协调作用。
我们用纳什均衡来解释制度,使我们对文化或制度的认识发生了非常重要的变化。一个企业文化,一个国家文化的实质是什么?就是帮助人们协调出特定的纳什均衡。如果我们心照不宣,我知道你会怎样行动,不需要到了门口还商量谁先走,这会提高很多效率,因为商量会耽误事。有了这样的规则,老年人一般不用谦让,他知道年轻人会尊重他,他应该先走,年轻人一般也不会抢。这就让我们从完全不一样的视角发现,我们的文化实质上做了一个游戏规则来协调人的行为。
一个企业或者一个机构里边,如果没有好的文化,没有形成统一的预期,是非常危险的。好比一个老板,嘴上说我们要重视客户利益,结果一个销售人员卖东西的时候发现这个东西有残次,没有卖给客户,回去后老板反而批评他,推销员说这个产品质量有问题,老板说你管他呢,客户不知道,你卖出去就是了。
这意味着什么?没有企业文化!老板嘴上说要重视客户利益,但实际他的行为不是这样。员工知道老板是这样的话,员工也一定会能把客户能骗一次就骗一次,因为他骗完客户之后有奖金,老老实实拿回去没有奖金。反过来说,如果不合格的产品拿回来了,老板表扬这个员工,那么员工就知道我应该怎么行为。我们说两个企业合并,文化不一样会出现冲突,就类似说一个企业是规定靠左行,另一个企业靠右行,就发生了冲突。
国家之间也是这样,游戏规则不一样,就会发生冲突。这就是为什么人类需要一些普遍的、大家共同接受的游戏规则。无论是中国还是美国之间,还是中国跟欧洲、印度、越南之间,如果我们想在一个平台上博弈的话,我们必须有一些协调我们行动的规则,即所谓共同的普遍接受的价值观,就是共同遵守的游戏规则。
如果我们不承认这一点,那意味着什么?意味着就像开车一样,别人靠左行,我们非要靠右行,冲突就不可避免。反过来也可以这样说,如果我们不接受一些共同的游戏规则,意味着什么?意味着人类的冲突只能用拳头,用武力来解决。
当然我们中国人说,武力足够强大的话,霸道一些也行。所以越是武力不够强大的国家,越需要游戏规则的保护。反倒是武力足够强大的国家,就像社会当中一样,可以霸道一些,可以不守规矩。越弱势的人,越弱势的民族,越需要争取一个普遍规则的保护。
这是我讲的法律和社会规范的第二个作用,协调作用,协调出一个纳什均衡。在这个作用当中,我们也可以发现,好多法律能做的事,其实社会规范都可以做。现在我们有一个趋势,就是把太多的事务用法律解决,这不是一个好现象,法律能解决的问题有限,这么多事要借助成文法解决不是好现象。人类的社会规范,道德规范给了我们一定的灵活性,人类要面临好多复杂的情况,但法律是僵硬的规则。
这里我要提醒一点,我们好多人以为法治社会就是由国家制定法律并严格执行法律,做到任何情况下“有法可依,违法必究“。那不叫法治社会。法治是大家认可的游戏规则,所有人都遵守游戏规则,无论这种游戏规则是政府制定的还是民间自发形成的。你不要以为只有政府制定的法才叫法,法治的法包括所有的游戏规则。
4、社会规则的基本功能:承诺与信号
社会规则的第三个基本功能就是承诺作用,这里特别讲一下法律的承诺作用。什么叫承诺作用?承诺就是你要付出成本,在这种成本的制约下,你事后不会采取机会主义行为。
举个例子,你去买房,说这个房子我看上了,我要买,但我今天没带钱,你给我留着。人家敢不敢给你留?不敢,因为人家给你留下,第二天不你不来了怎么办?你放两万块钱押金,人家就敢给你留,因为不去这两万块钱就拿不回来,这就是承诺。
承诺改变你事后的最优选择,没有这种承诺情况下,违约是最优的,有了承诺后违约就不是最优的了,这就是承诺的作用。就像合同,我们签一个合同就是做一个承诺,只要签字了,违反这个合同,你就要负担这个合同规定的赔偿。
刑事犯罪为什么要政府来公诉,而不是按民法来?民法和刑法不一样,民法就是民不告官不纠,你是当事人,你受害了,你可以起诉他,你不起诉就没人管。但是触及刑法了,即便受害人不起诉,政府也必须起诉。
为什么刑法要这样呢?它使得当事人之间没有商量余地。假如一个富人杀了一个穷人,富人有钱,穷人家属想要钱,很可能由富人提出一个补偿办法,给你一千万。穷人一想人反正死了,有一千万,家庭可以生活得更好,这事就私了吧。但这样的话,就没有办法有效遏制严重的犯罪行为。有了刑法之后,你不能私了,不是给一千万就可以免除责任的,你杀人就得偿命,这就是一种承诺。
下面我要稍微给大家解释一下,民主和法治从这个角度理解,就是政府对公众做出的承诺。先简单讲一下法治,西方的概念就是有限政府,什么意思呢?如果政府是一个权力不受限制的政府,政府说话,老百姓是不相信的,结果反倒对政府不好。无论任何制度下,老百姓和政府之间是有一个博弈的,你也可以限制老百姓某种选择,但是你不可能消灭老百姓的自然选择权。即便计划经济下,我也可以偷懒,你没有办法。
在这里,我们分析一下政府和老百姓之间的博弈。政府力量的强大程度,依赖于政府是不是得到老百姓信任,越得到老百姓信任就越强大,越得不到老百姓信任就越弱。17世纪英国政府变成世界上最强的政府,与两个事有关,一个就是大宪章。今年是大宪章800周年,1215年,英王约翰被迫与一些大贵族签了一个协议,这个协议的核心就是限制国王征税的权力。另一个是光荣革命把政府的权力从国王转向议会,政府权力变小了,但从某种意义上,政府也变得强大了。
在英国光荣革命之前,英国国债只有200万英镑,没有人敢借钱给政府,因为借钱以后他说不还就不还了。光荣革命后,谁都敢借钱给政府,因为你不还钱,就把你赶下去。结果政府能借到的钱的数量大大增加,十年间从200万增加到1700万左右,还在不断增加,这就使得英国政府有巨大的财力在英法战争中占据优势,最后确立了世界霸主地位。
这个例子说明了什么?表面上看,法治是限制政府权力,但实际上会让政府更强大;非法治下,名义上政府无所不能,什么权力都有,但实际上由于老百姓不相信它,本质上是脆弱的。
民主也一样。我们中国古代就有民本思想,像孟子讲的民为贵君为轻,政府就是为人民服务的。但为什么长期以来,我们没有办法让政府为人民服务呢?因为我们只是嘴上说说而已,没有制度保证,他不服务你也没有办法制裁它。
从今天来看,我们需要进行的好多制度变革,就是使政府口头的承诺变成实际承诺,违反这种承诺,你要付出代价,这样人民才会相信你。
制度的第四个功能就是信号传递。碰到一个陌生人,你要不要跟他合作?你可能不敢跟他合作,因为你不相信他。一个人是不是合作,依赖于对未来的耐心。一个人越重视未来,你越可以相信他,他不重视未来,你就没法相信他。我们怎么知道一个人重视还是不重视未来呢?我们可以观察好多信号,那个人知道我们观察,他就可能会有意传递一个信号。
比如送礼,就可以解释为他为了传递愿意跟你合作的信号。他花这么大的代价,给你买一个礼品,就是传递一个重视你的信号。我们好多社会规范也有这个功能。从这个角度来看,有一些社会规范不一定是好的,比如文化大革命,很多人为了当红卫兵,为了表达对毛主席的忠诚,就告发父母,打他老师,这个对社会就很不好。我们今天有没有类似不好的社会规范?也可能有。所以说不是所有的社会规范都是好的。有些不好的,我们就要去改变。
我还想到一个问题,我们常说,中国人最爱面子,好像西方人不爱面子,我一直对这个有所怀疑。西方人有时候比中国人更爱面子。什么例子可以看出来呢?比如说中国人不搞决斗,西方人长期有决斗,就是为了一个面子的事,或者说尊严。决斗到近代才废除,法律禁止以后,实际上好多人还在决斗。英国首相有决斗致死的,美国总统有决斗致残的。像熊彼特,这么著名的经济学家也跟别人决斗过。
决斗可能是为了鸡毛蒜皮的事。两个男人为一个女人争风吃醋,就要冒着生命危险决斗。西方人不爱面子吗?他们比我们还爱面子。中国人还经常讲“好死不如赖活着”,一到生命的事,还是让一步算了,好多看法不一定对。当然,决斗就是很坏的社会规范,所以被废除了。
还有一类社会规范,比如说过去的羞辱性惩罚。怎么羞辱呢?你犯罪以后,刻字或游街,这种羞辱最后是不利于人改造的,不利于人类合作,所以西方早就废了,我们直到现在都没有完全废除。我昨天还看到一个地方开什么公判大会,公判大会就是羞辱性惩罚。这些东西都值得我们思考,所以有些社会规范不一定是好的,有些当时是好的,但随着社会的发展,也可能变坏,这就需要我们去改变它。
我前边给大家简单介绍了从纳什均衡或博弈论的角度看,社会制度或游戏规则起的几个作用。分析这些可以看出,有演化博弈理论帮助,我们的分析会更好一些。比如人民公社为什么会使人与人之间变得越来越互不信任,农民变得越来越懒?传统中国的农村,什么样的人能够致富?勤劳的人可以。勤劳致富是中国人的传统,人民公社化之后,勤劳就不可能致富了,所以大家变得懒惰了,但这是一个演化的过程。
在我小的时候,老农民还是比较勤劳的,年轻农民就耍奸。为什么?老农民在个体户或49年之前养成的工作习惯不是一下子能改变的,他种地还比较认真,年轻人就不会,他父母也不会教他认真。当我长大的时候,我准备上大学的时候,就是70年代末期,老农民已经变懒了。为什么?一个是原来的老农民有一部分死了,还有一部分随着时间推移,他看别人都耍奸,他也慢慢学着耍奸了。
所以这个制度就会这么去演进。改革开放后,农村实行包产到户,农民很快就变得勤快了。但有些东西很难快速转变,过去致富除了勤劳,还有诚实。做人要诚实,我们父母从小就这样教我们,这点现在没有,很难恢复,还得多少年,我不知道。这些东西我们都可以应用刚才讲的纳什均衡或者动态演化博弈等理论来分析。
5、博弈论的不足与未来
讲完这些之后,我最后给大家讲点博弈论不足的地方。博弈论最大的不足就是好多的假设,跟我们实际生活不一定相符,最大的一点还是理性人。博弈论和过去的经济学一样,假设人是理性的,我们知道,这么多年来好多人包括经济学自己对理性论都提出过批评,这些批评可以归结为三个方面。
一是有限理性。人是想理性,但是你能力有限,记忆有限,加工能力有限,所以你现在做的不一定是对自己最好的。第二是有限毅力,最简单例子就是抽烟,你知道抽烟对你有害,但你还是戒不了烟,这就是有限毅力。第三类叫有限自利,人并不是像经济学家讲都是自利的,还有利他主义。
这三种批评,都有一定道理,但我觉得都没有讲到关键点上,经济学的理性人假设是一种工具,不是经济学家就真的相信人就这么理性,包括刚才说到的股票市场,我们身上也有好多动物精神,我们贪婪,这个东西我们免不了。
真正的批评在什么地方?经济学中理性的假设的缺陷并不是刚才讲的这些,而在于经济学的理性是工具理性。工具理性假设指什么?每个人的偏好是规定的,你总是找一个最好的方式满足你的偏好,这就是我们讲的效用最大化。其实我们看,真正的人最重要的理性是什么?不是工具理性,而是价值理性,也可以叫目标理性,就是你应该追求什么,不应该追求什么,而不是我要追求的都是规定好的,只来研究用什么样的方式去满足。
这是人与人最重要的差别,我们的计算能力是有限的,一个人最需要考虑的是什么东西是值得我追求的,什么东西不值得我追求。在工具理性里,理性在制定目标方面是没有作用的,理性是欲望和情感的奴隶,这是休谟讲的。而在价值理性或目标理性中,理性帮助人们选择目标,所以理性是欲望的主人,这是康德讲的。
作为经济学家,我越来越认识到其实我们人类最重要是有价值理性、目标理性。我们在生活中说这个人犯傻,不是从工具理性角度,而是从价值理性角度来讲。我们经常会聪明反被聪明误,包括我们对金钱,我们对权力的过分贪婪,本质上都是不理性的。
这些人与人之间的差别,我认为不是简单自利还是利他能解释的,而在于我们真正的理性程度。一个人看得越长远,意味着他越理性。一个小偷,一个强盗和一个伟大的企业家,如比尔盖茨、乔布斯或马化腾的差别在什么地方?不是说一个自利,一个不自利,而是一个理性,一个不理性。你当强盗,抢人家,这是很不理性的。这是我觉得最重要的一个问题。
我希望未来博弈论研究的重点,能够往这方面转,我们要重新对理性人本身,理性的含义做出一个界定来。在中国古代,荀子说:“君子乐得其道,小人乐得其欲。以道制欲,则乐而不乱;以欲忘道,则惑而不乐。”真正的君子一定要以道制欲,在他看来,道义,公平公正最重要。小人呢,则满足他短暂的生理的物质的欲望。
如果我们经济学能在这方面做一些突破,我想再回过头来看,博弈论的很多方法还得有一些改变。如果不从这方面突破的话,经济学包括博弈论面临的好多批评就可能还继续存在,这也是我自己努力思考的一个问题。
总结一下我刚才这一个多小时跟大家讲的东西。由于纳什提出的纳什均概念,创造了一门新的学科,就是非合作博弈理论。非合作博弈论使经济学发生了革命性转变——从传统的资源配置理论转变成了人类合作或者说制度激励机制理论。纳什均衡可以使我们很好地研究制度,研究过去我们讲的人与制度之间,好人重要还是好制度重要,可以使我们研究制度演进。
这对我们国家来讲更为重要,我们国家目前有太多坏的纳什均衡,坏的纳什均衡不是说中国人不聪明,而是太聪明,但是结果是什么?对所有人都不利,包括政府官员,那么多的政府官员因贪污而落马。我在《博弈与社会》这本书专门有对政府腐败的分析,大家有兴趣看一下。
腐败有可能是传统意义上的理性选择,那就是工具理性的选择,腐败为什么这么严重?就是你的游戏规则有问题,这种游戏规则导致纳什均衡一定是腐败均衡。我们怎么改变呢?一个办法就是削减政府权力,如果实行了法治,实行了言论自由,新闻自由,那可能不腐败就变成一个均衡。
现在,我们的反腐败措施在一定程度上可以遏制一下腐败行为,但没有改变均衡本身,只是在某一定短期情况下使腐败不是最优的,但不等于以后仍然不是最优的,我只是从个人理性的角度来讲。
最后就是我个人的感受,我希望我们学经济的人都思考这个问题,经济学家应开始注意研究价值理性,研究很多非物质的东西对我们的影响,经济学家过去太执着于研究财富,GDP这些物质的东西,影响人的行为好像都是物质的,其实好多不是,用博弈论我们完全可以研究这些东西。
过去批评经济学家的人都说经济学家太注重研究物质,这有些道理。以色列曾发生过这样一个故事,一家幼儿园规定五点放学,家长应该五点去接孩子,但是有些家长总是去得很晚,家长去得晚的话,幼儿园老师就得等着,不能把孩子一个人扔在那。后来为了解决这个问题,就出了一个新的规定,如果你来晚了超过15分钟,家长要付一笔钱,来的越晚交的越多。传统经济学预测,这样的话家长就不会来晚了。结果恰恰相反,实行新的制度以后,更多家长来得晚了,而且来得更晚。
有人批评经济学家,你看你们经济学的预测是错的。错在哪里?错就错在如果你简单从过去的价格理论理解,你只能从物质层面解释说他害怕罚款。其实人有好多心理成本,过去没有这个制度的情况下,我去晚了会觉得很对不起老师,我要道歉,现在有了制度以后,我去晚了给钱就得了,理直气壮。我有更重要的事,干嘛为了这点钱赶这十几分钟呢。
所以,如果我们只注重从物质利益角度去理解行为,似乎跟经济学过去理解完全矛盾,但是我们如果把非物质的,特别是心理的成本加进去的话,那就完全可以解释这种现象。
这样的事情还有很多,包括在公司里边加班给不给钱,有些人可能加班给钱他就不加班了,加班不给钱他反倒加班,为什么呢?因为不给钱以后,他加班以后有荣誉感,老板会表扬他,心理感觉好。你给钱的话,你这加班不是为了钱吗?我们知道凡是能够用钱买到的东西,都不是最珍贵的东西。我作为经济学家讲这句话,你们可能觉得奇怪,但这是实实在在的。
市场经济最大好处,就是把过去珍贵的东西变得不珍贵了,所以每人都用得起,造福于好多人。过去你出差,要从当地买一些土特产带回来给朋友,那很珍贵,现在不珍贵了,因为那地方的礼品北京都可以买着,所以没什么意义了。但是我们仍然保留了一些用钱买不到的东西。我举这个例子是说我们好多思路还要拓展,但我仍然认为博弈论为我们经济学,乃至整个社会科学提供了一种新的方法。
我在19年前出版的那本《博弈论与信息经济学》,是想把博弈论引到中国经济学界,这本书到现在仍然是被引用最多的经济学书籍,这说明我们中国的经济学家,经济学研究生都开始应用博弈论的方法分析经济学问题。前年出的这本《博弈与社会》,其实是想把博弈论引入整个社会科学,所以这本书有大量的非经济学例子,包括刚才讲的社会习惯、文化,包括大学、政府的运行机制等等。我希望通过这本书,让更多人学会用博弈论的方法分析社会问题。今天晚上我的讲座也是这样的目的。我先讲到这里,谢谢大家!