微觀經濟學高鴻業(yè)第十章博弈論初步ppt課件
《微觀經濟學高鴻業(yè)第十章博弈論初步ppt課件》由會員分享,可在線閱讀,更多相關《微觀經濟學高鴻業(yè)第十章博弈論初步ppt課件(35頁珍藏版)》請在裝配圖網上搜索。
第十章 博弈論初步,一、博弈論和策略行為 二、同時博弈:純策略均衡 三、同時博弈:混合策略均衡 四、序貫博弈 五、其他的經典博弈案例,Neumann 1903--1957,西方經濟學·微觀·第7章 1,一、博弈論和策略行為,1.博弈論的產生與含義 :博弈論在20世紀50年代由數(shù)學家約翰·馮·諾依曼(Von Neumann)和經濟學家奧斯卡·摩根斯坦(Morgenstern)引入經濟學,目前已經成為主流經濟分析的主要工具,對寡頭理論、信息經濟學等經濟理論的發(fā)展作出了重要貢獻。 博弈論是研究在策略性環(huán)境中如何進行策略性決策和采取策略性行動的科學。在策略性環(huán)境中,每一個人進行的決策和采取的行動都會對其他人產生影響。因此,每個人在進行策略性決策和采取策略性行動時,要根據(jù)其他人的可能反應來決定自己的決策和行動。,2.幾個基本概念,(1)博弈參與人 參與人或稱局中人,是指博弈中的決策主體,即在博弈中進行決策的個體。參與人既可以是個人,也可以是團體(企業(yè)或國家)。每個參與人的目標是通過選擇行動使自己的效用最大化。,(2)策略 策略是指參與人選擇行為的規(guī)則,也就是指參與人應該在什么條件下選擇什么樣的行動,以保證自身利益最大化。,(3)支付,更多的稱為“得益” 支付指在所有參與人都選擇了各自的策略且博弈已經完成之后,參與人獲得的效用(或期望效用)。,(4)支付矩陣 參與博弈的多個參與人的收益可以用一個矩陣或框圖表示,這樣的矩陣或框圖稱之為支付矩陣,也稱之為博弈矩陣或收益矩陣。博弈參與人、參與人的策略和參與人的支付構成了博弈須具有的三個基本要素。,二、同時博弈:純策略均衡,1.支付矩陣——寡頭博弈舉例,表 10-1 寡頭博弈:合作與不合作,二、同時博弈:純策略均衡,2.同時博弈 “同時博弈”是參與人同時進行決策或行動的博弈。在同時博弈中,在給定其他參與人的策略時,某個參與人的最優(yōu)策略稱之為該參與人的條件優(yōu)勢策略(簡稱條件策略),而包括該參與人的條件策略以及這些條件在內的所有參與人的策略組合稱之為該參與人的條件優(yōu)勢策略組合(簡稱條件策略組合)。,3.占優(yōu)策略 在一些特殊的博弈中,一個參與人的最優(yōu)策略可能并不依賴于其他人的選擇。也就是說,無論其他參與人采取什么策略,該參與人的最優(yōu)策略是惟一的,這樣的策略稱之為占優(yōu)策略。如表10-2所示,通過對支付矩陣的分析可以看出,如果A、B兩廠商都是理性的,則這個博弈的結果是兩廠商都做廣告,即不管一個廠商如何決定,另外一個廠商都會選擇做廣告。這種策略均衡稱之為占優(yōu)策略均衡(equilibrium in dominant strategies)。,二、同時博弈:純策略均衡,4.納什均衡 并不是每個博弈的各個參與人都有一個占優(yōu)策略。如表10-3所示,通過對支付矩陣的分析可以看出,現(xiàn)在廠商A沒有占優(yōu)策略,它的最優(yōu)決策取決于廠商B的選擇。如果廠商B做廣告,則廠商A最好也做廣告;但如果廠商B不做廣告,廠商A不做廣告又是最好的選擇。這種均衡就是納什均衡(Nash equilibrium)。所謂納什均衡,指的是參與人的這樣一種策略組合,在該策略組合上,任何參與人單獨改變策略都不會得到好處。即如果在一個策略組合中,當所有其他人都不改變策略時,沒有人會改變自己的策略,則該策略組合就是一個納什均衡。,表10-2 廣告博弈的支付矩陣,表10-3 廣告博弈的支付矩陣,二、同時博弈:純策略均衡,5.納什均衡與占優(yōu)均衡的區(qū)別與聯(lián)系 每一個占優(yōu)策略均衡一定是納什均衡,但并非每一個納什均衡都是占優(yōu)策略均衡。納什均衡是有條件的占優(yōu)策略均衡。 一個博弈可能存在一個以上的納什均衡,但是一個博弈也可能不存在純策略納什均衡,如表10-4所示。,表10-4 沒有納什均衡的同時博弈,例10.1說法錯誤的是( )。 A.占優(yōu)策略均衡一定是納什均衡 B.納什均衡不一定是占優(yōu)策略均衡 C.占優(yōu)策略均衡中,每個參與者都是在針對其他參與者的某個特定策略而做出最優(yōu)反應 D.納什均衡中,每個參與者都是在針對其他參與者的最優(yōu)反應策略而做出最優(yōu)反應 【解析】占優(yōu)策略均衡中,不論其他參與者采取何策略,每個參與者都會選擇其自身的最優(yōu)策略。,二、同時博弈:純策略均衡,6.尋找納什均衡的方法——條件策略下劃線法 對于一個簡單的“二人同時博弈”,可以用一個以二元數(shù)組為元素的支付矩陣來表示,并用“條件策略下劃線法”來確定它的納什均衡。具體步驟如下: (1)把整個博弈的支付矩陣分解為兩個參與人的支付矩陣。 (2)在第一個(即位于整個博弈矩陣左方的)參與人的支付矩陣中,找出每一列的最大者,并在其下畫線。 (3)在第二個(即位于整個博弈矩陣上方的)參與人的支付矩陣中,找出每一行的最大者,并在其下畫線。 (4)將已經畫好線的兩個參與人的支付矩陣再合并起來,得到帶有下劃線的整個博弈的支付矩陣。 (5)在帶有下劃線的整個的支付矩陣中,找到兩個數(shù)字之下均畫有線的支付組合。由該支付組合代表的策略組合就是博弈的納什均衡。,表10-5 寡頭博弈:合作與不合作,二、同時博弈:純策略均衡,【例10.2】考慮兩寡頭廠商A和B的如下支付矩陣,二者的(納什)均衡策略組合為( )。 A.(U,L) B.(D,R) C.(U,R) D.(D,L) 【答案】B 【解析】在一個納什均衡里,任何一個參與者都不會改變自己的最優(yōu)策略.如果其他參與者均不改變各自的最優(yōu)策略,即要求任何一個參與者在其他參與者的最優(yōu)策略選擇給定的條件下,其選擇的策略也是最優(yōu)的。對于本題,當B選擇U時,A會選擇R,因為5大于3;當B選擇D時,A會選擇R,因為2大于0。當A選擇L時,B會選擇U,因為4大于3;當A選擇R時,B會選擇D,因為1大于0。因此,依據(jù)納什均衡定義,可知(D,R) 是納什均衡。,二、同時博弈:純策略均衡,7.囚徒困境 囚徒困境的博弈模型的假設條件是:甲、乙兩個被懷疑為合謀偷竊的嫌疑犯被警方抓獲,但警方對他們偷竊的證據(jù)并不充分。他們每一個人都被單獨囚禁,并單獨進行審訊,即雙方無法互通信息。警方向這兩個嫌疑犯交待的量刑原則是:如果一方坦白,另一方不坦白,則坦白者從寬處理,判刑1年;不坦白者從重處理,判刑7年。如果兩人都坦白,則每人都各判刑5年。如果兩個都不坦白,則警方由于證據(jù)不足,只能對每個人各判刑2年。表10-6的支付矩陣描述了這一博弈。表中的報酬均為負數(shù),以表示判刑的年數(shù)。,表10-6 囚徒困境,三、同時博弈:混合策略均衡,并不是所有的博弈都存在納什均衡。比如,如表10-7所示。這博弈就不存在純策略納什均衡,但卻存在混合策略納什均衡?;旌喜呗约{什均衡是這樣一種均衡,在這種均衡下,給定其他參與人的策略選擇概率,每個參與人都為自己確定了選擇每一種策略的最優(yōu)概率。,表10-7 社會福利博弈,所有參與人的混合策略的組合構成“混合策略組合”?;旌喜呗越M合與參與人的支付的乘積之和為參與人的期望支付。當其他參與人的混合策略確定之后,某個參與人選擇的可以使自己的期望支付達到最大的混合策略是該參與人的條件混合策略(其幾何表示為“條件混合策略曲線”)。不同參與人的條件混合策略曲線的“交點”就是混合策略條件下的納什均衡。可以證明,混合策略均衡總是存在的。,三、同時博弈:混合策略均衡,【例10.3】在一條狹窄巷子里,兩個年青人騎著自行車相向而行。每人都有兩個策略,即或者選擇“沖過去”或者選擇“避讓”。如果選擇“避讓”,不管對方采取什么策略,他得到的收益都是0。如果其中一個人采取“沖過去”的策略,如果對方采取“避讓”,那么他得到的收益是9;如果對方不避讓,那么他得到的收益是-36。這個博弈有兩個純策略納什均衡和( )。 A.一個混合策略納什均衡,即兩人都以80%概率選擇“避讓”,以20%的概率選擇“沖過去” B.兩個混合策略納什均衡,即每個青年人輪流采取避讓或者沖過去 C.一個混合策略納什均衡,即一人以80%的概率選擇“避讓”,另一人以20%的概率選擇“沖過去” D.一個混合策略納什均衡,即兩人都以40%的概率選擇“避讓”,以60%的概率選擇“沖過去”,三、同時博弈:混合策略均衡,【例10.3】續(xù)【答案】A 【解析】根據(jù)題中條件可寫出兩人的收益矩陣,如表10-8所示。注:混合策略情況下的決策原則有以下兩個: (1)博弈參與者互相不讓對方知道或猜到自己的選擇,因而必須在決策時利用隨機性來選擇策略,避免任何有規(guī)律性的選擇。 (2)博弈參與者選擇每種策略的概率一定要恰好使對方無機可乘,即讓對方無法通過有針對性傾向的某一種策略而在博弈中占上風。 從10-8可看出,有兩個純策略納什均衡(沖過去,避讓),(避讓,沖過去)。設甲沖過去的概率為 r ,乙沖過去的概率為 c 。對甲來說,應該使乙沖過去的期望收益等于避讓的期望收益,即 -36r+9(1-r)=0,解得r=0.2;對乙來說,也應該使甲沖過去的期望收益等于避讓的期望收益,即-36c+9(1-c)=0,解得c=0.2。所以,存在一個混合策略納什均衡。,表10-8 兩人的收益矩陣,四、序貫博弈,“序貫博弈”是參與人的決策和行動有先有后的博弈。描述序貫博弈的更加方便也更加自然的工具是“博弈樹”。博弈樹由“點”(包括“起點”、“中間點”、“終點”)、連接點的“線段”以及標在這些點和線段旁邊的文字和數(shù)字組成。在博弈樹中,一個納什均衡代表一條均衡的路徑。在該均衡路徑上,沒有哪個參與人愿意單獨改變自己的策略。,圖10-1 博弈樹,四、序貫博弈,在序貫博弈中,可能存在多個納什均衡的情況。在多個納什均衡中,有些可能并不合理。所謂對納什均衡的“精煉”,就是要從眾多的納什均衡中進一步確定“更好”的納什均衡。納什均衡的精煉方法通常是使用所謂的“逆向歸納法”,具體包括以下兩個步驟: 第一步,先從博弈的最后階段的每一個決策點開始,確定相應參與人此時所選擇的策略,并把參與人所放棄的其他策略刪除,從而得到原博弈的一個簡化博弈。 第二步,再對簡化博弈重復步驟一的程序,直到最后,得到原博弈的一個最簡博弈。這個最簡博弈,就是原博弈的解;而在存在多重納什均衡時,它就是對納什均衡的精煉。,四、序貫博弈,【例10.4】在下面的博弈樹中,確定納什均衡和逆向歸納策略。 答:納什均衡是(決策1,決策3)、逆向歸納策略也是(決策1,決策3)。 (1)(決策1,決策3)是一個納什均衡。在該策略組合上,沒有哪個參與人愿意單獨改變策略。首先,參與人B不會單獨改變自己的策略。如果它單獨改變策略,即將原來的決策3變?yōu)闆Q策4,參與人B的支付將從原來的3下降到0。其次,參與人A也不會單獨改變自己的策略。如果它單獨改變策略,即將原來的決策1變?yōu)闆Q策2,則策略組合就成為(決策2,決策3),參與人A的支付將從原來的1下降到0。 (2)采用逆向歸納法,可判斷逆向歸納策略也是(決策1,決策3)。首先,如果參與人A選擇決策1,參與人B肯定不會選擇決策4。另一方面,如果參與人A選擇決策2,參與人B肯定不會選擇決策4。在此情況下,考察參與人A的選擇。由博弈樹可以看出,參與人A的最優(yōu)選擇是決策1。最終結果是,參與人A選擇決策1,參與人B選擇決策3,即最優(yōu)策略組合為(決策1,決策3)。,五、其他的經典博弈案例,1.智豬博弈 豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,另一邊有一個投食口,每踩一下踏板,投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機會,搶先吃到落下的食物。當小豬踩動踏板時,大豬會在小豬跑到食槽之前,吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完之前,跑到食槽,搶到一點殘羹。,五、其他的經典博弈案例,1.智豬博弈 有關描述:無論哪頭豬按一下按鈕會有10個單位的豬食進槽,但誰按按鈕誰就需要付2個單位的成本。若大豬先到,大豬吃到9個單位,小豬只能吃1個單位;若同時到,大豬吃7個單位,小豬吃3個單位;若小豬先到,大豬吃6個單位,小豬吃4個單位。,五、其他的經典博弈案例,1.智豬博弈,等待,小豬,大豬,按,等待,按,,,,,,,4大于1 0大于-1,,納什均衡:大豬按,小豬等待 各得四個單位(4,4) 多勞者不多得,矩陣分析,五、其他的經典博弈案例,1.智豬博弈,結果是:小豬肯定會選擇“搭便車”策略,而大豬不得不去踩踏板,為一點殘羹,不知疲倦地奔波于踏板和食槽之間。,小樣,肯定不會去踩,我踩,能吃一半,不踩,鐵定餓肚子,唉,沒辦法只能親自動腳了!,我去踩,一口都沒有,我才不去踩呢!,五、其他的經典博弈案例,決定大豬、小豬策略的核心指標:每次落下的食物數(shù)量和踏板與投食口之間的距離。,改變方案一:減量方案。投食僅原來的一半份量。結果是小豬大豬都不去踩踏板了。 改變方案二:增量方案。投食為原來的一倍份量。結果是小豬、大豬都會去踩踏板。 改變方案三:減量并且移位方案。投食僅原來的一半分量,但同時將投食口移到踏板附近。結果呢,小豬和大豬都在拼命地搶著踩踏板。,五、其他的經典博弈案例,智豬博弈的應用: 例1:公司治理。股份公司中,股東承擔著監(jiān)督經理的職能,但股東中有大股東和小股東之分,他們從監(jiān)督中得到的收益不同。監(jiān)督經理需要收集信息,花費時間。 在監(jiān)督成本相同的情況下,大股東從監(jiān)督中得到的好處顯然多于小股東。這里,大股東類似“大豬”,小股東類似“小豬”。納什均衡是大股東擔當起搜集信息、監(jiān)督經理的責任,而小股東選擇搭便車。,五、其他的經典博弈案例,智豬博弈的應用: 例2:股票市場。股市上有大戶,也有小戶,大戶類似“大豬”,小戶類似“小豬”。這時候,對小戶而言,“跟大戶”是最優(yōu)選擇,而大戶則必須自己搜集信息,進行分析。,五、其他的經典博弈案例,智豬博弈的應用: 例3:大企業(yè)與小企業(yè)的關系。進行研究開發(fā),為新產品做廣告,對大企業(yè)是值得的,對小企業(yè)則得不償失,所以,一種可能的情況是,小企業(yè)把精力花在模仿上,或等待大企業(yè)用廣告打開市場后出售廉價產品。,五、其他的經典博弈案例,智豬博弈的應用: 例4:公共產品的提供上也可能出現(xiàn)。比如村里住兩戶人家,一戶富,一戶窮,有一條路年久失修。這時候,誰修呢? 一般富戶會承擔起修路的責任,窮戶則很少會這樣干,因為富戶家常常是高朋滿座,坐車坐轎的都來,而窮戶家只是自己穿著破鞋走路,路修好了他走起來舒服,路修不好他也無所謂。,五、其他的經典博弈案例,智豬博弈的應用: 例5:改革中也有類似的情況。同樣的改革帶給一部分人的好處可能比另一部分人大得多。這時候,前一部分人比后一部分人更有積極性改革,改革往往就是由這些“大豬”推動的。如改革能創(chuàng)造出更多的“大豬”來,改革的速度就會加快。,五、其他的經典博弈案例,2.性別戰(zhàn) 有關描述:一男一女談戀愛,有些業(yè)余活動要安排,或者去看足球比賽,或者看芭蕾舞演出。男的偏好足球,女的則更喜歡芭蕾,但他們都寧愿在一起,不愿分開。,女,足球,芭蕾,足球,芭蕾,男,矩陣分析,五、其他的經典博弈案例,2.性別戰(zhàn) 這個博弈中,有兩個納什均衡:(足球,足球),(芭蕾,芭蕾)。就是說給定一方去足球場,另一方也會去足球場;類似地,給定一方去看芭蕾,另一方也會去看芭蕾。那么,究竟哪一個納什均衡會實際發(fā)生?可能無法知道。但實際生活中,也許是以此看足球,下次看芭蕾,如此循環(huán),形成一種默契。這里還有一個先動優(yōu)勢,比如若男的買票,兩人就會出現(xiàn)在足球場,若女的買票,兩人就會在芭蕾舞廳。,女,足球,芭蕾,足球,芭蕾,男,矩陣分析,五、其他的經典博弈案例,3.斗雞博弈 有關描述:設想兩個人舉著火棍從獨木橋的兩端走向中央進行火拼,每個人都有兩種戰(zhàn)略:繼續(xù)前進,或退下陣來。若兩人都繼續(xù)前進,則兩敗俱傷;若一方前進另一方退下來,前進者取得勝利,退下來的丟了面子;若兩人都退下來,兩人都丟面子。,矩陣分析,五、其他的經典博弈案例,3.斗雞博弈 這個博弈也有兩個納什均衡:如果一方進,另一方的最優(yōu)戰(zhàn)略就是退。兩人都進或都退都不是納什均衡。,矩陣分析,五、其他的經典博弈案例,斗雞博弈的應用: 例1:公共產品的供給也有這種情況。若村子里住的是兩戶富人,有一條路要修,一種可能的情況是,一家修路,另一家就不修;一家不修,另一家就得修(總結:公共產品的供給可能是囚徒博弈,也可能是智豬博弈,還有可能是斗雞博弈,依具體產品而定。),五、其他的經典博弈案例,斗雞博弈的應用: 例2:蘇美兩個軍事集團搶地盤。冷戰(zhàn)期間,蘇美兩個軍事集團在世界各地搶占地盤,也是一種斗雞博弈。一般來說,如果一方已經搶占了一塊地盤,另一方就設法占領另一塊地盤,而不是與對手競爭同一塊地盤。,五、其他的經典博弈案例,斗雞博弈的應用: 例3:警察與游行隊伍。游行隊伍與警察越來越近,這時候,定有一方要退下來,如果警察不讓步,游行隊伍便會向后退;反過來,如果游行隊伍來勢很猛,警察就得撤退。(警察與劫持人質的匪徒之間也是如此) 啟示:若每一方都寄望于對方退下陣來,兩敗俱傷的結局也可能出現(xiàn)。如QQ與360。,五、其他的經典博弈案例,4.市場進入阻撓 有關描述:設想有一個壟斷企業(yè)已在市場上(稱為在位者),另一個企業(yè)虎視眈眈想進入(稱為“進入者”)。在位者想保持壟斷地位,所以要阻撓進入者進入。在這個博弈中,進入者有兩種戰(zhàn)略可以選擇:進入還是不進入;在位者也有兩種戰(zhàn)略:默許還是斗爭。假定進入之前壟斷利潤為300,進入之后寡頭利潤合為100(各得50),進入成本為10。,五、其他的經典博弈案例,4.市場進入阻撓 也有兩個納什均衡,即(進入,默許),(不進入,斗爭)。為什么(進入,默許)是納什均衡?因為給定進入者進入,在位者選擇默許時得50單位利潤,選擇斗爭時無利潤,所以,最優(yōu)策略是默許。類似,給定在位者選擇默許,進入者的最優(yōu)策略是進入。 盡管進入者選擇不進入,默許和斗爭對在位者是一個意思,只有當在位者選擇斗爭時,不進入才是進入者的最優(yōu),所以(不進入,斗爭)是納什均衡,而非(不進入,默許)。,矩陣分析,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 微觀經濟學 高鴻業(yè) 第十 博弈論 初步 ppt 課件
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://m.jqnhouse.com/p-1358241.html