博弈論七種模型(博弈論究竟講什麼)
2023-05-28 11:31:51 1
先說一個小故事:美國第34任總統艾森豪,在他年輕的時候,有一次吃過晚飯後他跟家人一起玩紙牌,一連六盤,他拿到的都是最壞的牌。於是他變得不高興起來,嘴裡開始不停地埋怨。他的母親停了下來,對他說道:「如果你要繼續玩下去,就不要埋怨手中的牌怎麼樣。不管怎樣的牌發到手中,你都得拿著。你唯一能做的就是盡你所能,打好手裡的每一張牌,求得最好的結果。」
在城主的上一篇文章中,談到了德魯克在《創新與企業家精神》中提到的幾種競爭戰略,制定戰略的過程是決策的過程,推進戰略落地則是執行的過程。無論是決策還是執行,其本質都是一次次博弈的組合。那麼,究竟什麼是博弈?
大到國與國之間的制衡,小到一個人的一生,博弈都是無處不在,無論是商業競爭中,還是日常工作中,生活中,甚至子女教育,兩性愛情。因為每個人都在時時刻刻想著與他人競爭,每時每刻都把自己放在局中人的位置上。這就是俗話說的「人生如戲,戲如人生」,充分運用遊戲規則,做好自己人生的演員,就是博弈思維能力的體現。專門研究相互依賴、相互影響的人群,其理性決策行為及這些決策的均衡結果的理論,就是博弈論。
博弈是有技巧的,博弈論的主體則是規定的若干博弈模型,通俗的說就是人們常說的「套路」。但博弈論是嚴肅的科學,如果有人非要像剝洋蔥一樣地剝開博弈思維,看看各種博弈技巧的核心是什麼,那麼他將會看到兩個字——理性。
從博弈論衍生出來的博弈思維,體現了人的理性思維,也就是說我們的任何結果均是採取某種決策和行動的結果。這體現了博弈思維奉行的「因果論」,正所謂「種瓜得瓜,種豆得豆」。想要得到理想的結果,除了依靠我們的理性分析,採取正確的決策,並付諸行動外,別無他法。
正因為博弈思維是一種理性思維,所以衝動是魔鬼,更是博弈思維的大敵。這裡,我們要認清「理性」的幾個誤區。
理性的人一定是自利的,但世界上又有多少純粹的「大公無私」呢?理性和道德不是一回事,在追求的自利的同時,產生出來的利他才有可能持久。理性的人也可以感性,人不是機器,情感本身就是一種粘性,正確的情感運用會加強理性決策的效果。最重要的,博弈不是你死我活的鬥爭,任何的「不共戴天」都是極端衝動的代表。事實上,博弈更講求的是「均衡」,即在競爭雙方都能利益最大化的情況下,維持勢力均衡的局面不被打破,就是一定階段下最好的結果。所以,博弈的最終結果就是取得「均衡」的局面。
例如,看似核武器是人類和平的魔鬼,但正是因為核武器的出現,才維持了世界長久的和平,因為大國之間的核威懾「確保互相毀滅」,這就讓大國之間誰也不敢先發動戰爭。也正因如此,世界的主旋律從戰爭徵服,走向了經濟競爭,從而結束了冷戰,世界從兩極走向多極。
在博弈論中,最為重要的均衡理論就是「納什均衡」,指的是:每個博弈參與者都確信,在給定其他參與者戰略決定的情況下,他選擇了最優戰略以回應對手的戰略。也就是說,納什假設所有人的戰略都是最優的。
2002年獲得八項奧斯卡提名,四項獲獎的影片《美麗心靈》,講述的就是納什均衡的創立者約翰·納什的人生歷程。在這部影片中,有這樣一個情節:在普林斯頓大學裡,幾個男生正在商量如何追求一位漂亮的女生。大家想了很多方法都覺得不靠譜,而納什開始運用他的博弈思維,給男生們出主意:「如果你們幾個都去追求她的話,她一定會擺足架子,誰也不理。這個時候,你們再想追求其他女生,難度也會加大,因為那些女生會認為你們把她們當成了備胎,也會故意不理你們,以顯示自己的清高。」
幾個男生一聽,覺得納什說得很有道理,便問他該怎麼辦。納什說道:「你們應該先去追求其他女生,這個漂亮的女生就會覺得被孤立了,這時再去追她就容易得多。」
這幾個男生便按照納什的建議,分頭去追求漂亮女生身邊的其他女生,漂亮女生很快便形單影隻。不過這幾個男生並沒有意識到這是納什故意安排的套路,因為他也看上了那個漂亮的女生。結局很容易猜到,納什輕易地追到了這位已經受到冷落的漂亮女生,在博弈中最終獲勝。
先別急著去看這部電影,先來了解一下幾種常用的博弈模型,融會貫通了就會產生更多新的「套路」。畢竟,納什的諾貝爾獎,可不是靠追女生得來的。
(一)鬥雞博弈
在鬥雞場上,兩隻旗鼓相當的公雞狹路相逢。在這種情況下,每隻公雞都有兩個行動選擇:撤退、進攻。如果自己退下來,對方不退,則對方勝利。如果都退下來,則打個平手。如果自己不退,對方退下來,則自己勝利。如果都不退下來,則兩敗俱傷。
最理想的情況就是,對方退下來,自己不退。但現實中很難出現這種完美的局面。往往是對方進2,我進3,就是最好的結果。但是,即便你進2我進3,那麼其中也包含著2的重疊,雙方都要付出代價,也要允許對方的前進,而不是一上來就期待著將對方置於死地。
鬥雞博弈
所以,「鬥雞博弈」所講的是,當兩個強者對抗衝突時,如何能讓自己以代價最小的方式取得競爭優勢。這就是我們常說的「投入產出」計算的決策模型。
(二)賭徒博弈
世上不存在「賭神」,再高明的賭徒也贏不了賭場。因為賭場已經按照每種賭博遊戲的贏錢概率,設置好了總體賠率。即便有人「運氣好」,贏得幾句,但長此下去,必定會輸。「賭徒博弈」所講的就是「過程中有可能領先,但長期來看,肯定會輸」的邏輯。
然而,與「賭徒邏輯」相矛盾的思想是「放棄成本」。因為人們總是因為這樣或那樣的事情,將錯誤的事情進行下去。對於賭徒來說,就是在連續輸錢後,更不願意離開賭桌,總是想要翻本,這就是所謂的「協和謬誤」,即我們常說的「騎虎難下」。
賭徒博弈
對於普通人來說,最常見的便是常說的幾句話:「來都來了……」、「人都死了……」、「大過年的……」、「都不容易……」。因為前期投入成本較高,因此人們總是在給自己找個理由去繼續錯誤的事情,喪失了主動放棄的機會,讓損失持續擴大,最終在不可收拾的局面下「被迫」放棄。
所以,「賭徒博弈」告訴我們的是,如果這已經是一場失敗的遊戲,那麼儘早止損,才是上策。
(三)智豬博弈
豬圈裡有一頭大豬和一頭小豬,豬圈是狹長的,一端有一個按鈕,另一端是食槽。按動按鈕,食槽就有食物掉落進來。如果是小豬去按按鈕,大豬就會在小豬跑回食槽前吃光食物。如果是大豬去按按鈕,小豬吃得慢,大豬跑回來之前,還能吃到小豬吃剩下的。你覺得大豬會去按按鈕嗎?
智豬博弈
事實上,只要小豬沉得住氣,大豬就一定會去按按鈕,因為如果大豬不去,兩頭豬就都會被餓死,而大豬去按了,就還有可能吃到小豬吃剩下的。
這就是大小兩個企業競爭中,小企業以靜制動,後發制人的經典模型。對於處於弱勢的小企業,採取跟隨策略,不貿然行動,往往是更好的選擇。因為俗話說「光腳不怕穿鞋的」,大企業在競爭環境中受到的損失往往會更大,因此大企業在儘可能減少損失的過程中所露出來的市場空缺,往往就已經足夠小企業盆足缽滿了。
諸葛亮遊說江東
為什麼諸葛亮在劉備沒有領地的情況下,也能說服孫權聯合抗曹?孫劉聯合抗曹這件事正是智豬博弈模型的完美應用。赤壁之戰中的孫權一方其實扮演的就是智豬博弈中「大豬」的角色,劉備一方則是揀了大便宜的「小豬」。赤壁正面作戰的是孫權,出大力的也是孫權,但最大的勝利果實——荊州卻被劉備摘去。多出力並沒有多得,少出力並沒有少得,這就是孫劉在赤壁之戰中的博弈結果。為什麼孫權明知如此,卻也要這樣做呢?答案很簡單,因為他不得不這樣做,諸葛亮正是看透了這一點,所以才會信心百倍的單槍匹馬去舌戰群儒。
(四)酒吧博弈
有一個小鎮,鎮上的居民每到周末要麼就是去酒吧,要麼就是呆在家裡。鎮上有一個很受歡迎的酒吧,但只能容納小鎮居民總人數的一半。第一個周末,小鎮居民全去了這個酒吧,導致酒吧爆滿,顧客體驗很差。第二個周末,大多數人回想起上個周末的不愉快體驗,就不再去了。結果,這次去的少數人享受到了高質量的服務。沒去的人又後悔了,心想這次應該去呀。
高考分數經常出現「大小年」,也是酒吧博弈的現實體現。當上一年度的題比較難,導致考生普遍分數較低時,往往下一年度就會出比較簡單的題型,導致下一年度分數偏高,考生競爭激烈。
酒吧博弈
「酒吧博弈」體現的是一種「偵查」思想,其核心思想在於,如果我們在博弈中能夠知曉他人的選擇,然後作出與其他大多數人相反的選擇,就能在博弈中取勝。上文中《美麗心靈》電影中,納什的策略,不就是「酒吧博弈」的體現嗎。
(五)獵鹿博弈
「獵鹿博弈」出自啟蒙思想家盧梭的著作《論人類不平等的起源和基礎》中的一個故事。
一個村子裡有兩個獵人,他們的主要獵物只有兩種:鹿和兔子。如果兩個獵人合理分工,齊心合力,就可以共同捕得1隻鹿。要是兩個獵人各自行動,僅憑一個人的力量,是無法捕到鹿的,但可以抓住4隻兔子。
從填飽肚子的角度來看,4隻兔子可以供1個人吃4天,而1隻鹿可以供2個人共同吃10天。也就是說,對於兩位獵人,他們的行為決策就成為這樣的博弈形式:要麼分別打兔子,每人得4;要麼合作,每人得10。如果一個去抓兔子,另一個去打鹿,則前者收益為4,而後者只能是一無所獲,收益為0。這就是這個博弈的兩個可能結局。
獵鹿博弈
「獵鹿博弈」說明,雙贏的可能性是存在的,而且人們可以通過採取各種措施來有意識地達成「雙贏」。很明顯,「合作共贏」、「利他生意」,便是「獵鹿博弈」的體現。所以世界不再爆發全面戰爭,而是以經濟合作取代攻城略地,在合作中競爭,在競爭中合作,從而共同推動各自的成長。
(六)鷹鴿博弈
我們經常聽到新聞評論中,將某個政治人物稱為「鷹派」,把某個政治人物稱為「鴿派」。鷹總是兇悍霸道,全力以赴,孤注一擲,除非身負重傷,否則絕不退卻。而鴿是以優雅的方式進行威脅、恐嚇,卻從不傷害對手,最終往往委曲求全。
放到博弈場景中,如果鷹鴿相遇,鴿就會迅即逃跑,因此鴿不會受到傷害。如果鷹鷹相遇,就會打到至死方休。如果是鴿鴿相遇,那就誰也不會受傷,直到其中一隻鴿讓步為止。
鷹鴿博弈
「鷹鴿博弈」指出了進行對抗時的兩種不同的對抗策略,即如鷹般地兇狠強硬,以及如鴿子般地溫和隱忍。在競爭關係中,每一方都會採取兩種策略之一,即「鷹策略」或「鴿策略」。
一個企業的管理層演進,往往就是鷹鴿博弈演進,其結果有三種:一種是鷹的世界,原始叢林;一種是鴿的天堂,即烏託邦;還有一種是鷹鴿共生,即生態體系。很多企業追求「狼性文化」,事實上,純粹的「狼性文化」將會透支企業的未來,從而成為原始叢林。對於企業來說,更為良性的則是與鷹鴿共生,形成可持續發展的企業生態。
(七)槍手博弈
這是一個非常有趣的博模型。A、B、C三個槍手不期而遇,必須解決到對方,自己才能下來。在這三個人中,A的槍法最好,10發8中,B的槍法次之,10發6中;C的槍法最差,10發4中。 此時,三人同時開槍,且每人只開一槍,那麼第一輪槍戰後,誰活下來的機率大些?
很多人認為A的槍法好,活下來的可能性大一些,但結果並非如此,存活機率最大的是槍法最差的C。為什麼會這樣呢?只要分析一下槍手所可能採取的策略,就能明白其中的原因了。
槍手A的最佳策略是先殺掉B,因為A會想,因為B對A的威脅要比C對A的威脅更大。
槍手B的最佳策略是先殺掉A,因為B會想,一旦將A殺掉,再和C進行對決,B勝算的機率自然就會大很多。
槍手C的最佳策略也是先殺掉A,因為C會想,B的槍法比A差一些,先把A殺掉再與B進行對決,C的存活機率就要高一些。
結果顯而易見,A被兩名槍手同時瞄準,第一輪下來自然兇多吉少。而C沒有被任何人瞄準,第一輪下來自然活得好好的。
如果改變遊戲規則,假定三名槍手不是同時開槍,而是他們輪流開一槍。
先假定開槍的順序是A、B、C,那麼A有80%的可能性一槍把B殺掉,然後跳過B輪,就輪到C開槍,C有40%的概率一槍將A殺掉,一輪過後仍然是C生存。
即使B躲過A的第一槍,輪到B開槍時,B還是會瞄準A先開槍。即使B這一槍殺掉了A,下一輪仍然是輪到C開槍。
如果是C先開槍,情況又如何呢?C可以向A先開槍,即使C打不中A,A的最佳策略仍然是向B開槍。但是,如果C打中了A,下一輪可就是B向C開槍了。因此,如果必須C先開槍,那麼C的最佳策略就是朝天開一槍,只要C不打中,在下一輪射擊中就會處於有利的位置。
華容道關羽放曹操
說到這裡,大家一定會想到為什麼諸葛亮特意讓關羽鎮守華容道,就是為了讓關羽放掉曹操,以便使得納什均衡不被破壞。在這個戰例中,曹操是A,孫權是B,劉備是C。華容道上就是輪到了C先開槍的時候,如果C真的殺掉了A,那麼孫權就一定會打垮劉備,從而讓納什均衡瓦解。
槍手博弈所指出的就是,競爭者最後能否勝出,不僅僅取決於實力,更取決於依照各方實力衡量所採取的策略。
(八)重複博弈
有兩個商人,同時競爭一個標的。假如兩人對抗,且一方戰勝另一方,則獲勝的一方可得到100元收益,失敗一方則沒有收益。但如果兩人對抗無果,則可能會導致第三家勝出,兩人誰也沒有收益。如果兩人合作平分標的,則可各自獲得50元收益。如果你是他們,你會怎麼做?
旅遊景點的高價菜
再來看一個例子,在旅遊景點的一些餐館,有時候會將菜價定的很離譜,也就是常說的「宰遊客」。為什麼會出現這種現象呢?因為餐館知道,遊客是「一次性」消費,這次宰完他們,下次什麼時候再見還不知道呢。然而,對於非旅遊景點的飯館,期待的是「回頭客」,則可能會讓出更多利潤,提供更好的服務,以便讓合作持續下去。
看到這裡,你應該已經有答案。如果是一場「生死局」,那麼不擇手段也必須拿下,但我們所面對的大多不是「生死局」,而是長期的合作關係。在合作過程中,合作雙方將出現一次又一次的博弈,那麼各自讓利,是讓合作持續下去的前提條件。
如果想要獲得長遠收益,就不應該苛求眼前利益。從這個角度來說,拖欠供貨商貨款,壓榨下遊廠商已獲得更高利潤,都是長期合作中不可取的。
(九)多人博弈
原本廟裡住著一個和尚,和尚每天都到山下的小河裡挑水喝。後來廟裡又來了一個和尚,兩人誰都不想一個人去挑水,於是變成兩人每天到山下抬水喝。再後來,又來了一個和尚,抬水不好分工了,大家都不想去挑水,最後三個和尚都渴死了。
三個和尚沒水喝
這個故事我們從小就耳熟能詳,事實上這個故事背後的邏輯,是由美國著名經濟學家曼瑟爾·奧爾森提出的一個重要的經濟學命題——集體行動邏輯。
企業家都很重視向員工宣揚企業願景,因為他們認為,一個具有共同願景的團隊,就一定會為了實現這個共同願景而採取集體行動。衍生到社會領域,大家認為國人會團結起來不買美國商品以對抗美國的貿易戰,認為那些罵日本的國人不會去日本旅遊……
但集體行動邏輯卻往往與看似合理預測相反,許多合乎集體利益的行動並沒有發生。相反,個人的自私自利行為往往導致對集體不利的結果產生。
濫竽充數
南郭先生不會吹笙,卻混進了樂隊濫竽充數,最後依然獲得了大王的獎賞。實際上,每個人都有「南郭先生情結」,某種程度上都傾向於採取「不勞而獲」的行為。因為集體勞動的成果具有公共性,所有成員都能從中受益,包括那些沒有分擔勞動成本的成員,而付出勞動的成員卻未必能夠獲得等額回報。
事實上,智豬博弈中,小豬就是南郭先生,通過搭便車的方式,獲得大豬的勞動成果。所以,集體中的自利行為是無法被避免的,這不是通過願景宣導就能徹底解決的。對於企業管理來說,儘可能公平的勞動回報,以及儘量客觀公正公開的考核標準,是解決集體行動邏輯的保障。
(十)零和博弈
兩個經濟學家甲和乙,兩人在路上發現一坨狗屎。甲對乙說:「你把狗屎吃了,我就給你5000萬。」乙經受不住誘惑,就把屎吃了。
兩人繼續走,這時兩人又發現一坨狗屎,乙又對甲說:「你把狗屎吃了,我也給你5000萬元。」甲正巧正在為損失了5000萬懊悔,一看能有機會把錢賺回來,就毫不猶豫地把狗屎吃了。
走著走著,甲突然大叫起來:「一個億呀!區區兩坨狗屎,就創造了一個億的GDP!」而乙卻幽幽地說:「事實上,我倆誰都沒賺到錢,還吃了兩坨狗屎。」
這個笑話背後的邏輯是,社會的經濟總量是恆定的,GDP的增值並不一定代表經濟總量的增值,競爭的結果只不過是財富的轉移而已,這就是所謂的「零和博弈」。
零和博弈
「零和博弈」是非合作博弈,各方都以自己的最大利益為目標,通過侵略、剝削的方式,去掠奪總量有限的財富。過去的戰爭邏輯,現在的仇富邏輯,都是「零和博弈」的邏輯,因為大家都認為,你的財富多了,我的財富必然就會減少。所以,「零和博弈」是利益對抗程度最高的博弈,甚至是你死我活的博弈。然而,其結果往往是既無法實現集體利益最大化,也無法實現個人利益最大化。因為,「零和博弈」從一開始就以破壞「納什均衡」為目標。
(十一)非零和博弈
「非零和博弈」也是一種非合作博弈,但博弈各方的收益或損失的總和不是零值,也就是說,一方所得未必代表著另一方受損,這就與「有你沒我」的「零和博弈」存在著本質上的區別。
著名的「囚徒困境」就是「非零和博弈」最具代表的例子。兩個共謀犯罪的人被關入監獄,不能互相溝通情況。如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢1年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄10年;若互相揭發,則因證據確鑿,二者都判刑8年。對於兩名囚徒來說,最好的選擇是什麼?
囚徒困境
如果都選擇沉默,則各坐1年牢,看似這是最好的選擇。然而,由於無法確定對方究竟是沉默還是揭發,因此也存在著因為被對方揭發而變成坐10年牢的風險。所以,兩名囚徒由於無法信任彼此,因此傾向於互相揭發,這樣當對方沉默時,自己無罪釋放,而當對方也揭發時,至少坐8年牢比坐10年牢還能少兩年。
「非零和博弈」又分為「正和博弈」與「負和博弈」。
正和博弈
「正和博弈」是雙贏博弈,通俗的說,就是「一加一大於二」。目前的所有商業合作,基本都是「正和博弈」,其目的都是達到雙贏。因此,越來越多的企業講「利他」,並非是要做慈善家,而是以合作來取代對抗,儘早建立「納什均衡」,從而取得長期獲利的局面。
鷸蚌相爭,漁翁得利
「負和博弈」則是一種雙輸博弈,衝突的雙方最終兩敗俱傷,都有不同程度的損失。這種事例比比皆是,例如兄弟姐妹相互爭玩具,結果失手打碎玩具,最後誰也沒得玩。足球比賽中,一名球員被鏟倒,爬起身來將鏟他的球員推倒,結果兩人雙雙被紅牌罰下。而我們耳熟能詳的「鷸蚌相爭,漁翁得利」,則更是將鷸與蚌之間的「負和博弈」演繹的淋漓盡致。
在商業競爭中,儘可能避免人為製造「非此即彼」的狀態,應該去創造「正和博弈」環境,否則最終很有可能出現的就是,誰都沒有得利。
在整個人生中,博弈無處不在,博弈思維與積極進取的人生態度是一致的。人生如同一場遊戲,只是無法Save和Load,所以採取正確的策略,對於人生中的每個階段都非常重要。因為人生本身就是一場博弈,而人則永遠是博弈中的局中人。
,