新四季網

博弈論的正確方法(博弈論11真正的詭道)

2023-04-21 00:07:30 5

我們說了《三十六計》很不靠譜,有讀者就問我,那《孫子兵法》如何呢?《孫子兵法》確實是一本實實在在的用兵戰略總結。但《孫子兵法》並不神秘,它的思想,比如像「知己知彼」、「國之大事」、「多算勝,少算不勝」、「君命有所不受」,在今天都已經是常識性的東西。《孫子兵法》中包含了一些樸素的博弈思想,比如說像「圍師必闕」,就是我們前面說過的增加敵人的選項。

那為什麼說它是樸素的呢?因為現代博弈論比《孫子兵法》要高級得多。

我給你舉個例子。《孫子兵法》裡有一句叫「兵者,詭道也。故能而示之不能,用而示之不用……」,你看這句話有沒有什麼問題?

這句話的意思很簡單,就是說不能讓敵人知道你的戰術意圖,你得迷惑對手。這個道理固然沒錯,但迷惑對手,就得是說反話嗎?

1.詭道的悖論

我上中學的時候喜歡踢足球,我是一個守門員。我的技術不怎麼樣,但是我知道一些理論。我知道罰點球的時候,球到達球門只需要不到0.3秒,守門員不可能在這麼短的時間內反應過來,所以只能事先賭一個方向。點球,是守門員和射手之間的博弈。我還聽說,守門員可以通過射手的眼神來判斷他射門的方向。

有一次踢球,我們隊被判了點球。罰球的那個人長什麼樣、這個球最後踢向了哪裡、有沒有罰進,現在我都忘了,但我清楚地記得他的眼神。他的眼睛不停地瞄我右側的方向。按理說他是想朝右邊踢,可是我突然多想了一步。

我知道守門員應該看眼神來判斷方向,那他是不是也知道?他會不會是故意往右邊看,實際上是想往左邊踢呢?

又或者說,他會不會也想到了我能想到他的詭計,然後給我來個將計就計,還是會往右邊踢呢?

我參加了一次真正的博弈。罰點球是一個可以欺騙對手的遊戲。這種博弈也是博弈論的祖師爺馮·諾依曼當年研究的東西,不過他研究的是打撲克。

在德州撲克最基本的操作,如果你手裡的牌好,你就應該加注;如果你的牌不好,那你就應該不跟了,合上牌退出。對吧?

但打牌這麼老實可不行。牌好就加注,牌不好就退出,那對手一看你加注,不就知道你手裡拿著好牌了嗎?那他不就不跟了嗎?那你又怎麼能贏很多錢呢?你必須得迷惑對手才行。

打牌,一定要善於虛張聲勢。中文大概叫「詐」,英文術語叫「bluff」。有時候你手中的牌明明不好,也要假裝牌好,選擇加注。可能對手被你嚇住就不跟了,你就贏了。但更重要的是,只有讓對手知道你在牌不好的情況下也會加注,他才會不知道你加注代表牌好還是牌不好,他才可能在你因為牌好加注的時候也跟。有時候你的牌特別好,還得假裝牌一般,謹慎地加個小注。

想踢左邊,故意往右邊看;明明不能,但是讓對手以為你能,這不就是「能而示之不能」的《孫子兵法》嗎?

但是馮·諾依曼比《孫子兵法》多了一個洞見。馮·諾依曼說,你既不能有好牌就加注,也不能有壞牌就加注。你既不能往左邊踢就往左邊看,也不能往左邊踢就往右邊看。

只說謊話就等於只說實話,對手只要反著聽就行了!

馮·諾依曼說,想要真的迷惑對手,你必須把謊話和實話混合起來。

2.混合策略

我們前面講的各種博弈,你最終總是選擇確定的一招,這種情況叫做「純策略(pure strategies)」。我們講過純策略的納什均衡。

但是現在咱們考察一下這個點球博弈。比如說,你往守門員的左側踢,守門員也往左側撲,這個局面是納什均衡嗎?不是。在這個情況下你會想改變策略,往右側踢。同樣道理,如果你往左踢,他往右撲,他又會想要改變策略。不論是哪一個組合,你們兩個之中總有一個人想要單方面改變自己的策略……所以點球博弈裡沒有納什均衡。

嚴格地說,是「沒有純策略的納什均衡」。因為沒有純策略的納什均衡,所以博弈論不能告訴你應該怎麼踢才能贏這一把。但是,如果你要參加很多次罰點球,博弈論就可以給你一個指導,幫助你用一個*系統*取勝。博弈論要求你使用「混合策略(mixed strategies)」。

所謂混合策略,就是說你不能一直都往一個方向踢,你應該按照一定的概率,有時候往左邊踢,有時候往右邊踢。

那你說這不是顯然的嗎?這還用得著博弈論嗎?但是請注意,這裡面有個大學問。

請問,你應該以多大的概率往左踢,多大的概率往右踢呢?

咱們假設你往守門員的左側踢有時候容易打偏,你更喜歡往右踢。那你能不能以一半的機率往右踢,以一半的機率往左踢呢?不行。如果你這麼踢,守門員就會堅決撲向右側!因為左邊更值得交給運氣。一半一半這麼踢,雖然你的每一腳都不可預測,但是你有一個非常明顯的統計趨勢可以被對手利用。

那到底應該怎麼辦呢?首先你要考察自己往左踢和往右踢進球的概率分別是多少,然後你應該合理搭配往左踢和往右踢的機率,以至於讓守門員不管是撲左邊還是撲右邊,你進球的概率都是一樣的。

也就是說,你的混合概率選擇,應該把對手能得到的最大報償給最小化。在這種情況下,因為守門員往左往右都一樣,他就沒有什麼確定的好辦法。馮·諾依曼證明,這是對你最有利的混合策略。這個結論,叫做「最小最大值定理(Minimax theorem)」。

這是博弈論的一個基本定理,它涉及到非常複雜的數學,咱們就不細說了。但是這個精神是容易理解的 ——

第一,你要按照一定的概率,混合自己的打法。

第二,你混合打法的這個規律,必須是讓對手無法利用的。

只說實話不行,只說謊話也不行。在90%的情況下說實話,10%的情況下說謊話,也不一定行,因為對手還是可能根據聽實話和聽謊話的實際報償,決定一個最佳應對策略。你必須用最小最大值定理計算出來一個實話和謊話的最佳配比才行。

後來約翰·納什進一步證明,所有的博弈,不管有多少參與者,都至少存在一個納什均衡 —— 或者是純策略納什均衡,或者是混合策略納什均衡。不管你玩的是什麼遊戲,博弈論總能給你幫助。

一個理性的守門員和一個理性的射手玩的點球遊戲,必定是雙方各自使用自己的最佳混合策略。誰不用這個混合策略,誰就會被對手抓住破綻。

《三國演義》裡的「煮酒論英雄」這一段,曹操給劉備說了一番「龍之變化」。曹操說「龍能大能小,能升能隱;大則興雲吐霧,小則隱介藏形;升則飛騰於宇宙之間,隱則潛伏于波濤之內……龍之為物,可比世之英雄。」

我感覺曹操說的有點像最小最大值定理。英雄做事,必須完全沒有可以被敵人利用的規律。

3.真隨機的好處

那你說這要求也太高了,難道罰點球之前還要做個計算不成?是的。如果你要罰的這些點球都價值千金,計算就是值得的。事實上有人統計了1995到2012年間的職業足球比賽中的9017個點球,發現這些真實比賽中的點球結果,和最小最大值定理要求的混合策略納什均衡,高度一致 [1]。

我們大約可以說,職業球員有一種很好的比賽感覺,他們知道怎麼樣才能最大限度地迷惑對手。而且近年以來,有很多球隊已經在使用專門的軟體工具來分析對手和計算自己的策略。比如我們在世界盃期間經常聽到這樣的報導,點球決勝的時候守門員手裡有個紙條,上面寫著對方射手最可能的射門方向。我敢打賭紙條上的建議絕對不是對方射手最擅長的方向 —— 而是一個全面考慮的混合策略。

更了不起的是,同樣的研究還表明,職業球員還執行了相當不錯的隨機性。

人類非常不擅長執行隨機性。比如我要求你以左、右分別是40%和60%的概率踢點球,你會怎麼安排呢?

先踢4個左再踢6個右嗎?還是按照「左右左右左右」交替,再給中間多幾個右嗎?從統計角度看,這些安排都太整齊了,非常容易被人利用。一般人想到隨機性,會強烈地以為應該交替進行。比如你前兩次罰點球都踢向了左側,這一次就可能非常想踢右邊 —— 而如果你有這個心理,對手就可能會利用,他就可能會重點防守右邊。

唯一正確的做法,是執行真的隨機性。比如你可以隨身帶一本書,每次罰點球之前隨便翻開一頁,如果頁碼的個位數是0到3之間你就踢左邊,如果是4到9之間你就踢右邊。

有人考察了都是業餘選手參加的「石頭剪子布」比賽 —— 真有這樣的比賽 —— 發現業餘選手的特點恰恰就是出手不夠隨機 [2]。他們在原則上可以被人用概率論系統性地打敗。

不是真隨機,就會被破解,這個道理和密碼學是一樣的。卓克老師在得到有個課程叫《密碼學30講》,其中專門說過這個道理 [3]。

隨機性,才是真正的「詭道」。這個原理有很多應用。

比如打網球。如果你知道對方的反手比較弱,是不是就應該一直給他回反手呢?不行,那樣的話他就能預測你的回球了。就算你知道他喜歡正手,也得按一定的比例給他回正手,你必須使用混合策略。而職業網球選手真的做到了隨機性非常好的混合策略。他們當然不會隨身攜帶一個隨機數發生器,但是他們比業餘選手更隨機。

再比如足球和籃球中,如果你們隊中有個球星特別能得分,那是不是應該一到前場就把球交給球星呢?不行,那樣的話你的戰術就是可預測的,對方防守球員就會重點盯住你們的球星。球星再好使,你也必須以一定的概率傳球給別的球員。事實上球星在前場很大程度上是起到一個牽制對方防守兵力的作用。

工商局檢查產品質量也好,交警查違章停車也好,一般都是抽查。而你這個抽查可不能有規律。你要是固定在每天下午兩點查停車,別人就會躲過你這個點。最好的辦法是隨機抽查。

我聽說慈禧太后吃飯從來都不是可著一盤菜猛吃,都是面對幾百盤菜隨機地選擇,每樣大概只吃一口,以至於那麼多年人們愣是不知道她愛吃什麼 —— 這樣別人就不容易在她的飯菜裡下毒了。

還有,在「田忌賽馬」中,想要避免被田忌坑,齊威王的最佳策略,也是隨機安排出場順序。

混合策略不是陰謀而是陽謀。專門說謊話是搞陰謀,可是陰謀是能夠被識破的。使用混合策略,你就算把決策方式告訴對手他也沒辦法。陽謀不怕被識破……歸根結底,大家都是納什均衡的奴隸。

參考文獻

[1] Ignacio Palacios-Huerta, Beautiful Game Theory: How Soccer Can Help Economics (2014).

[2] Avinash K. Dixit and Barry J. Nalebuff, The Art of Strategy: A Game Theorist's Guide to Success in Business and Life (2008).

[3] 卓克,07|改進鑰匙:你以為的「隨機」都是「偽隨機」,《密碼學30講》,2018.

,
同类文章
葬禮的夢想

葬禮的夢想

夢見葬禮,我得到了這個夢想,五個要素的五個要素,水火只好,主要名字在外面,職業生涯良好,一切都應該對待他人治療誠意,由於小,吉利的冬天夢想,秋天的夢是不吉利的
找到手機是什麼意思?

找到手機是什麼意思?

找到手機是什麼意思?五次選舉的五個要素是兩名士兵的跡象。與他溝通很好。這是非常財富,它擅長運作,職業是仙人的標誌。單身男人有這個夢想,主要生活可以有人幫忙
我不怎麼想?

我不怎麼想?

我做了什麼意味著看到米飯烹飪?我得到了這個夢想,五線的主要土壤,但是Tu Ke水是錢的跡象,職業生涯更加真誠。他真誠地誠實。這是豐富的,這是夏瑞的巨星
夢想你的意思是什麼?

夢想你的意思是什麼?

你是什​​麼意思夢想的夢想?夢想,主要木材的五個要素,水的跡象,主營業務,主營業務,案子應該抓住魅力,不能疏忽,春天夢想的吉利夢想夏天的夢想不幸。詢問學者夢想
拯救夢想

拯救夢想

拯救夢想什麼意思?你夢想著拯救人嗎?拯救人們的夢想有一個現實,也有夢想的主觀想像力,請參閱週宮官方網站拯救人民夢想的詳細解釋。夢想著敵人被拯救出來
2022愛方向和生日是在[質量個性]中

2022愛方向和生日是在[質量個性]中

[救生員]有人說,在出生88天之前,胎兒已經知道哪天的出生,如何有優質的個性,將走在什麼樣的愛情之旅,將與生活生活有什么生活。今天
夢想切割剪裁

夢想切割剪裁

夢想切割剪裁什麼意思?你夢想切你的手是好的嗎?夢想切割手工切割手有一個真正的影響和反應,也有夢想的主觀想像力。請參閱官方網站夢想的細節,以削減手
夢想著親人死了

夢想著親人死了

夢想著親人死了什麼意思?你夢想夢想你的親人死嗎?夢想有一個現實的影響和反應,還有夢想的主觀想像力,請參閱夢想世界夢想死亡的親屬的詳細解釋
夢想搶劫

夢想搶劫

夢想搶劫什麼意思?你夢想搶劫嗎?夢想著搶劫有一個現實的影響和反應,也有夢想的主觀想像力,請參閱週恭吉夢官方網站的詳細解釋。夢想搶劫
夢想缺乏缺乏紊亂

夢想缺乏缺乏紊亂

夢想缺乏缺乏紊亂什麼意思?你夢想缺乏異常藥物嗎?夢想缺乏現實世界的影響和現實,還有夢想的主觀想像,請看官方網站的夢想組織缺乏異常藥物。我覺得有些東西缺失了