高點研究所
首頁劉邦經濟教室 歷期 什麼是混合策略(Mixed Strategy)?如何求解?
篇名
什麼是混合策略(Mixed Strategy)?如何求解?
作者
劉邦啟
說明
發佈時間:20201113

你猜拳的時候,會一直只出同一種拳嗎?瘋狂出石頭?不太可能吧~大多數的人都會不同的拳輪著出吧?這其實就是「混合」策略,相對而言,假設有一個不理性的人,他永遠都只會出石頭,那我們就會說他採取的是「單純」策略。

在賽局理論中,每個參與者都會在考量其他參與者的決策下,選出自身最佳選擇,當所有參與者都這樣做,所得出的賽局均衡即稱為Nash均衡(Nash equilibriun)。若均衡時賽局的參與者們,都只各選擇了一個「明確且單一的行動」,也就是參與者採取的都是單純策略,此時得到的均衡就稱為單純策略Nash均衡(pure strategy Nash equilibriun);假設參與者們採取的策略,不是在各個行動中擇一,而是在不同行動中各採取「一定的機率分配」,也就是參與者們採取了混合策略,只要參與者之一採取了混合策略,所得出來的賽局均衡解,就稱為混合策略Nash均衡。

舉例來說,如果有兩家互相競爭,但實力其實差不多的廠商,都在考慮是否要打廣告來搶市場,當都不打廣告的時候,兩家平分市場,每一家都各占有一半的市占率,但是他們都知道,只要先打了廣告,都可以一下子搶到更多的顧客,以賺到更多的利潤,那他們會選擇打廣告嗎?你應該可以想像,如果兩家一起打了廣告,那還不如不打廣告呢!因為兩家一起打了廣告,還是回到最一開始,兩家平分市場,每一家都各占有一半的市占率的情況,但是他們卻都多花了廣告費,只會使利潤一起下降而已,所以都不打廣告?那也不行,你只要不打廣告,對方就有誘因打廣告,結論是?沒錯,就因為擔心對方先打廣告了,所以明明就知道打廣告會賺比較少,但是為了防止賺更少,所以只好選擇打廣告,又因為選了一個如此明確的結果,這個選擇我們就會稱為單純策略,又因為選擇的過程都有考慮對方的反應,去選擇自己的最佳,符合Nash均衡的意涵,和在一起,我們就會稱這個結果叫做「單純策略Nash均衡」。

相對的,剛剛的猜拳遊戲,或是你有玩過吹牛遊戲嗎?你覺得每次的互動過程和結果,和下一次的一樣嗎?會一樣才有鬼喔,你朋友每次都被你騙,你會每次都用一樣的手法騙他嗎?不可能吧~就是要偶爾騙、偶爾誠實,玩到其他人不知道你是在騙還是真的對嗎?表示在10次的出牌裡面,你不會每次都誠實也不可能每次都吹牛,偶爾要吹牛偶爾誠實,下家也要有時候抓有時候不抓,這時候才會讓其他玩家不知道怎麼樣才是最好的,這時候得出來的均衡不是一個確切的選擇,而是在各種行動下,各採取一個機率,讓其他玩家無所適從,這就是「混合策略Nash均衡」的意涵。

因此在回答混合策略Nash均衡時,不會是回答「某個確切的行動」,而是回答採取各個行動的「機率」各是多少,將所有玩家的機率都表達出來,這就是「混合策略Nash均衡」。你如果被別人抓到你特別愛出剪刀,跟你猜拳的朋友只要一直出石頭,長期而言報酬一定更好!那你朋友贏,很明顯的就是你輸了,也就是觀念上如果本身採取之選擇,會讓其他玩家的「某個行動」具有優勢,直觀上來看,在一些特定的賽局或遊戲設定下,別人有優勢相對而言就造成了本身的損害,因此該怎麼出拳呢?理論上每個玩家都應該採取採取一組機率配置,讓其他玩家在採取任何行動下之期望報酬都相等,在如何採取行動都沒有優勢下,對方就會無所適從,這時才是自己存活或勝利的關鍵。

關鍵詞
混合策略、 Nash均衡、單純策略
刊名
劉邦經濟教室-同學舉手問
同學舉手問
你可以自在發問,老師會親自回覆,經典問題、精彩解答將集結成庫!
姓名:
手機:
Email:
我要發問:

※僅可上傳圖片或文件檔,最多上傳5個檔,總容量需小於10MB。

本人同意高點‧知識達公司及其關係企業與合作對象,得直接或間接蒐集、處理及利用本人之個人資料。