決策思維

人的決策天生會偏誤,最主要的原因是百萬年的演化內建的本能。
比如為什麼人容易輕信沒有根據的說法,而且會堅信不移。這個根源是在我們在原始時代沒有時間去考據,如果有聽到沙沙聲,需要做的是立馬拔腿就跑,而非去驗證是風吹還是老虎。甚至可以用達爾文來說,有查證習慣的人都死了。

很多經典的人類偏誤在經濟學領域有一個新興學科是行為經濟學 [Behavioral Economics] (或者相近的行為金融學)

  • reference:《高勝算決策:如何在面對決定時,降低失誤,每次出手成功率都比對手高?》

以下為了避免混淆先提出一個補充,心態和思維都是相同意思,對應的英文都是Mindset。

神經可塑性(Neuroplasticity)

要校正我們對這個世界的直覺,我們需要先了解大腦具備神經可塑性(Neuroplasticity),也就是腦神經是會增長的。以兩種心態成長型心態(Growth Mindset)和固定型心態(Fixed Mindset)來說,這兩個心態並不是非黑即白。 而是一個光譜,舉例來說,可能普通人可能是75%的固定型心態-25%成長型心態。

固定型心態會認為沒有天分是做不到的。舉例來說,台灣大部分的人看到畫畫的人,往往會用自己沒有畫畫天分,只有少數人有畫畫天分作為藉口,因此就完全不畫畫。

成長型心態是了解練習是會提升能力,所以畫手樂手一直在訓練。畫畫的人,是會體驗到進步是需要大量練習的,因此別人口中的天份,其實只是經驗的累積。

要理解神經可塑性的例子,有人切除胼胝體(Corpus callosum)之後,單側腦仍然演變成具備完整個決策能力的腦。
改變大腦的方法很多,包含學習新的領域、吸收新知、接觸新的環境、冥想[Meditation]、……。

只要能認知到人腦具有很強的改變結構可能性,就會逐漸往成長型心態發展,我們要做的是用長期的思維練習讓自己逐漸轉變成100%的成長型心態。

確定性思維 vs 機率性思維

為甚麼我們會傾向簡化問題,因為前面提到的,人在百萬年起跳的演化尺度上,都是沒有太多時間和資源去計算眼前的風險和威脅。

而生活中,我們也有經驗上的奧卡姆剃刀法則,比如你的眼鏡遺失,可能是單純忘在某個地方,或者是你的房間剛剛被外星人入侵,他搶走你的眼鏡之後把你消除記憶。直覺上就是簡單的狀況比較合理也比較容易發生;但也因為這種趨向用簡單的解釋也造就了固定型思維的思考固化問題。

過度簡化 - 確定性思維

我們先用下圖來說明什麼是過度簡化:
(圖片來源:https://www.mathworks.com/discovery/overfitting.html)

通常我們會將過度(overfitting)的解釋稱為腦補,人腦還是相信存在一個比較通用的規則。但是因為確定性心態,反而經常過度簡化到右邊Underfitting的程度。

人和其他動物都會有各種信仰的行為,或者有賭徒心態等問題。因為確定性是動物都本能地想找到一個因果關聯性,鳥類哺乳類各種動物都會試圖尋找一種歸因,其實就是信仰行為,因為遠古時代沒有科學化的方法驗證,人類是到近代才有科學系統可以驗證。

特別是古代資訊不發達,無法執行統計的行為,人們只能以自身看到的結果來推論關係,在古代會出現各種以現在來看很詭異的治療方式,比如放血療法、冷熱乾溼理論、打雞血療法…..。可能或許少數的人被做了奇怪的治療,但是還沒死,就會被認為是有效。

現代科學化的思維就是理論需要有足夠的實驗證據支撐,也就是統計的思維。

成長型思維 - 貝葉斯推論

貝葉斯思維可以用一句簡單的話概括,我們會基於新的資訊更新腦中的想法,這也是的基礎。

雖然這個世界是隨機性的世界,好在我們現在已經有科學化系統了,已經具備統計的概念,一件事情需要足夠的論證和統計上的支持,才有比較強勢的信任度。

貝葉斯思維來自於貝氏定理(Bayes’ theorem),用來描述已知一些條件下的機率。公式為:

P(A∣B)= P(B∣A)×P(A) / P(B)

主要意思為新認知的機率,會基於已知的事件機率去更新這個事件的機率。簡單說就是我們會基於看到新的證據,改變我們對這個世界的假設。

期望值思維

在統計的基礎之上,去預測未來的情況就是機率思維,未來可能是幾種可能之一會發生。而每個發生的獲利率x發生率的總和就是期望值。

比如一個箱子中有兩個紅球,三個白球,遊戲成本玩一次20元,抽中白球沒獎金,抽中紅球獲得40元,整體遊戲期望值是-4,平均每完一局會虧4元,這個遊戲長期玩越久,虧損越多。如果抽中白球沒獎金,抽中紅球獲得60元,則遊戲期望值是+4元,玩越久賺越多。

要訓練期望值的思維就要面對不確定性和隨機性,比如比賽就是很好的訓練、或者卡牌遊戲、桌遊等。
面對未知和隨機的思維要使用期望值EV(Expected Value),EV是在大量的統計會呈現的趨勢,要做的事情就是讓勝率x結果是正期望值(+EV),反之如果長期是虧損則是負期望值(-EV)。

很多人分不清賭博和投資,其實只要用EV來看即可,賭博是-EV,投資是+EV。 會跟EV相伴的另一個概念是波動,短期的波動會讓人誤解,困難之處在餘人腦天生不是隨機性思維,會把單一次成敗歸因。

要訓練到思考方式是以+EV為目的,如此只要大部分的決策是+EV,長期就會累積出可觀的結果。 怪獸訓練名言是「不要高估一天所能達到的成就,也不要低估一年所能累積的效果」。

訓練環境

在不確定的環境中訓練期望值思維是很好的方式,舉例來說,賽局類型的四象限(完全訊息-不完全訊息)x(決定性-隨機性),其中不完全訊息x隨機性的遊戲就有最強的訓練效果。

經典理論就是賽局理論中的Nash均衡的混合策略。Nash均衡的混合策略就是用機率組合的方式去讓期望值最大化。
舉例來說 剪刀石頭布要怎麼玩可以保證結果 EV(Expected Value 期望值) ?
當玩一萬局的時候 你只要維持 1/3機率石頭 1/3機率剪刀 1/3機率布
對方不管出什麼 都是1/3場次勝 1/3場次負 1/3場次平 如果勝是+1, 負-1, 平+0
這樣不管打一萬局或一百萬局期望值都是0 這就Nash均衡的混合策略。

麻將撲克牌這種隨機性的遊戲,在AI眼中就是剪刀石頭布,要做的就是用機率和期望值的方式去執行每一步。
卡牌遊戲中,好的卡牌就是期望值高的組合。

面對波動

什麼是波動,以這張圖為例:

一般人都會直覺認為過程是平穩的,但實際上很坎坷。而上圖其實還是帶有誤導,過於平緩。

真實的波動是你為這樣:(藍線)

但實際上是這樣:(紅線)

(圖片來源:【撲克少年】撲克雜談 #1 職業德州撲克牌手到底是什麼鬼?四大成為職業牌手必經的難關)

也就是可能會有一陣子資金甚至連原本的本金都不到,某段時間是虧損狀態,這種時候我們會稱為是下風期。

這也是為什麼心智韌性[Resilience]跟EV思維也是相輔相成的,短期的下風期心態開始崩,導致做出了-EV決策,後續結果會更慘。因為往往不理性的決策又會做出期望值更差的行動,表面上感覺是諸事不順,以為只是運氣不好,實際上是因為心態崩了,開始做各種不正常的決策。

面對下風期

如何面對下風期推薦這個影片:#想到就拍2|聊聊德州扑克的下风期,你真的是在下风期吗?我是怎么处理的

裡面提到的重點,第一個是繼續精進自己,提升自己的期望值,這樣可以即使處在下風期,也可以虧損的更少。

另一個點可以體現這是一個期望值遊戲:打更多局,因為這是一個期望值的決策,我們的結果是來自於場數x期望值。因此度過下風期最好的方式就是直接撐大母體數,實現均值回歸。

那當然這又回到第一個問題,你必須是+EV的能力,如果你是-EV能力,撐大母體數只是放大虧損。


tags:

  • [[Game Theory]]