用科學知識打造一名諸葛亮

諸葛亮

有看過《三國演義》的人都知道,諸葛亮基本上就是《三國演義》中最聰明的人,能呼風喚雨就不提了,其中他最最吸引人的本事之一,就是他能料事如神,他不但能預料到老奸巨猾的曹操在赤壁敗後向哪逃,還能七擒七縱孟獲。

在現實世界中,也是有些人比較善於預測的,雖然不至於成為演義中的諸葛亮那般誇張,但也不會比之差。這些人在一項名為「良好判斷計畫」(Good Judgment Project)的大規模實驗中,在預測地緣政治等課題上,以普通人的身份打敗了美國情報局的專業預測員,而且前者比後者的成績要高出30%。

容我重說一遍:這些普通人成功打敗了那些世界公認的頂級預測專家,那些可以查閱機密文件的預測專家。

這難道不就是藏在民間的臥龍諸葛亮嗎?

該研究還發現,當這些人組成團隊後,預測能力更是加倍,其中最優秀的團度甚至曾打敗過預測市場

這些人並非擁有天才級別的高智商人物,也並未掌握特別的情報優勢。他們並不擁有什麼神秘的潛質,或什麼通靈之類的特異功能,他們只是些像你像我一樣的普通人,不過,他們顯然具備一種獨特的思考方式。

什麼思考方式?

活在現代的諸葛亮

「良好判斷計畫」的發起人菲利普.泰特洛克 (Philip E. Tetlock),一位毅力超強的心理學教授(他曾經為一項研究花上21年時間),為這些極善於預測的人們起了一個名字,就叫做「超級預測者」。泰特洛克對超級預測者們進行了詳細的分析,整合出了他們之所以優秀的共同點,並寫在《超級預測》這本書中。

書中給出了許多關於超級預測者的科學解釋,而我認為全書就只為一個重點而展開——普通人該怎樣利用這些科學知識思考,才能準確的預測未來,成為「超級預測者」。

這本書的理論較多,概念較複雜,但這並不妨礙我將它們一次過串聯起來,濃縮在一個故事裡。

你和超級預測者小楊的故事。

你是一個來自未來的學者,你打算研究人是如何做出精準預測的,於是你穿越時空回到了現代,找到了超級預測者小楊。

你穿上了你的隱形披風,戴上可以解讀他人如何思考的儀器,你開始對小楊進行觀察。

小楊和大部分人一樣,可以預測星期一早上上班的時候、辦公室的氣氛會有些死氣沉沉、下班的時候捷運會有許多的人,走在街上他可以預測到他只要步行5分鐘就能到達餐館。

但你知道小楊其實根本就沒有進行什麼預測,這些都是太顯而易見的事情,無需思考就能知道。

儘管如此,小楊卻無法預測隔壁同事購買的彩卷會否中獎,他無法預測捷運會不會忽然故障,他也不知道他步行到餐館的這5分鐘裡會否飛來橫禍或遇上其他意外。

小楊知道,這些都是極小概率的事件,是無法被預測的,因此無需費心去預測。

小楊只對「困難度適居帶」裡的問題作出反應。

這兩件事都很好理解,它們充斥在我們的日常思考中:

  • 預測是可能的,但前提是這事情有清晰規律可循,例如:下班時間的捷運一定人潮擁擠。
  • 預測是不可能完全精準的,因為不確定性和小概率事件是會發生的:捷運可能會發生故障,捷運可能會發生恐怖襲擊。

在超級預測員在預測一件事情之前,他們會先檢驗問題是否落在「困難度的適居帶」(Goldilock Zone),即問題不會太過容易,也不會太難的。

釐清這一點非常重要,因為太容易和太難的問題都是沒有價值的,前者無需預測,後者無法預測。只有困難度剛好落在中間的問題才有價值,例如:某公司在未來6個月的股價走向如何?而不是未來6年的股價走向如何。

基本上,預測時間距越近,準確率就會越高,預測時間距越遠則越容易失準,而超級預測員給出的最佳預測時間距是6個月以內,超過6個月則較難。

小楊打開了電腦,登入了「良好判斷計畫」的網站,開始查看今天剛公佈的問題。

2016年美國的總統競選勝出的會是川普還是希拉里?金正恩會在多久以後卸任最高領導人的位置?還有許多其他的問題。

小楊對這些政治預測蠻有興趣,他選了其中一題開始進行預測。

所有這些問題都有截止日期,通常有幾個月的時間,而在截止之前,小楊可以更改他的答案多次。

你耐心的觀察小楊的一舉一動,他會從哪裡開始預測呢?

你的儀器檢測到小楊的直覺湧現,直覺強烈的顯示了問題的答案,但你發現小楊竟然沒有選擇相信他的直覺,轉而開始上網收集證據和資料,還登入了Google Alert,並設置Google Alert在有關新聞出現時通知他。

你點點頭的表示欽佩,畢竟克制直覺依賴,可是一件不簡單的事情,你對小楊接下來會做的事情越來越感興趣了。

為什麼要克制直覺呢?

一般人傾向於認為,直覺和第六感之類的感覺(也就是我們常聽說的系統一),能在一個人面對問題時給出最準確最肯定的答案,而其背後的心理推論通常是一廂情願的:「如果這事不是真要發生的話,為什麼我會有如此強烈的感覺?」

但對不起,直覺不只常常在應對複雜的問題上失準,也是美國情報局的預測員會敗給超級預測員的主要原因。一般人或許認為,這些訓練有素的情報局預測員具備參考機密文件的優勢,理應能得出比超級預測員更準確的預測,但泰特洛克形容那只不過是「知識的幻覺」,因為人們很容易對一件事情做出直覺上的過度反應,這包括了過度自信和過度懷疑自己的判斷。他們可能只根據某個消息,就認定未來的石油只會漲價而不會降價;或者反過來,因為某個消息而認為石油一定會降價。

這種過度反應還可能會導致另一種認知偏差的出現——「確認偏差」,這種認知偏差你應該不會陌生。當一個人認定了某個事情一定會發生的時候,例如,他認定「石油不會降價」,那你就算給他再多有關石油會降價的證據,他都可能會視而不見,他甚至會主動去找一切有關「石油不會降價」的證據來維護自己的信念,並發展出越來越深的主觀偏見。

人的默認思考方式是直覺思考,而理性思考是罕有的,這意味著,大部分人的思考都免不了認知偏差,而以上所說的,也只是直覺思考的一小部分偏差。

你可能覺得奇怪,那為什麼從小到大,我們都認為直覺才是最準確的預測工具呢?為什麼許多的影視作品,都是推崇直覺,鄙視理性思考的呢?

那是為了提高影視作品的娛樂性,和正確性無關。但這也映射出了人們是多麼喜愛靠直覺作判斷的,當災難發生時,無論任何災難,所有其他的人都可能在猶豫不決,不願意相信之類的,尤其是那些掛起白袍的人,他們說他們需要更多的證據,但只有主角肯定的給出了一個堅定的判斷:「總之,我們必須現在採取行動,否則就來不及了!」

結果當然是主角的直覺對了,可憐的白袍人可能死可能傷,因為做事三思實在不酷,所以他們付出了慘痛的代價。

我當然也不是想說相信直覺或系統一就是不好的,對於一些時常要爭分奪秒,需要快速做決定的職業,例如警察、消防員、運動員之類的,在追捕罪犯、拯救火災難者、投下關鍵的三分球時,他們必須依賴直覺,也只能依賴直覺,而且在緊要關頭,有意識的理性思考(也就是我們常聽說的系統二)的確可能會拖累自己。

但現實世界裡,大部分的人在大部分的時候,都不生活在以上那些爭分奪秒的情況中,你通常都有大量的時間思考你人生的走向,如何更好的完成工作,或者預測老闆這一年會加多少薪水,而在這類可以投入較多時間思考的問題上,理性思考往往能無懸念打敗直覺,皆因直覺思考會產生一系列的認知偏差,而理性思考能對抗這些偏差。這裡只舉一個關於認知偏差的著名例子:

一組球棒和球的價格是1.10美元,球棒的價格比球高1美元,球的價格是多少?

如果你的答案是10美分,那你就錯了,請嘗試仔細的思考。(答案是五美分)

(有興趣知道更多認知偏差,非理性,或系統一和系統二的差別,可以自行翻閱諾貝爾經濟學獎得主——丹尼爾·卡尼曼所寫的著名經典《快思慢想》。)

那既然直覺思考給出的答案比較不準,那是否意味著人們在思考問題時會更願意使用理性思考呢?

不對,哪怕是面對再複雜的問題,人們依然傾向於使用直覺給出答案,這當然是人類大腦長期演化之下的產物,因為直覺思考(也就是看心理學書籍常聽說的系統一)是快捷而省時的,是能節約能量的,而那非常符合原始人大部分的生活狀況,他們需要快速的判斷叢林裡是否有毒蛇猛獸,而不是站在那裡思考毒蛇猛獸的出現概率;他們需要把能量花在身體的勞動上,而不是思考如何解決數學難題。

而理性思考(也就是常聽說的系統二)則緩慢許多,用多了還讓人覺得特別累,這也就讓人自然而然的拒絕理性思考,當然表面上沒有人會拒絕理性思考,但實質上,在面對日常生活的每一個問題,大部分人都不會理性思考。

我記得有某個人物說過,他發現人們可能一年只有意識的思考,或者說反省自己一兩次,而且通常是逼不得已時才會這麼做,如果生活過得舒適自在,則可能完全不曾有類似的思考,這意味著,大部分人不太愛用腦。相比之下,他自己則每一天都會有意識的思考,進行反省。不過這些話的出處我已經忘了,你就當作參考就好。

總而言之,在預測未來這種極度複雜的問題上,直覺所給出的答案往往太過簡單,甚至說充滿偏見和偏差也不為過,在回答複雜的問題上,有意識的思考,理性的思考才能給出最優答案。

而對超級預測員來說,更是如此。

小楊在網絡查找了一些資料後,給出了一個粗略的判斷:

「2016年的美國總統競選,希拉里很可能會獲勝。」

但小楊知道,「很可能」是一個非常危險的詞彙,他修正了一下自己的答案,將之改換成 「有74%的機率,希拉里會贏」。

人們之所以會買下彩卷,就是因為他們相信一夜暴富是可能發生的事情,但「可能發生」是個籠統模糊的說詞,這個詞所帶給每個人的感覺是不一樣的,當你問不同的人「可能發生」意味著多少概率發生的時候,他們會給出1%到99%不等,但實質上,一張彩券的中獎機率只有 1/175,223,510。也就是非常逼近不可能的意思。

相比「可能發生」, 1/175,223,510的概率給人的感覺就不怎麼好了,如果每個彩卷公司都在門口標明中獎的概率只有 1/175,223,510,我想,買彩卷的人會大幅減少。

由此可見,籠統的用詞會導向錯誤的結果。若你在預測過程中,把所有想到的可能性「概率化」,你的思考將變得更精準清晰,成功預測的概率也就隨之上升了。

泰特洛克還發現,把數目分得越仔細——比如,習慣使用「61%,62%,63%」的預測員,其平均成績比那些給出 「60%,65%,70%」,或「60%,70%,80%」的預測員成績更好。

小楊在給出一個粗略估計後,就轉去做其他的事情了。

等到第二天醒來的時候,他重新檢視了自己的答案,並立即發現需要修改的地方。

你非常好奇小楊的想法是什麼,於是你拿起了儀器觀察,發現小楊的思考角度和昨天完全相反,小楊正在思考為什麼希拉里會在總統競選中敗選。

事實上,小楊還從其他各個不同的角度檢驗自己的答案:「如果川普勝利的話,需要什麼條件?現實是否滿足這些條件?」「如果希拉里會敗下來的話,需要有怎樣的前提?現實中是否存在這些前提?」

你知道這是一種應對複雜問題時可用的思考技巧——叫做「費米推論」。

「費米推論」也叫「費米估算」,是由著名物理學家恩里科·費米(Enrico Fermi)提出的推算方式,那個著名的「費米悖論」也是出自於他。

看完全書後我認為,費米推論可以說是超級預測員們最強大的武器。

簡單來說,費米推論是「將大問題碎片化成小問題,再用已知的訊息提出多個小假設,逐個進行估算,以獲得一個較為精準的數目」,這種思考方式能有效的讓你訊息有限的情況下,估算出一個大概的機率。

這樣聽起來好像還是不太簡單,我們直接看書中給出的精彩例子:

彼得·巴克斯 (Peter Backus)是一名寂寞的倫敦男子,他想計算出在這城市裡有多少位適合自己的女性伴侶,他從倫敦的人口(約600萬人)開始估算,留下女性人口比例(約50%)、再找出其中的單身比例(約50%)、再找出適合年齡的比例(約20%)、再找出大學畢業的比例(約26%)、再找出吸引他的比例(約5%)、再找出被他吸引的比例(約5%)、再找出可能與他合得來的比例(約10%),最後符合條件的人大約只有26人。

這一例子說明了找到真愛是多麼的難,但也不是不可能。

超級預測員就是用以上這種方式,估算出一個大概的機率,來做出預測的。希拉里的支持者有多少?找出美國人口、從裡面劃分出不同階層、職業、種族、性別、收入,再根據他們可能會有的傾向(可能偏愛那個政策?比如可能會有約72%的女性比較願意支持希拉里,而反感鄙視女性的川普)估算出大約的支持率。(受2016年美國總統競選的新聞影響而舉例,本文寫於美國總統競選期間)

這雖然不至於讓你100%精準的獲得答案,但當你把複雜的問題細分成較小的問題時,你可以感覺到原本那令人不知所措的大問題(希拉里的支持者有多少?)變成了比較讓人摸得著的小問題(支持希拉里的女性有多少?),那大大的減低了估算的難度,並得以從中一窺事實的可能面貌。

對人的大腦來說,複雜的大問題就像一大片巧克力,你無法將一大片巧克力一口吞進肚子,而費米推論就是把這些巧克力切成碎片,然後逐個攻克瓦解。

如果你能將費米推論結合「事前驗屍」的思考方式,你將會產生更加精準的結果。

事前驗屍的思考方式指的是反向操作,當你在想你怎麼會贏時,你也想如果你輸的話,會是什麼原因導致你輸。

比如,要估算「希拉里的支持者有多少?」時,你也從另一個角度「希拉里的反對者有多少?」思考,並舉出新問題如「如果希拉里失敗的話,原因有哪一些?」,再從這些問題中再分拆出不同的小問題如「FBI調查希拉里郵件這一醜聞,會造成多大影響?」然後再進行估算,用得出的結果修正機率。

小楊在完成了費米估算後,算出了希拉里和川普獲勝的機率,有了這個機率,他就可以把之後的思考建立在調整這一機率之上,而且杜絕了造成偏差的錨定效應(Anchoring Effect)影響。

但小楊知道,這還只是預測一件事情的前戲,是對問題做出的「外部觀點」。他接下來要做的是另一項更細節的事情——塑造自己的「內部觀點」。

你依然在觀察著小楊的所思所想,並很好奇他的內部觀點指的是什麼。

你耐心的觀察著小楊尋找和收集各類有關問題的訊息,其中包括他人對問題的看法、新聞報導、當事人的演說等等的細節,你發現他會為不同的訊息給予不同的輕重權衡。

你觀察了許久,並在自己的筆記本里寫下:「超級預測員,會在預測中使用『貝氏思維』(Bayesian Thinking)。」

錨定效應指的是,人只會在一開始給出的數目上來回更動。例如:交易中買賣雙方在談判時,如果賣家出價較高,那最後的成交結果也會偏高;如果賣家出價較低,那最後的成交結果也會偏低。當然也有可能是買家出價,總之,誰先說出一個數目,誰就對最後的結果產生一定的影響。

你可能覺得自己早就知道這一點,所以不怕,但我記得某個實驗有說過,這一種認知偏差很難防備,就算是知道什麼是錨定效應的人,都還是很有可能受其影響。

那什麼是外部和內部觀點呢?

簡單來說,外部觀點是從宏觀角度來計算,當你建立外部觀點時,你用統計學、大數據等大角度來進行計算。

而內部觀點是從微觀角度來計算,當你建立內部觀點時,你查找閱讀各類有關的訊息細節、新聞、個人意見之類,並嘗試分辨哪些是可靠的訊息,哪些是不可靠的訊息。

而當超級預測員建立內部觀點時,他們的「貝氏思維」會開始運作,來回不斷的調整自己的看法:

例如,「民調顯示希拉里的支持率最高」這一調查有多可信?小楊給予的權衡是「34%可信」,所以他稍微提高了預測希拉里會贏的概率。

「FBI調查希拉里郵件的醜聞,將導致希拉里敗選」,這條訊息的可信度有多大?小楊給予的權衡是「65%可信」,所以他較大幅度的降低了預測希拉里會贏的概率。

各類的訊息和事情的發展,都會讓小楊調整自己的預測,如果今天小楊預測希拉里70%會贏,那後天他也可能會根據某則新聞報導而調整預測,把它降到55%。這一過程會不斷的重複,小楊的預測也會來回調整,至到競選開始的前夕。

每一次發現有新訊息時,你會評估這些訊息的可信度,並給予不同程度輕重的權衡,在以此來調整自己的看法,這就是所謂的貝氏思維。貝氏思維取自於貝氏定理,是一個很有名的算法,也是人工智能裡的其中一種主要算法,不過請放心,要運用貝氏思維並不需要了解貝氏定理的數學算法。

根據泰特洛克的觀察,他還發現,超級預測員擁有一種「成長型思維」而非「固定性思維」,這兩種思維的分別是——「固定性思維」的人在發現自己的錯誤時,會自我安慰的說這沒什麼,或聲稱自己「早就知道」,甚至會把錯誤推卸在別人身上。

而「成長型思維」的人則不介意承認錯誤,因為他們更想要的是搞清楚自己錯在哪裡,他們把錯誤和失敗看成一種成長的養分,有些人還會因為發現錯誤而感到興奮,因為那將帶給來他們更多的知識。

時光流逝,來到了美國總統競選的日子,小楊寫下自己最終的預測結果—— 74%希拉里會獲勝。

你觀察了小楊的整個預測過程,並給他的預測能力打了個 80分(100分是滿分),接著你就乘時光機走了,因為你知道接下來的結果會慘不忍睹。

2016年11月9日,美國總統競選,川普獲勝。

可能會有人很不滿意這個結尾:「我花了這麼多時間看這篇文章,最後所謂的超級預測員竟然給出了一個錯誤預測。」

這當然不是因為我想倒讀者的胃口,而是事實的確如此,許多的預測專家——包括書本中提到中的超級預測員,一樣對2016年的美國總統競選成績預測錯誤。

我有在網上追踪這些超級預測員給出了什麼預測,包括書本的作者泰特洛克,他們大多數都預測希拉里會贏,有些則徘徊在55%左右,也有少數人預測川普會贏。但主體來說,大部分的人都錯誤的預測了希拉里更可能會贏。

結果公佈後,有人到其中一個超級預測員的推特賬號留言,並肆意的進行諷刺。而該超級預測員的回應是:「我承認所有的錯誤。」

但這不意味著他們都被事實狠狠的打臉了,因為就算他們預測80%概率希拉里會贏,而川普只有20%概率會贏,那也意味著,他們從來就沒有否定過川普會贏這一可能,他們從來沒給出川普完全不可能贏,0%可能贏的預測。

而我覺得這一個真實事件正好帶出了《超級預測》這本書的主要的世界觀:

我們生活在概率世界(Probability Land),而不是確定的世界。

所有看起來很確定的東西,都是我們回望過去時產生的錯覺,歷史是確定的,馬後砲解釋和後見之明也是確定的,而未來則充滿著不確定性。

搞清楚了這一點再回望小楊所做的一切,你會發現,所有的預測都是讓自己盡量正確的一次嘗試,並沒有人能夠斷言未來如何進展。

其實就算是我們心目中最聰明的諸葛亮,也因為誤判夷陵之戰、錯用馬謖,而被迫上演「揮淚斬馬謖」的橋段,而也正因為這一次的誤判,讓他此後都無法再有為蜀國一統江山的機會。

但諸葛亮並未就此放棄一切,他依然堅持不懈的嘗試不同的方式進攻魏國。

我說要打造一個諸葛亮,並不是要打造一個能料事如神的人,那種人根本不存在。而是要打造一個總是嘗試保持理性的人,一個讓自己盡可能對未來做出正確預測,做出正確決策的人。

現實世界是複雜的,黑天鵝事件總會發生,而當事實與你所預想的並不相符時,你知道那只是生活中不可排除的不確定性在作用。

正如那一句名言所說的:「我們不曾做錯過什麼,但不知為何還是失敗了。」

儘管如此,這事實卻無法阻止人們持續保持正確的嘗試。

哪怕一再嘗試。

Image Credit: 《赤壁》影片截圖