2020年12月5日 星期六

決斷的演算(1/5)

 決斷的演算:預測、分析與好決定的11堂邏輯課

Algorithms to Live By: The Computer Science of Human Decisions

https://www.books.com.tw/products/0010761815



 

這本書的知識含量太高、讀起來過硬&很多數理證明力有未逮TAT


前言:為什麼我們能跟電腦學決策?

演算法的本質是「解決問題的一連串步驟」,參考食譜做麵包、依圖樣打毛線衣案SOP執行工作流程都是某種演算法(1234 if then…)

人類面臨的許多挑戰跟電腦科學家一樣都是:如何運用有限的空間、時間和注意力,因應未知事物和不完整的資訊。本書釐清這些難題的數學架構,闡述工程師如何教電腦發揮最大效用,並了解人腦如何克服相同限制。電腦科學不只能協助我們簡化問題以取得進展,甚至能提供具體的解決方法。

 

Q:要不就買下眼前這棟房子/跟目前的女友結婚?

要不拋下其他選擇(買下或定下來),要不就走人不吃回頭草再找其他標的物。

難處在於「錯過好機會」和「說不定還有好機會」之間徘徊取捨,你立刻發現自己陷入兩難:如果沒有判斷基準,要怎麼知道某棟房子(某個女孩)是不是最佳選擇?但如果看過的房子不夠多,又怎麼知道判斷基準在哪?你取得的資訊越多,越能掌握真正的好機會,但在此之前錯過好機會的機率也越高。那麼你該怎麼做?倘若蒐集資訊反而可能不利,那麼該如何做出明智決定?這種狀況十分殘酷,可以說是矛盾。


大多數人面臨這類問題時,直覺上通常認為必須在取捨間取得某種平衡,得看過夠多的房子才能建立標準,再依據標準找出想要的房子。這種權衡概念非常正確,但大多數人沒辦法明確說出平衡點在哪。所幸這確實有明確答案:是37%。

 

由於我們生活的空間和時間都有限,每個人都遭遇到一類問題。在一天或十年中,我們應該做什麼、或應該不做什麼?應該容忍什麼程度的混亂?什麼樣的秩序算是過度?新事物和心頭好各佔多少比例,才能使生活最讓人感到滿足?



只有人會面臨這類問題?其實不然。半個多世紀以來,電腦科學家一直在探究這類日常困境,有時還試圖解決,像是:處理器該如何分配它的「注意力」,以最少時間執行使用者要它做的工作,同時盡量少做白工?它什麼時候應該轉而處理不同工作,一開始又應該接受幾項任務?怎麼運用有限的記憶體資源最好?它應該蒐集更多資料,或是依據已有的資料採取行動?

 

本書將探討人類演算法的設計概念,也就是:針對每天面臨的挑戰尋找更好的解決方案。把電腦科學解決問題的方法套用到日常生活上,會影響許多層面。首先,演算法能提供實用且具體的建議,協助解決特定問題。最佳停止問題告訴我們,何時該大膽跳過、何時又該留意機會。開發與利用取捨告訴我們,如何在嘗試新事物和享受喜愛的事物間找到平衡點。排序理論教我們如何(以及是否應該)整理辦公室。快取理論教我們如何把物品收進櫥櫃。排程理論則教我們如何安排工作。

 

到了下一個階段,電腦科學告訴我們一套字彙,用來了解這些領域中更深入的原理。卡爾。薩根(Carl Sagan)曾說:「科學不只是知識,更是一種思考方式。」即使是混亂得難以進行嚴謹數值分析或有現成答案的狀況,運用直覺和化簡問題後加以思考所得到的概念,也能讓我們了解關鍵問題和獲得進展。以電腦科學的眼光看問題,有助於我們了解人類心智的特質、合理性的意義,並且探究最古老的問題:人類如何求生。把認知當成「解決環境造成的基本運算問題的方法」仔細探討,可能徹底改變我們對人類理性的看法。

 

跟人類交談、修復損壞的檔案或下贏一盤圍棋等,這類沒有明確規則、缺少必要資料,或是必須考慮多如繁星的可能才能找出正確解答的問題,才是電腦科學最大的挑戰。研究人員為了解決極端困難的問題而開發的演算法,已經使電腦不再需要依賴繁重的計算。相反地,執行實際工作必須接受機率,以時間換取精確性,還要懂得運用近似法。電腦科學衍生的日常問題解決方案,則對人類心智提出完全不同的看法。它們認為生活本就是困難重重,人們犯下的錯誤透露的,是問題本身的困難之處,而非人類大腦不可靠。以演算法的方式思考世界,了解問題的基本結構,以及解決方案的特質,能讓我們了解人類其實已經很了不起,同時更了解我們犯的錯

 

事實上,人類經常面對電腦科學家傷透腦筋的許多難題。我們經常得克服不確定性、時間限制、資訊不足和變動快速的世界,做出決定。在某些狀況下,即使最尖端的電腦科學,也設想不出效率極高又永遠正確的演算法。對於某些狀況,或許根本沒有這樣的演算法

 

然而即使在尚未找到完美演算法的領域,一代代電腦科學家和棘手真實世界問題纏鬥多年後,也得出了許多心得。這些得來不易的規則違反我們心目中的合理性,聽起來也不像數學家描述世界的那些條理分明的嚴密規則。這些規則說:不一定要考慮所有選擇,不一定非得追求看來最好的結果,偶爾可以製造混亂。看到紅綠燈就等一下。相信直覺,別思考太久。放鬆,拋個硬幣。寬恕,記住這個教訓就行。誠實對待自己。

 

我們將深入了解各類日常問題、以全新方式觀察人們遭遇的各種困境背後的美麗結構、認識人類和電腦的解決方式融合程度極高,還將獲得更深刻的東西:我們會有描述周遭世界的新語彙,並且有了機會重新認識自己。

 

 

 

第一章 最佳停止點—什麼時候該見好就收?

盡量羅列選項,小心權衡後選出最好的一個,才是理性決策?實際上由於時間有限,決策過程最重要的面向是:何時應該停止。聘人、租屋、找車位、賣房子,以及尋覓伴侶和投資獲利時見好就收等,都是要在選項逐一出現時做出最佳選擇,它們真正困擾人的是可以考慮的選項有多少。依各狀況條件不同(比如能否吃回頭草、是否有明確標準),這章解釋了37%法則、思而後行法則、臨界值法則等,教你如何避免太早決定或找太久,何時該降低或提高標準以及標準該調整多少

時間是一種成本與限制條件

 

在米國很多高中情侶,彼此上大學之後,第一次回家過4天的感恩節假期後往往會分手=火雞分手,導致此一現象的因素

1.上大學看見更好與更多的對象=本來認識的夥伴失去吸引力

2.遠距戀愛,讓彼此冷靜下來(年輕人本來就不成熟)

3.以上(遠距)阻力與(新對象)吸力的組合與交互作用

 

 

秘書問題

假設

1.你可以跟任一個可能對象談,而且談過的你也能夠排序出第一志願

2.你可以在任何時候決定錄取第一志願的對象,對方也一定會接受

3.時間內錯過沒有錄取,彼此不再等待=不再考慮(不吃回頭草)

 

找房、找人、找伴侶都很類似,

真正的困擾不是該選哪一個?而是可以考慮的選項有多少?

後面會不會遇到更好的對象?要不要用時間換取選擇空間?

實務上沒有那麼複雜大概是設定與給定一段時間,就這個區間內的選項最出抉擇,不會想像有無窮的時間可以測試等待所有可能選擇

 

Merrill Flood

https://www.informs.org/Explore/History-of-O.R.-Excellence/Biographical-Profiles/Flood-Merrill-M

1958年發現37%法則(用總時間的37%來觀察測試=建立篩選標準,之後只要一遇到高過標準的,就錄取)

 

 

為什麼是37%

以上問題與情境中,失敗有兩種

1.太早決定=沒有等到更好的對象

2.太晚決定=錯過更好的對象

孩子18歲上大學了,開始會聯誼認識對象,如果預期最慢要在30歲前結婚(=中間有12年,依據法則是18-22歲之間都是觀察期)

 

難處在於:

1.你不知道所謂的最佳對象何時會出現?

2.透過比較你才知道對象的好或壞(只有相對值而無絕對值)

3.錯過不再重來(這點假設前提在實務上不合理)

4.你在選擇,對方也在選擇=你不知道會來應徵(=你可以選擇)的對象有多少(這點在實務上很真實且殘酷,更殘酷的是對方可能會拒絕你)



 

把握最佳情人

「我嫁給第一個接吻的男人,當我跟小孩講這件事的時候,他們快吐出來了」- 米國前第一夫人 芭芭拉.布希

(很多女人嫁的是第一個跟她發生關係/ 讓她懷孕的男人...  )

 

大學教授Michael Trick的八卦

https://www.cmu.edu/tepper/faculty-and-research/faculty-by-area/profiles/trick-michael.html

當研究生時,運用37%法則,跟當時他遇見的對象求婚,只不過她拒絕了...他之後完成學業,到德國工作走進酒吧跟美女邂遘,六週後開始同居,接著邀請他到米國住一陣子,六年後他倆結婚了...(果然對象好壞與用數學估算是一回事,要發生關係才算數XD)

 

天文之神 克卜勒(1571-1630)的八卦

https://en.wikipedia.org/wiki/Johannes_Kepler

第一任老婆1611年去世(159726歲跟寡婦芭芭拉結婚,此時他40)

他花了很長的時間找尋對象,前後追求11位對象,最後決定吃回頭草跟第五位對象24歲的Susanna Reuttinger 16131030結婚。(ㄜ,老婆死後兩年內跟11位對象交往,真是精力充沛)

 

如果會被拒絕的話,就要提早並且多採取行動

假如邀約後被拒絕的機率是1/2,那麼面談觀察過1/4的對象就該採取行動,而且相對不錯的就要邀約,最後的成功機率約是25%(錄取到最佳人選&此對象接受)

 

涵義與寒意

從是否被拒絕可以觀照反應出自己的身價或條件;自己的身價或條件越可,可以越晚做決定與吃回頭草;如果自己身價或條件不好,就要用承擔被拒絕來換取碰到死耗子,乃至於對更嫩(=沒有自信與自知之明)的對象下手(渣男魯蛇的求偶成功之道XDD)

 

 

完全資訊賽局

前面的找房子、伴侶或秘書:沒有絕對的標準可供參考,只有相對標準(無資訊賽局)

然而就公司找人或學校錄取學生而言,其實有以往的資料庫=具有判別優劣的絕對標準(完全資訊賽局)

e.g., 聯考或智力測驗

來應徵的人學測是95級分,下一位應徵者是96級分以上的機率只有1/20(實際上應該更低)

 

無資訊賽局當中,找到最佳人才的機率是37%;而完全資訊賽局當中找到最佳人才的機率是58%=>擁有判斷依據的資訊,會比沒有判斷資訊成功率高(釣金龜婿的成功率比尋找真命天子的成功機率高)

 

兩者都是在逐漸出現的條件下,做出最佳選擇。基本原則都是:

沒有選擇時降低標準、有選擇時提高標準

 

 

什麼時候賣出房子最好?

你想把舊房子賣出,也花錢裝修

半資訊賽局

你知道自己的成本=設定底價門檻,底於門檻就拒絕

也大概跟房仲聊過,知道大概價碼範圍(e.g., 500-600)=要看你自己是否急需用錢

大約550萬的offer就可以接受,不用堅持等到600萬的報價;或者你也可以等看看後序的offer是否超過550萬,如果沒有,其實吃回頭草也沒什麼不好

 

反之買家通常會找急售的賣家

 

 

什麼時候該找停車位?

It depands on 該停車場的擁擠程度與使用率

越擁擠、使用率越高,距離目的地或出口越遠時,看到有車位就要停

越不擁擠、使用率越低,可以開到越接近目的地或出口時再認真找車位

 

而研究這個問題的UCLA教授Donald Shoup

http://www.shoupdogg.com/

提出的對策與觀點是:

1.騎腳踏車XD

2.免費停車其實一點都不免費(代價是花時間找車位)

3.停車場依據使用率決定停車費率

 

好佩服這些數學控老師,能夠把所謂常識用數學來算出最佳化

 

 

何時該見好就收?

搶匪問題的數學最佳解

成功機率50%時:50%/50%=1 一次行竊成功就收手

成功機率90%時:90%/10%=9 九次行竊成功就收手

同理可用於拋起正面機率為p的硬幣,出現正面時你可獲得獎勵,但出現反面時,你就輸掉所有的錢

 

1997年的蘇聯首富Boris Berezovsky

https://en.wikipedia.org/wiki/Boris_Berezovsky_(businessman)

專長就是最佳停止問題,在俄羅斯解體的過程中,從數學家變成身價30億美金

2013年在上鎖的房間內上吊自殺

 

Hint: 真實世界中的搶匪與賭徒不可能見好就收,政治人物與高階主管亦然(當了課長想當經理、當了經理想當處長、當了處長想當副總、當了副總想當總經理、當了總經理想當董事長、當了董事長想當理事長或者參政)

假設每晉升一階有如賭徒成功機率是50%,則升上課長之後就該收手安份,然而實際上,爬得越高反而越容易把績效攬在自己身上、越容易被看見,繼續往上升遷的機率越高,乃至於掌握組織更多難堪的內幕與營私/讓自己不可被取代(=失風機率降低)直到德不配位&驕傲和放縱讓自己打敗了自己(=身敗名裂)(想到以前的老長官廠長,超有戰力與A型性格,立下越多戰功在公司的言行舉止越放縱與失態,下場成為被美國法院控告與通緝的人物;而台積一些叛逃與投共的高層又何嘗不是如此)

欸,上台靠機會(而不是你個人的聰明才智和努力),下台靠智慧;有沒有智慧要看下台的身段與內心是否平安喜樂(利令智昏,能夠屏除貪念=反愚昧智慧)

Say When

https://eshmanager.blogspot.com/2013/10/blog-post_19.html#more

 

 

隨時準備停止(見好就收)

直覺上所謂理性的決策與最佳解與決策方式是:列出所有可以選項、小心翼翼加以權衡取捨,最後拍板選出當下最好的一個,然而實際上,時鐘與計時器不斷跳動,決策(與思考)過程當中最重要的面向只有一個- 就是何時該拿定主意。

更特別的是時間這個面向只能往前、不能回頭重來,猶豫沒有行動和行動錯誤一樣無法挽回,更嚴肅與殘酷的是:我們在世上只能活一回與走一遭

 

所有最終會招致毀滅的決策(無論機率再小),都不應該趁火打劫與賭一把(時間無法倒流與無法預知未來是決策的不確定性源頭)

https://eshmanager.blogspot.com/2019/10/44.html

 

 

 

第二章 開發與善用—嘗試新歡?還是固守舊愛?

開發是蒐集資料,它能提高發現最佳選擇的機會;善用則是運用現有資訊,取得已知的良好結果,兩者各有利弊。人們大多把決策視為彼此孤立,每次分別尋找期望值最高的結果。其實決策極少是孤立的,如果你思考的是日後面對相同選項時要怎麼做,那麼權衡是要開發還是善用,就非常重要。本章以電腦科學中最能體現這兩者之矛盾,名稱取自吃角子老虎機的多臂土匪問題,闡述應該如何隨時間而改變目標,並且說明為何合理的行動過程多半未必會選擇最好的目標。

 

「新不如舊,新歡是銀,老友是金」or 「人生永遠需要新朋友」

 

開發與善用 Explore/ Exploit Trade-Off

完全不開發新事物=>人生乏味

完全不擅用珍惜舊事物=>喜新厭舊會中很多地雷

 

對於評論家而言,工作是不斷接觸新事物,其實內心渴望舊有與熟悉的事物(去聽老歌、看老電影)

 

而對於進到賭場的賭徒而言,每部吃角子老虎機有如獨臂土匪(好幾台角子老虎機放在一起=多臂土匪):不知道各台的賠率與報酬率,必須每台都稍微測試(開發),然後選定最可能贏錢的那台(善用)

e.g., 測試了兩台,一台玩了15次,96賠,另一台玩了兩次,11

該挑哪一台玩下去?

有人說:第一台,因為期望值高(贏率9/15=3/5)

有人說:不知道或第二台,因為第二台只測試了兩次,不確定其輸贏的期望值

Hint:

相對於合理答案的前提取決於:「你打算在賭場待多久?」

時間又是決策的限制前提與關鍵因素

 

 

把握時間

剛到一個地方與人生來日方長,可以多加嘗試與開發探索

已經住了一段時間與來日無多,請珍惜家人朋友與可靠事物

 

賣座電影有越來越多是續集=挑贏錢的片子繼續投資

 

 

贏錢繼續玩、輸了換一台

這個策略優於仰賴已知輸贏的期望值,也不考慮你有多少的時間可以花在探索贏率最高的機台(=有可能誤殺放棄了贏率高的機台)

同樣道理可以運用在工作與職涯發展上,就是有可能因為短期看不到成長或前景,因而離職(rule of thumb: 待滿兩年再換工作)

 

 

吉廷斯係數

John Gittins

https://web.archive.org/web/20090302101903/http://www.stats.ox.ac.uk/people/academic_staff/john_gittins

 

吉廷斯係數應用的解說

https://mapleduh.pixnet.net/blog/post/48815259

 

考慮折現率(現在比未來更有價值的轉換率)

折現率越高,越不該嘗試新事物,折現率越低,越可以嘗試新事物

 

就財管的應用而言,折現率=資金的機會成本或主觀風險承受度,很多老闆算盤打得很精,希望投資一年損益平衡、兩年回本、三年獲利...其實其資金的成本或投資機會根本沒那麼高(當然很可能老闆看過大風大浪,對於風險的評估與拿捏比基層打工仔來得精準)!

 

Hint

以上兩台餃子老虎機,如果查Gittins Index

不論折現率是0.90.9911輸的那臺都比96輸的那台值得嘗試(直到11輸的那臺變成12輸)

 

同樣的邏輯可以應用在判斷何種藥品或疫苗對抗某種疾病最有效的開發潛力上

(帶女兒去打彈珠對付local土匪機台的時候,要運用類似邏輯XD)

 

 

遺憾與樂觀

找出新歡會花很多心力、固守舊愛會覺得乏味,重點不是在兩者之間的機會成本拿捏,而是讓遺憾最小化

 

嘗試失敗也是一種體驗與收穫,不嘗試=一種損失,難以估計心理與錯失機會的損失=>許多人出來創業或跳脫舒適圈的理由,即便創業成功率不高、機會成本很高;而心理遺憾的感受往往才是最高的成本- 往往覺得沒有得到與沒去嘗試的比較好!

 

涵義與寒意

1.沒有人具備全知,人的遺憾與悔恨永無止境,即便你得到已經是最好的結果(你以為做出不同的選擇人生會更好)

2. 沒有完美的最佳策略,所謂的最佳策略只不過是對於問題的理解隨著時間增加,比較不會遺憾

3.最小遺憾=快速犯錯,最初10次下注的犯錯次數和接下來90次下注的犯錯次數相同

 

想起費曼先生所說的:你犯下該犯的錯誤,人生也就這樣過去了(沒有可以迴避的錯誤,不可能沒有遺憾;所謂的遺憾源自於去跟另一個可能不存在的美好情境比對)

 

最小遺憾演算法,類似吉廷斯係數,不過是看信賴區間

角子老虎機A:下注兩次,一賺一賠

角子老虎機B:下注10次,55

兩台的期望值相同,但A的信賴區間>B

 

樂觀(試誤)是防止遺憾的最佳方法(只要試誤不會毀滅你),可以多去嘗試新事物、認識新朋友=>黑天鵝作者所說的正面的風險

 

 

網路上土匪

怎麼樣可以提高用戶的購買力或者捐款金額?

 

設計AB兩組對照 e.g.,

A組:紅色按鈕+「捐款」

B組:藍色按鈕+「奉獻」

(有一半的使用者會被隨機分配給A組或B)看看哪一組的效果會顯著,成為下一回合的baseline

 

FB/Google 為了增加收入,背後有強大團隊在進行以上研究=>What a Waste of Talent!

 

欸,這是門business,而且很賺錢(雖然沒有對社會有任何有形或無形的貢獻這能算是不為惡嗎?)

Optimizely (政客獲得的政治獻金被用來給這家公司提升募款金額…)

https://www.optimizely.com/

https://en.wikipedia.org/wiki/Optimizely

 

 

說服醫界採用葉克謨的演算法

充滿倫理爭議的梅毒研究- Tuskegee Syphili Study (要有對照組,所以對照組不能接受治療,以比對呈現出實驗組的療效)

https://en.wikipedia.org/wiki/Tuskegee_Syphilis_Study

 

1969 Marvin Zelen “Playing the winner rule and the controlled Clinical Trial”

https://www.tandfonline.com/doi/abs/10.1080/01621459.1969.10500959

 

想像帽子中有兩個球AB,代表兩種不同療法,如果取出的球A能夠成功治療,就在帽中多放一顆A球;如果失敗就在帽中多放一顆B球(類似於玩角子老火機,贏了就繼續不要換)

 

隨機對照試驗之惡

傳統統計對照組試驗,要隨機指定兩群病人接受AB的療法,如果做到一半(未達實驗樣本數時)已經發現有顯著的差異,那麼繼續讓一群病人接受沒有顯著療效的治療=見死不救的不道德!

 

 

變化不定的世界

當機台的賠率不是固定,而是隨著時間變化時

e.g., 兩家客運公司,一家老公司準點率大致維持90%,另一家新公司準點率不確定(兩家的準點率都可能隨著時間提升或降低)

 

研究結果顯示:

1.人通常喜新厭舊(一開始)

2.太早下定論(一陣子)

3.下了定論之後形成刻版印象,不太願意給新選擇機會或者轉換(之後很長一段時間)=>而本來不好的會變好、好的會變不好

 

要在變化不定的世界中存活,觀點本身也要持續變化,只要世界會改變,你就不能停止嘗試新事物(世界的規則不斷改變,要著學習與適應新的規則)

 

 

開發善用

人有個很奇怪的特質是:需要花很長的時間才能夠自立

大人希望孩子能夠明辨慎思(=遺憾最小演算法),彷佛每個決定都事關重大

然而孩子往往漫不經心、隨意嘗試與測試、追求刺激與跟父母唱反調

 

其實人的理性與直覺源自於善用(以往的經驗)而非開發(探索)

對於父母而言,長大成人過程中,累積不少經驗

然而對於孩子而言,來日方長,日後有許許多多決定要去面對,其實善變與試誤才是睿智之舉。

 

相較於孩子,老年人反而逐漸退化與舒適圈不斷縮小,人生接近生命終點時,往往希望專注於最具意義的關係;把注意力轉到最愛的事物上,其實反而可以提升生活品質與心靈平靜程度(不再汲汲營營或焦慮比較)

 

其實從年齡與來日多長的角度來看,小孩子與老人的取捨同樣睿智

 

該如何看待老人言的建議

如果父母告訴你OO餐廳很棒,那麼你應該聽他們的,因為這是他們一輩子探索的經驗

但如果你的父母只去OO餐廳,那麼你可以大膽嘗試其他餐廳,即便可能踩到地雷。

 

 

呵呵,透過讀書來尋找新的體悟與心的感動,證明自己還活著(能夠不斷接受新的刺激)與緩解面對不確定的世界的苦(不斷調整安身立命的定錨點)



沒有留言: