From Micro to Macro: 多模型思維7

多模型思維：天才的32個思考策略

The Model Thinker：What You Need to Know to Make Data Work for You

https://www.books.com.tw/products/0010882068

這本書太難啃，需要系統二的慢想

第25章訊號傳遞模型

—— 你傳遞的是炫耀訊號？還是實用訊號？

假設：

每個人都會根據對方或外界傳遞的訊號，來決定自己的行動=>最佳化自己的利益+形成賽局的均衡

炫耀性消費：

目的在於傳遞訊號給別人，其實人在意的是他人對於自己觀點(對於自己的感覺取決於他人的評價/回饋)：

Show名車豪宅，展示與想讓別人知道的是自己富有的信號
Show捐錢作慈善，展示與想讓別人知道的是自己慷慨/有善心
Show博士學位，展示與想讓別人知道的是自己有智慧又努力讀書
Show健身照片，展示與想讓別人知道的是自己性感又健康(available & doable)
Show馬拉松照片，展示與想讓別人知道的是自己的毅力

如同政治人物握手、國家辦理軍事演習、企業砸錢搞ESG/CSR，其實目的都是向外界炫耀與讓自己自我感覺良好

相較於炫耀性行為(如孔雀開屏)，其實自然界中更常見的是隱蔽性的行為(如偽裝、夾著尾巴)；在江湖走跳，同樣需要危害辨識與風險評估：你是對方的food亦或對方是你的food

如果你是對方的food，e.g., 幫資本家做事的打工仔，那麼你最好不要在老闆面前召搖，行頭排場比老闆高調、展現自己比老闆聰明….

如果對方是你的food，e.g., 各種seafood與傳銷的一哥大姐大，那麼你當然要炫富、呈現自己的高大上+透過各種儀式呈現自己的尊榮=>不然底下信眾與老鼠，如何會想追隨你(想過如同你一般的生活)?

離散訊號傳遞模型

訊號只有發送或不發送

而發送訊號要付出成本，乃至於送出的訊號要夠強，對方才會接受

e.g., 雇主要求candidate進行英文對話與簡報，篩選/汰除一些動機不夠強烈的偽裝者

應徵人員透過一堆學歷與證照，傳遞給雇主自己是個動機強烈與夠格應徵人員的信號

三種型式的結果

1. 混合信號(pooling)

所有人傳遞出相同訊號

e.g., 學生都想畢業+爭取獎學金

混合信號下的均衡

看成本與效用：畢業難度與門檻，獎金金額高低=>學生各自決定是否繼續努力(弱的放棄、強的繼續)

2.分離

不同類型的人傳遞出不同的訊號

想念讀書、有能力的去研究型大學，想畢業有學歷的去社區大學

各取所需，適性發展

3.部分混合

每個人有所相同、有所不同

這種最複雜=>人往往不知道自己要的是什麼，所以別人有什麼，自己也想要

連續訊號傳遞模型

可以改變訊號傳遞的強度

e.g., 比賽可以看哪個參賽者堅持到最後

如果你是資源與經費有限的騙子，又需要招搖撞騙，那麼適合(租賃)昂貴手錶與珠寶

因為：房子與車子無法隨身攜行，而一般人也可以穿著名牌衣服

訊號的使用與價值

要花心思辨識與思考

求偶求職與識人，其實誤判才是常態

傳遞信號的本質就是為了獲得好處，然而當發出信號所需的成本超過獲得的好處時，其實每個人有如山道猴子般愚蠢與非理性。

欸，想到每個人的言行舉止都是散發訊號，這麼一來連在臉書或賴群組上胡言亂語的權利與自由都沒了：言者無心、聽者有意，盍各言爾志/抒發己見的同時，很容易不小心冒犯到他人=>為了朋友與同學間的情誼還是少逞口舌之快吧!

第26章學習模型

—— 強化學習模型＆模仿者動態學習模型

個人學習模型

強化

誘因與反應

一開始是嘗試結果讓受試者產生驚訝與驚喜，學習與行為再現效果佳

再來是養成習慣=>過去作過也熟練，最不費腦力

而以上強化的學習機制，意味著人的學習會收斂到最高報酬的選項(局部最佳化與思維僵固、學習跨領域的事物都是事倍功半)

社會學習模型

模仿

其實就是觀察別人與從眾，以減少縮短試誤

如果學習有最佳選項(效果或報酬最佳的結果)，那麼不論是個人學習的強化，液或社會學習的模仿，最終都會收斂至最佳解：大家都讀醫科、讀電機、對去找名醫/名師、去光顧性價比最佳的店家、追逐相同的投資標的、同樣學會巴結老闆/爭功諉過

但如果是賽局情況時- 你的報酬取決於對方的報酬，則不一定會收斂/有均衡解

善惡賽局

從善的角度，自己變好，能夠讓別人變得更好

從惡的角度，自己變壞，能夠讓別人變得更壞

從讓自己更好與個人學習的角度來思考，應該選擇善

從忌妒或者自己感覺更好(是因為別人糟)及社會模仿(報復)的角度，則會選擇惡

群眾互動形成的社會規則，可以是共善，也可以是相互提防與報復/劣幣驅逐良幣，端看集體造業或是積德+社會價值觀隨著情境與朝代而改變。

人性最大的惡其實是忌妒與見不得別人好，但人性就是會攀比與相互影響

難怪孟格說忌妒、怨天尤人(把自己當受害者)、不要學習、為改變心情而服用藥物(依賴菸酒)、意志消沉反覆無常，可以毀掉一個人

要學習當個存活者與讓自己配得上自己想要的事物

第27章多臂拉霸機問題

—— 如何在報酬不確定的選項中做抉擇

吃角子老虎：報酬不是固定值，而是機率分配形態呈現

e.g., 製藥公司的藥品開發與試驗、廣告的投放乃至於個人選擇精進的技能或值業的選擇

兩種增加報酬率的基本策略：

探索(exploration 開發新的、找尋更佳的選項)

利用(exploitation選擇目前已知最佳方案或方向)

這不就是創新者的兩難嗎？

白努力拉霸機問題

當事人對於報酬的機率分佈沒有概念，在逐項嘗試過程中，逐漸掌握可能的報酬分配

e.g., 客戶行銷的三種說詞

1.主動預約(向王永慶賣米)

2.關心提問(請問家裡米是否快沒了)

3.訴諸情感(套交情)

不知道以上三者，何者成功率較高，或對不同客戶群該用何者？

是該選擇探索(exploration)還是利用(exploitation)呢？

有兩種演算法

1.取樣後貪婪(sample then greedy)

各嘗試100次，然後看看有沒有某一種成功率顯著特別高

優點在於科學，能夠說服他人

而憂點在於：浪費時間+可能不道德=>如果是攸關生死的試驗

2.自適應探索率啟發法(adaptive exploration rate heuristic)

一開始每個選項都各測10次，假如A成功6次，B成功2次，C成功0次

則在接下來的第二輪20次試驗中，A嘗試20*6/(2+6)=15次；B嘗試20*2/(2+6)=5次

假如成功率不變

則第三輪的20次測試，A嘗試20*0.6^2/(0.2^2+0.6^2)=18次

優點：如果有某種方法顯著優於其他方法，可以很快找出來

憂點：如果方法之間沒有顯著差異，那麼結果同樣不顯著

貝氏多臂拉霸機問題

決策者對於各項方案的成功率或報酬率有先驗經驗或信念(prior belief)

行動與決策步驟

1.估算各選項的成功率或報酬期望值

2.根據實際結果，更新各選項的成功率或報酬期望值

3.依據以上更新信念，決定後續可採取的最佳方案

4.估算吉丁斯指數

e.g.,

選項A：每次可以獲得500 (80%機率)或0(20%機率)=>期望值400

選項B：可能可以獲得1000(30%機率)或0(70%機率)=>期望值300

當事人很可能有新手的幸運與運氣，第一次選擇了選項B就獲得1000，從此偏好選項B，直到發現選項B的長期報酬率似乎不如選項A

結論：紀錄和估算很重要

1.大自然不會輕易揭露風險的本質(不確定性=機率不確定)

2.人無法認知到自己的信念與認知錯誤

3.各種風險評估方法有如占星術

第28章崎嶇地形模型

—— 科學管理、創新競爭、以及複雜的解決方案

如何在複雜崎嶇的地形(多屬性)中找到最佳解

繁殖潛力地形(fitness landscape)

單一屬性，往往具有最適區間(太大或太小都不好)

可以透過梯度啟發法，找到最高峰或最低峰

管理上，就是科學管理與泰勒主義

科學管理與泰勒主義的問題在於：

通常只關心單一投出與產出，沒辦法處理多個投入與產出之間的交互作用

一維崎嶇地型模型，崎嶇度的意義

多個變數間的交互作用產生崎嶇地形，有如多個山峰的情境：

不同出發點到達不同山峰=>起始條件與路徑依賴影響找到的最佳解

沒有最佳的搜尋方法或特定方向，需要故意自找麻煩

問題難度越高、維度越多=地形越複雜

管理上就是有高檔均衡，也有低檔均衡；跨國企業有跨國企業的作法，本地傳產有本地傳產的作法，彼此難以交流或學習

來了個海歸的王子與公主接班，企業與公司的改造與轉型，要跨越崎嶇的地型

二維崎嶇地形的NK模型

想像問題有如複雜的二維地型

結論：

在真實的社會體系與生態體系，地形其實不是固定不變的

隨著彼此相互競爭、模仿而有所消長

複雜行動與複雜結果來來去去=>沒有單一思維模型可以一體適用

第29章多模型思考：鴉片氾濫、貧富不均

—— 從錯誤中學習，變得更有智慧

最後這一章是精華

鴉片氾濫問題

1.多臂拉霸模型(27章)

為何醫師開出鴉片止痛處方

鴉片長久以來被證明有效止痛

相對於選擇鴉片以外的新藥=>要通過臨床試驗與審核，而且不見得會通過雙盲試驗，確認效果>安衛劑

2.馬可夫模型(17章)

轉換率的角度

大家知道要擔心藥物成癮問題，但藥物試驗都只能作短期(成癮率<1%)，而許多病症醫師開立的都是長期處方簽，藥物服用時間越長，病人越可能成癮(成癮率>2.5%)

3.系統動力模型(18章)

鴨片成癮導致海洛因成癮的外溢效應

4.網路模型

為何成癮人口密度，農村高於城市

收入所得不均問題

所有人都想解決貧窮問題，貧富差距更是社會政策重中之重

有錢與高收入的，就是比較健康、幸福與快樂

觀察收入所得資料(跨國+數百年)的歸納：

1.收入分佈是偏態的對數常態分配，長尾的部分比對數常態還要長

https://eshmanager.blogspot.com/2023/09/2.html

2.大部分的已開發國家(不論有各種政策意圖縮小貧富差距)，收入與財富分配不均的狀況都在加大與加劇

3.從全球角度來看，窮人減少與富豪財富占總財富的比率增加

https://eshmanager.blogspot.com/2018/05/12.html

https://eshmanager.blogspot.com/2022/04/2.html

收入有四種來源

工資薪水
營業收入
資本收入
資本利得

低收入者多半只有1+2(靠勞力與本事賺錢)，而高收入者有1-4，特別是3+4(靠錢滾錢)

1.柯布-道格拉斯模型

只考慮工資與營業收入

勞工區分為受教育與未受教育

可以解釋貧富差距的趨勢，但不能解釋組内差異也擴大

2.正回饋與偏好依附

就是馬太效應，窮者越窮，富者越富

但應該產生幂次分佈

3.空間競爭模型

為什麼薪酬委員會只會讓CEO的薪資更高

Hint:

因為薪酬委員會的成員都是董事會肥貓=>只會嫌自己薪水不夠高，沒有勞工代表

4.經濟成長模型

皮凱提21世紀資本論得觀察心得：

資本報酬率>經濟成長率=>錢四腳，人兩腳

https://mhperng2.blogspot.com/2016/04/thomas-piketty21capital-in-twenty-first.html

5.門當戶對模型

有錢人嫁娶有錢人，窮人嫁娶窮人

如果婚姻是隨機發生，則貧富差距會縮小

但顯然不是，但這個模型與推論，無法告訴我們導致的貧富差距效力有多大

6.馬可夫模型

看待家庭社經地位的遺傳

社會階層的流動性存在部分僵固性

7.杜勞夫得持續不均模型

就是謝林分隔與人以群分的貧窮陷阱

結論

除了增加生活樂趣與人類智識外，模型無三小路用(可謂是Physic Envy意圖透過模型去解釋現象+預測，但偏偏現象太複雜，各種模式的fitting都不完美)

題外話，想到工安意外事故解釋與預測(危害辨識與風險評估)

也可謂是自欺欺人的占星術、星座命理之流的東西=費曼先生批判的草包族科學

事故調查與司法起訴有如中古世紀的獵巫與宗教裁判所

要進化到現代天文學般的精準，還有很長的路要走，遑論有太多Seafood般的大屍+無知鄉民=>原地打轉與問道於盲

本體論、認識論與方法論三者其實交互影響

風險的本體是不確定性=無法預測與統計歸納

而人腦對於風險的認識與理解又充滿偏誤：不是高估就是低估

風險矩陣的那種方法論，更加扭曲了對於風險本質的理解與認識

可以努力的方向：

1. Evidence Based Management

人會受到誘因驅使

人的行為是否受到觀察、觀察的對象而異

2.透過貝氏機率來校準prior belief

3.透過Model與蒙地卡羅分析來預測

From Micro to Macro

網頁

2024年2月10日星期六

多模型思維7

沒有留言:

張貼留言

網頁

2024年2月10日 星期六

多模型思維7

沒有留言:

張貼留言

2024年2月10日星期六