網頁

2024年2月10日 星期六

多模型思維7

多模型思維:天才的32個思考策略

The Model Thinker:What You Need to Know to Make Data Work for You

https://www.books.com.tw/products/0010882068 


這本書太難啃,需要系統二的慢想




第25章    訊號傳遞模型

—— 你傳遞的是炫耀訊號?還是實用訊號?


假設:

每個人都會根據對方或外界傳遞的訊號,來決定自己的行動=>最佳化自己的利益+形成賽局的均衡


炫耀性消費:

目的在於傳遞訊號給別人,其實人在意的是他人對於自己觀點(對於自己的感覺取決於他人的評價/回饋):

  • Show名車豪宅,展示與想讓別人知道的是自己富有的信號
  • Show捐錢作慈善,展示與想讓別人知道的是自己慷慨/有善心
  • Show博士學位,展示與想讓別人知道的是自己有智慧又努力讀書
  • Show健身照片,展示與想讓別人知道的是自己性感又健康(available & doable)
  • Show馬拉松照片,展示與想讓別人知道的是自己的毅力


如同政治人物握手、國家辦理軍事演習、企業砸錢搞ESG/CSR,其實目的都是向外界炫耀與讓自己自我感覺良好

相較於炫耀性行為(如孔雀開屏),其實自然界中更常見的是隱蔽性的行為(如偽裝、夾著尾巴);在江湖走跳,同樣需要危害辨識與風險評估:你是對方的food亦或對方是你的food

如果你是對方的food,e.g., 幫資本家做事的打工仔,那麼你最好不要在老闆面前召搖,行頭排場比老闆高調、展現自己比老闆聰明….

如果對方是你的food,e.g., 各種seafood與傳銷的一哥大姐大,那麼你當然要炫富、呈現自己的高大上+透過各種儀式呈現自己的尊榮=>不然底下信眾與老鼠,如何會想追隨你(想過如同你一般的生活)?



離散訊號傳遞模型

訊號只有發送或不發送

而發送訊號要付出成本,乃至於送出的訊號要夠強,對方才會接受

e.g., 雇主要求candidate進行英文對話與簡報,篩選/汰除一些動機不夠強烈的偽裝者

應徵人員透過一堆學歷與證照,傳遞給雇主自己是個動機強烈與夠格應徵人員的信號


三種型式的結果

1. 混合信號(pooling)

所有人傳遞出相同訊號

e.g., 學生都想畢業+爭取獎學金


混合信號下的均衡

看成本與效用:畢業難度與門檻,獎金金額高低=>學生各自決定是否繼續努力(弱的放棄、強的繼續)



2.分離

不同類型的人傳遞出不同的訊號

想念讀書、有能力的去研究型大學,想畢業有學歷的去社區大學

各取所需,適性發展


3.部分混合

每個人有所相同、有所不同

這種最複雜=>人往往不知道自己要的是什麼,所以別人有什麼,自己也想要



連續訊號傳遞模型

可以改變訊號傳遞的強度

e.g., 比賽可以看哪個參賽者堅持到最後


如果你是資源與經費有限的騙子,又需要招搖撞騙,那麼適合(租賃)昂貴手錶與珠寶

因為:房子與車子無法隨身攜行,而一般人也可以穿著名牌衣服



訊號的使用與價值

要花心思辨識與思考




求偶求職與識人,其實誤判才是常態




傳遞信號的本質就是為了獲得好處,然而當發出信號所需的成本超過獲得的好處時,其實每個人有如山道猴子般愚蠢與非理性。

欸,想到每個人的言行舉止都是散發訊號,這麼一來連在臉書或賴群組上胡言亂語的權利與自由都沒了:言者無心、聽者有意,盍各言爾志/抒發己見的同時,很容易不小心冒犯到他人=>為了朋友與同學間的情誼還是少逞口舌之快吧!




第26章    學習模型

—— 強化學習模型 & 模仿者動態學習模型


個人學習模型

強化

誘因與反應

一開始是嘗試結果讓受試者產生驚訝與驚喜,學習與行為再現效果佳

再來是養成習慣=>過去作過也熟練,最不費腦力


而以上強化的學習機制,意味著人的學習會收斂到最高報酬的選項(局部最佳化與思維僵固、學習跨領域的事物都是事倍功半)



社會學習模型

模仿

其實就是觀察別人與從眾,以減少縮短試誤


如果學習有最佳選項(效果或報酬最佳的結果),那麼不論是個人學習的強化,液或社會學習的模仿,最終都會收斂至最佳解:大家都讀醫科、讀電機、對去找名醫/名師、去光顧性價比最佳的店家、追逐相同的投資標的、同樣學會巴結老闆/爭功諉過



但如果是賽局情況時- 你的報酬取決於對方的報酬,則不一定會收斂/有均衡解



善惡賽局



從善的角度,自己變好,能夠讓別人變得更好

從惡的角度,自己變壞,能夠讓別人變得更壞


從讓自己更好與個人學習的角度來思考,應該選擇善

從忌妒或者自己感覺更好(是因為別人糟)及社會模仿(報復)的角度,則會選擇惡

群眾互動形成的社會規則,可以是共善,也可以是相互提防與報復/劣幣驅逐良幣,端看集體造業或是積德+社會價值觀隨著情境與朝代而改變。


人性最大的惡其實是忌妒與見不得別人好,但人性就是會攀比與相互影響

難怪孟格說忌妒、怨天尤人(把自己當受害者)、不要學習、為改變心情而服用藥物(依賴菸酒)、意志消沉反覆無常,可以毀掉一個人

要學習當個存活者與讓自己配得上自己想要的事物




第27章    多臂拉霸機問題

—— 如何在報酬不確定的選項中做抉擇


吃角子老虎:報酬不是固定值,而是機率分配形態呈現

e.g., 製藥公司的藥品開發與試驗、廣告的投放乃至於個人選擇精進的技能或值業的選擇


兩種增加報酬率的基本策略:

探索(exploration 開發新的、找尋更佳的選項)

利用(exploitation選擇目前已知最佳方案或方向)


這不就是創新者的兩難嗎?



白努力拉霸機問題

當事人對於報酬的機率分佈沒有概念,在逐項嘗試過程中,逐漸掌握可能的報酬分配

e.g., 客戶行銷的三種說詞

1.主動預約(向王永慶賣米)

2.關心提問(請問家裡米是否快沒了)

3.訴諸情感(套交情)

不知道以上三者,何者成功率較高,或對不同客戶群該用何者?


是該選擇探索(exploration)還是利用(exploitation)呢?

有兩種演算法

1.取樣後貪婪(sample then greedy)

各嘗試100次,然後看看有沒有某一種成功率顯著特別高

優點在於科學,能夠說服他人

而憂點在於:浪費時間+可能不道德=>如果是攸關生死的試驗


2.自適應探索率啟發法(adaptive exploration rate heuristic)

一開始每個選項都各測10次,假如A成功6次,B成功2次,C成功0次

則在接下來的第二輪20次試驗中,A嘗試20*6/(2+6)=15次;B嘗試20*2/(2+6)=5次

假如成功率不變

則第三輪的20次測試,A嘗試20*0.6^2/(0.2^2+0.6^2)=18次

優點:如果有某種方法顯著優於其他方法,可以很快找出來

憂點:如果方法之間沒有顯著差異,那麼結果同樣不顯著



貝氏多臂拉霸機問題

決策者對於各項方案的成功率或報酬率有先驗經驗或信念(prior belief)

行動與決策步驟

1.估算各選項的成功率或報酬期望值

2.根據實際結果,更新各選項的成功率或報酬期望值

3.依據以上更新信念,決定後續可採取的最佳方案

4.估算吉丁斯指數

e.g., 

選項A:每次可以獲得500 (80%機率)或0(20%機率)=>期望值400

選項B:可能可以獲得1000(30%機率)或0(70%機率)=>期望值300


當事人很可能有新手的幸運與運氣,第一次選擇了選項B就獲得1000,從此偏好選項B,直到發現選項B的長期報酬率似乎不如選項A



結論:紀錄和估算很重要

1.大自然不會輕易揭露風險的本質(不確定性=機率不確定)

2.人無法認知到自己的信念與認知錯誤

3.各種風險評估方法有如占星術




第28章    崎嶇地形模型

—— 科學管理、創新競爭、以及複雜的解決方案

如何在複雜崎嶇的地形(多屬性)中找到最佳解


繁殖潛力地形(fitness landscape)

單一屬性,往往具有最適區間(太大或太小都不好)

可以透過梯度啟發法,找到最高峰或最低峰




管理上,就是科學管理與泰勒主義

科學管理與泰勒主義的問題在於:

通常只關心單一投出與產出,沒辦法處理多個投入與產出之間的交互作用





一維崎嶇地型模型,崎嶇度的意義

多個變數間的交互作用產生崎嶇地形,有如多個山峰的情境:

不同出發點到達不同山峰=>起始條件與路徑依賴影響找到的最佳解


沒有最佳的搜尋方法或特定方向,需要故意自找麻煩

問題難度越高、維度越多=地形越複雜




管理上就是有高檔均衡,也有低檔均衡;跨國企業有跨國企業的作法,本地傳產有本地傳產的作法,彼此難以交流或學習

來了個海歸的王子與公主接班,企業與公司的改造與轉型,要跨越崎嶇的地型




二維崎嶇地形的NK模型

想像問題有如複雜的二維地型





結論:

在真實的社會體系與生態體系,地形其實不是固定不變的

隨著彼此相互競爭、模仿而有所消長

複雜行動與複雜結果來來去去=>沒有單一思維模型可以一體適用




第29章    多模型思考:鴉片氾濫、貧富不均

—— 從錯誤中學習,變得更有智慧


最後這一章是精華


鴉片氾濫問題


1.多臂拉霸模型(27章)

為何醫師開出鴉片止痛處方

鴉片長久以來被證明有效止痛

相對於選擇鴉片以外的新藥=>要通過臨床試驗與審核,而且不見得會通過雙盲試驗,確認效果>安衛劑


2.馬可夫模型(17章)

轉換率的角度

大家知道要擔心藥物成癮問題,但藥物試驗都只能作短期(成癮率<1%),而許多病症醫師開立的都是長期處方簽,藥物服用時間越長,病人越可能成癮(成癮率>2.5%)




3.系統動力模型(18章)

鴨片成癮導致海洛因成癮的外溢效應



4.網路模型

為何成癮人口密度,農村高於城市



收入所得不均問題

所有人都想解決貧窮問題,貧富差距更是社會政策重中之重

有錢與高收入的,就是比較健康、幸福與快樂


觀察收入所得資料(跨國+數百年)的歸納:

1.收入分佈是偏態的對數常態分配,長尾的部分比對數常態還要長

https://eshmanager.blogspot.com/2023/09/2.html 

2.大部分的已開發國家(不論有各種政策意圖縮小貧富差距),收入與財富分配不均的狀況都在加大與加劇

3.從全球角度來看,窮人減少與富豪財富占總財富的比率增加

https://eshmanager.blogspot.com/2018/05/12.html 

https://eshmanager.blogspot.com/2022/04/2.html 



收入有四種來源

  1. 工資薪水
  2. 營業收入
  3. 資本收入
  4. 資本利得

低收入者多半只有1+2(靠勞力與本事賺錢),而高收入者有1-4,特別是3+4(靠錢滾錢)


1.柯布-道格拉斯模型

只考慮工資與營業收入

勞工區分為受教育與未受教育

可以解釋貧富差距的趨勢,但不能解釋組内差異也擴大




2.正回饋與偏好依附

就是馬太效應,窮者越窮,富者越富

但應該產生幂次分佈




3.空間競爭模型

為什麼薪酬委員會只會讓CEO的薪資更高

Hint:

因為薪酬委員會的成員都是董事會肥貓=>只會嫌自己薪水不夠高,沒有勞工代表




4.經濟成長模型

皮凱提21世紀資本論得觀察心得:

資本報酬率>經濟成長率=>錢四腳,人兩腳

https://mhperng2.blogspot.com/2016/04/thomas-piketty21capital-in-twenty-first.html 




5.門當戶對模型

有錢人嫁娶有錢人,窮人嫁娶窮人

如果婚姻是隨機發生,則貧富差距會縮小

但顯然不是,但這個模型與推論,無法告訴我們導致的貧富差距效力有多大



6.馬可夫模型

看待家庭社經地位的遺傳

社會階層的流動性存在部分僵固性




7.杜勞夫得持續不均模型

就是謝林分隔與人以群分的貧窮陷阱




結論

除了增加生活樂趣與人類智識外,模型無三小路用(可謂是Physic Envy意圖透過模型去解釋現象+預測,但偏偏現象太複雜,各種模式的fitting都不完美)



題外話,想到工安意外事故解釋與預測(危害辨識與風險評估)

也可謂是自欺欺人的占星術、星座命理之流的東西=費曼先生批判的草包族科學

事故調查與司法起訴有如中古世紀的獵巫與宗教裁判所

要進化到現代天文學般的精準,還有很長的路要走,遑論有太多Seafood般的大屍+無知鄉民=>原地打轉與問道於盲


本體論、認識論與方法論三者其實交互影響

風險的本體是不確定性=無法預測與統計歸納

而人腦對於風險的認識與理解又充滿偏誤:不是高估就是低估

風險矩陣的那種方法論,更加扭曲了對於風險本質的理解與認識


可以努力的方向:

1. Evidence Based Management

人會受到誘因驅使

人的行為是否受到觀察、觀察的對象而異


2.透過貝氏機率來校準prior belief


3.透過Model與蒙地卡羅分析來預測


沒有留言:

張貼留言