2023年10月14日 星期六

多模型思維3

多模型思維:天才的32個思考策略

The Model Thinker:What You Need to Know to Make Data Work for You

https://www.books.com.tw/products/0010882068 


作者Scott E. Page

https://sites.lsa.umich.edu/scottepage/bio/ 


複雜性科學的學者,腦子的思考方式與語言完全不同於一般人

一般人的語言與世界是:個人(social atom)的感受與情感

複雜性科學的語言與世界是:宏觀的(social atom)互動模式

讀這些神人的著作,有如閱讀窺探另一個宇宙世界及平行時空,讓人腦洞大開。


以下這本書可以找個時間Re-read

微觀動機宏觀行為(現象)

https://eshmanager.blogspot.com/2012/11/blog-post.html 



第 9 章    貢獻度與影響力模型

—— 合作賽局、政黨席次與權力


如何量化個人的價值(=貢獻度)與權力(=影響力)?

容易處理的狀況

  • 團隊的價值=所有成員個別價值的總合
  • 政黨的權力=擁有國會席次的總合


不容易處理的狀態

  • 團隊產出的創意或軟體的貢獻度區分
  • 政黨的權力不與席次成正比=>關鍵第三小黨


計算貢獻度與影響力的模型基礎

合作賽局

最後上車者價值(LOTB: last-on-the-bus value)

適用於成員之間暗藏不合作傾向的團夥

https://medium.com/vincent-chen/%E8%AE%80%E6%9B%B8%E5%BF%83%E5%BE%97-%E5%A4%9A%E6%A8%A1%E5%9E%8B%E6%80%9D%E7%B6%AD-%E4%B8%BB%E8%A6%81%E6%A8%A1%E5%9E%8B%E6%A6%82%E5%BF%B5%E5%8F%8A%E6%87%89%E7%94%A8-2-6dd6eb48b3c3 


LOTB它等於是一位行動者在團隊已經形成的情況下加入團隊時的邊際貢獻。夏普利值它等於是行動者遍歷所有可能的加入團隊的序列,加入團隊時的邊際貢獻平均值。例如,在一個由三個人組成的團隊中,計算一位行動者的夏普利值,先要求出他以第一、第二、第三位加入者的身份加入時的邊際貢獻,再計算平均值。


在合作賽局中,一個賽局參與者的LOTB,等於當他是最後一個加入團隊的人時,他所能增加的價值。LOTB呈現了邊際賽局參與者的價值。如果雇用4個人來搬運一張桌子,假設搬運這張桌子產生的價值為10,並且要4個人一起動手才搬得動,那麼每個人的LOTB均為10。(不管是誰最後加入,都有存在價值)

如果只需要三個人就可以搬動這張桌子,那麼每個人的LOTB均為0。(不管是誰最後加入,都沒有價值與貢獻)

個人的LOTB可能是衡量權力的一個更好標準,因為它能夠度量每個人通過威脅離開可以獲取多大利益



夏普利值Shapley Value

https://en.wikipedia.org/wiki/Shapley_value

https://wiki.mbalib.com/zh-tw/%E5%A4%8F%E6%99%AE%E5%88%A9%E5%80%BC 

適用於榮辱與共的聯盟,比如婚姻與家庭以及當下需要人類命運共同體一起攜起手應對的挑戰。

假設有一家小公司,在日本與美國同時營運,需要會日語和美語的員工

這家公司有三個員工

  • A會說日語
  • B會說美語
  • C會說美語和日語

公司每天營運的價值是1200,每天最少需要兩位員工

六種員工出勤的排序

  1. ABC 公司營運價值:1200;C的LOTB=0
  2. ACB 公司營運價值:1200;B的LOTB=0
  3. BAC 公司營運價值:1200;C的LOTB=0
  4. BCA 公司營運價值:1200;A的LOTB=0
  5. CAB 公司營運價值:1200;B的LOTB=0
  6. CBA 公司營運價值:1200;C的LOTB=0


在以上情境中ABC三位員工的夏普利值Shapley Value=1200

但A與B員工的貢獻各為1200*1/6=200(合計只佔1/3的重要性)

C員工的貢獻為1200*4/6=800(獨佔2/3的重要性)


夏普利值除了可以量化計算合作中個體的貢獻,對我們有什麼啟發?

夏普利值可以很好量化合作中參與者的貢獻程度,每個參與者的價值等於他按不同順序加入時,帶來合作效果價值增量的平均值;作為個體,提高合作中的價值,就是要提高稀缺性;如果你在任何一個團隊當中,無論你以什麼順序加入,都不能給團隊帶來新的價值增量,你的價值就是零。


沒想到LOTB與Shapley Value竟然可以用來解釋人力資源市場的現象

  1. 小工司一個蘿蔔一個坑,每個人都守著自己的一畝三分田地,每個人工作品質不高、但卻又都不可或缺,找的新人寧爛勿缺
  2. 大公司人才濟濟,彼此之間可以相互取代,沒有不可或缺的人,找來的新人沒有最優秀,只有更優秀
  3. 大公司的人容易往小公司移動(看得較廣),小公司的人卻不容易往大公司移動
  4. 是否晉升某個人,有時不是看戰功或績效,而是看晉升後的副作用(別的部門的反彈或底下人出走)
  5. 跳槽要看時機(加入的順序)與被利用的價值(對於不同的組織有不同的利用價值)



夏普利值的公理

https://blog.csdn.net/u010420283/article/details/117394186 

  1. 零性: 如果博弈參與者為任何联盟增加的價值都等於零,那麼該博弈參與者的價值等於零。如果你在任何一個團隊當中,無論你以什麼順序加入,都不能給團隊帶來新的價值增量,你的價值就是零。
  2. 公平性/對稱性: 如果兩個博弈參與者對任何联盟都具有相同的增加價值,那麼這兩個博弈參與者俱有相同的價值。如果兩個人加入任何團隊,所帶來的價值是相同的,那麼這兩個人具有相同價值。
  3. 完全分配性: 博弈參與者價值的總和等於博弈的總價值V(N)。就是團隊中成員創造的價值相加等於總價值,反過來說,如果最後團隊沒有創造價值,其中的個體的價值也必然為零。
  4. 可加性:給定兩個定義在相同博弈參與者集合之上的博弈,他們的價值函數分別為V和V',那麼在博弈(V +V')中,一個博弈參與者的價值等於該博弈者在V和V'的價值的總和。也就是說如果同時橫跨兩個團隊工作,你的價值是在所有團隊中的價值和,這個也從側面解釋了為什麼跨團隊的橋樑的價值很高,一方面是加入的團隊多,還有一個重要原因是,他的“最後上車者價值”很高。



處處可見價值與權力的賽局

雇主對員工

  1. 降低員工的LOTB=>透過雇用多餘員工(編制數n+1)
  2. 不鼓勵工作輪調或資訊流通,以減小員工離職或背叛的衝擊影響
  3. 阻止員工成立工會,開除工會領導與成員

員工對雇主

  1. 藏私、不教新人、不把自己的職務內容標準化/文件化,各部門或各事業群有如獨立的部落
  2. 私下相互探聽、交換資訊,掌握高層或公司的把柄
  3. 成立工會




第10章    網路模型

—— 友誼悖論、六度分隔、弱連結


討論供應鏈管理,其實應該劃出從上游到下游的網路結構

一個人腦中的知識架構,其實也是網路模型:舉一反三=串連不同的概念節點



網路理論(Network theory)

https://en.wikipedia.org/wiki/Network_theory 

劍橋大學 網路理論簡介

https://www.cl.cam.ac.uk/teaching/1011/PrincComm/slides/graph_theory_1-11.pdf




第11章    三種傳播模型:廣播、擴散、傳染

—— 關於資訊散播、廣告與流行、防疫政策


廣播模型(Broadcast Model)

單一來源或傳染源的情景,傳播為r型曲線





擴散模型(Diffusion Model)

從一開始的單一來源與傳染源,變成多個來源與傳染源,傳播為S型曲線






傳染模型(Contagion Model)

多個來源與傳染源+考慮治癒(死亡)率(=不再傳播)

換句話說,流行會退燒


適用SIR Model of Contagion (Susceptible易感染的, Infected已感染的, Recovered已復原的)

https://en.wikipedia.org/wiki/Compartmental_models_in_epidemiology  







第12章    熵值:建構不確定性模型

—— 區分平衡、循環、隨機和複雜狀態


熵值(亂度)≒不確定性

排除不確定性與減少熵值(亂度)要靠增加(訊息)資訊量



資訊熵(Information Entropy)

https://en.wikipedia.org/wiki/Entropy_(information_theory) 

資訊理論的核心思想是,所傳達的訊息的「資訊價值」取決於訊息內容的令人驚訝的程度。如果發生可能性很大的事件,則該訊息攜帶的資訊很少。另一方面,如果發生極不可能的事件,則該訊息的資訊量會更大。例如,知道某個特定數字不會成為彩票的中獎號碼所提供的資訊非常少,因為任何特定的選定數字幾乎肯定不會中獎。然而,知道某個特定號碼將贏得彩票具有很高的信息價值,因為它傳達了極低機率事件的結果。


https://www.cupoy.com/qa/club/ai_tw/0000016D6BA22D97000000016375706F795F72656C656173654B5741535354434C5542/0000017BA07DF516000000076375706F795F72656C656173655155455354 

假設有一枚硬幣,正面、反面出現的機率皆為0.5,則m=2。訊息量為1 bit

而在一般生活中,常見的事件不易引起大家的注目,反而是出現一件反常新聞時,才容易引起大家的關注(surprise),也就是說,發生機率小的事件,帶來的訊息量比較大

假設過去丟64次硬幣的情況為,63次正面,1次反面,那麼63/64會被認為是正面的機率,也就是P。

如果下一次丟硬幣,仍為正面時,所帶來的資訊量是0.023

為反面時,所帶來的資訊量是6

換言之

資料越確定,事件出現機率大不相同時,情況越單一,資訊熵越小。

(下一次出現正面的機率極高)

資料越不確定,事件出現機率相同時,情況越複雜,資訊熵越大。

(下一次出現正面的機率與出現反面機率相同)


https://tecky.io/en/blog/_%E9%87%8F%E5%BA%A6%E8%B3%87%E8%A8%8A/ 

資訊熵的概念也很簡單,就是熵愈高,資訊愈多。也就是愈混亂,資訊愈多。





熵值的數學公理

https://chenhh.gitbooks.io/multiperiod_portfolio_optimization/content/info_thm/maximum_entropy_principle.html 

  1.  熵應為連續函數,因單一事件結果的發生機率微小的改變只會對entropy產生微小的改變
  2. 各種可能結果的先後發生先後順序變化 不改變熵值
  3. 熵應和事件發生數量成正比,即事件數越多,訊息量越大,反之越小;而且當全部事件發生的機率一致時,熵應最大,因要對事件做出預測最困難
  4. 結果確定時,熵值=0
  5. 熵值的計算係基於各事件獨立發生(沒有交互作用或因果關係):兩件隨機事件結合的不確定性=個別隨機事件不確定性的加總



以熵值區分的四種狀態

1.平衡狀態(熵值亂度=0)

e.g., 放在桌上的筆


2.循環週期狀態

繞著太陽運轉的行星,具備可預測性(熵值低亂度小)


3.隨機狀態

完美的隨機過程熵值亂度最大

e.g., 丟硬幣與抽獎


4.複雜狀態

e.g., 股市交易價量變化、人的行為、氣象變化

有些規律、但又無法100%掌握,中等熵值與亂度






三種最大熵值的分佈形態(建模參數選擇)

並非使用最大熵值分配型態能夠提供更好的解釋,而是在特定的平均數與變異數的限制與熱力學第二定律作用下,會產生以下最大熵值的分佈形態


1.均勻分布(uniform distribution)

只知道會落在某個區間或範圍,那麼應該假定均勻分布

e.g., 正反面都有可能,每個號碼被抽出的機率相等


2.指數(幂次)分佈(exponential distribution)

只知道平均數

e.g., 稀有藝術品的價值、收入、網站點擊數


3.常態分配(normal distribution)

有特定的平均數與變異數=適用中央極限定理(平均數=適合存在的參數,變異數有助於適應環境,但變異數太大反而不利於生存)



熵值的應用

用於實證研究,讓我們知道世界的實然而非應然

e.g., 

1.股價變化是隨機漫步還是路徑依賴

2.政府介入干預能否降低黑天鵝事件發生的不確定性。


存在一點熵值可以增加生活與人生樂趣、世界的色彩/生態的演化

但熵值太多會癱瘓人的認知能力與凸顯人類各種努力的徒勞無功


官員偏好穩定與可預測性

學者關心論證系統是否達到平衡、循環、隨機或複雜狀態

但天地萬物與天下事物偏好多采多姿與遵守熱力學第二定律


反脆弱

https://eshmanager.blogspot.com/2015/05/blog-post_23.html 


沒有留言: