2018年3月10日 星期六

智能革命(1/2)

智能革命:迎接AI時代的社會、經濟與文化變革



 
工業革命1.0 獸力=>蒸氣煤力(能源與產量大增),以機器為中心
工業革命2.0 蒸氣煤力=>電力(能源效率大增)
工業革命3.0資訊技術革命,自動化
工業革命4.0 人工智慧,讓機器來適應人類;根據不同人與不同的需求提供服務


本書內容寫法比較多感情澎湃字句與呼口號被我用人工智慧刪除詹文男老師的資料來補充






人工智慧的三個階段
1.弱人工智慧
2.強人工智慧
3.超人工智慧



01 簡史:互聯網風雲背後的AI成長
互聯網於1960年代誕生於美國軍方的實驗室,一開始用來在幾所高中和科研機構之間傳遞和共享情報。
1980年代末期,一群科學家提出全球資訊網(World Wide Web, WWW)概念,並創造了TCPIP(傳輸控制協議/網際網路協議),賦予計算機聯網通信的統一標準,使互聯網得以向全世界擴展。
1990年代,23歲的年輕人馬克‧安德森(Marc Andreessen)發明了網景(Netscape)瀏覽器,打開互聯網商用的大門。那時,微軟開始焦慮自身的軟體業務會不會被互聯網顛覆,昇陽電腦(Sun Microsystems)的年輕人則毅然與僵化的公司切割,決定發明一種可以在各種操作系統上通用的語言,以此打破微軟的壟斷,於是就有了程式設計語言Java的誕生,Java語言大大加速了互聯網產品的開發創造。
網景的發展則是起起伏伏,最後被網路服務公司美國線上(American Online, AOL)收購,而美國線上也在2014年被美國電信巨頭威訊(Verizon)收購。後來,威訊還收購了叱吒風雲多年的雅虎(Yahoo)。
昇陽一度如日中天,2001年在全球擁有5萬名雇員,市值超過2,000億美元。然而,當互聯網泡沫破碎時,昇陽在一年內由峰頂跌入谷底,2009年被美國軟體開發商甲骨文(Oracle)收購。
互聯網的發展大大超出了當時大多數人的預料,新科技公司快速崛起,蘋果、谷歌終於憑藉手機操作系統,完成了對微軟的逆襲。

今日人們感慨行動互聯裝置全面超越個人電腦(PC),卻一直在無意中冷落了一個默默崛起的「幽靈」。這個「幽靈」就是AI,互聯網只是它的身體之一。
2012年深度學習(Deep Learning)在學術界和應用方面都有了突破。例如,用深度學習的方法來辨識影像,突然比以前任何演算法都有明顯的提升。過去,我們習慣用文字來搜尋,現在可以用語音和影像進行搜尋,好比說我看到一株不認識的植物,拍一張照片上傳搜尋,就可以立刻辨識出該植物的名稱為「福祿桐」。過去,用文字搜尋時無法描述這樣的植物,現在不僅是搜尋,連很多過去不可能的事情都變成可能了。

語音辨識(Speech Recognition)、影像辨識(Image Recognition)、自然語言理解(Natural Language Understanding)能力,包括為用戶畫像的能力,這些都是人類最本質的智慧能力。當計算機擁有這些能力時,一場新的革命就會到來。

以深藍為代表的計算機人工智慧,似乎與互聯網無關。然而,雲端運算和大數據的發展,使得AI和互聯網終於合二為一,得出不同於深藍時代的智慧模式。多晶片分散式計算加上人類積累的大數據,再透過超越決策樹的新算法來貫通,體現了人類智慧與機器智慧的結合。



AI, Machine Learning and Deep Learning

三分鐘搞懂Deep Learning

克勞德夏儂

傳播的數學原理

通訊定律



人生與世界可以用資訊量與夏農熵來衡量(經歷、知識與智慧越多=資訊量越大)

資訊理論

夏農熵

達特茅斯會議


AI的起起伏伏


跳棋=>西洋棋=>圍棋

2016-17年,谷歌DeepMind開發的AI圍棋程式「AlphaGo」,橫掃人類圍棋高手圈。AlphaGo下棋的「思路」不同於人類,也不同於深藍;如果要提出更專業的解讀,則可以說是蒙地卡羅樹搜尋(Monte Carlo Tree Search, MCTS)演算法,以及根據深度學習的模式識別(Pattern Recognition)促成了AlphaGo的成就,其中最重要的恰恰是其前輩深藍所不具備的深度學習。

蒙地卡羅樹搜尋演算法:假設在某個棋局局面下,深度學習網絡提供三個候選落子辦法ABC,以這三個點為根節點,分別往下走子,可以想像成三棵樹,每棵樹還有無數分支。蒙地卡羅樹搜尋演算法不去窮盡所有分支,而是派出300萬隻螞蟻,分別從ABC點出發,每個點100萬隻,飛速向樹梢爬去,也就是黑白棋交替走子直到決出勝負。基本上,走200步就會分出勝負,最後總有部分螞蟻走到最高點,決出勝負(假設螞蟻走到終點的情況代表黑子勝,沒走到終點的情況代表白子勝。)

AI表面上看起來擁有下棋的大局觀(pattern),而實際上那個大局觀不是透過蒙地卡羅演算(窮舉法)而是與許多人類高手對局的模式識別(Pattern Recognition


詢問機器是否可以思考=詢問潛艇是否可以遊泳!



自然語言理解–人工智慧的最終關卡



02 AI的歷史使命:讓人類知道更多,做到更多,體驗更多

陸氏猜想
人類終將使電腦超越人腦
電腦(AI)讓人類know more, Do more, Be more
人類文明發展進步=know more(提升認知與理解), Do more(增加實現與產出), Be more(豐富經驗)

下一波浪潮
Feature Engineering

高級認知(感測元件)與自然語言對話

如何判別哪些是AI公司,乃些是掛羊頭賣狗肉的偽AI


衡量AI的現實標準
通用智能General AI:機器獲取知識與實現目標的能力
e.g., 智慧客服(在特定範疇、使用特定演算法解決特定問題)、搜尋引擎(可以學習與適應,以解決新問題)

認知智能Cognitive AI:能夠感知(看聽感覺),透過這些感知來行動/運動
e.g., 自動駕駛(狹義),視覺語音辨識與自然語言的理解(廣義)

百度大腦


AI+世界 
用自然語言跟任何裝置溝通(賈伯斯不過是用觸碰螢幕讓大家擺脫建盤與滑鼠)
工業製造=>資訊社會=>數位世界(改變人類對於真實世界的認知)
懂得比別人多、看的比別人多(=數據比別人多),能做的就會比別人多也比別人更加強大


百度與谷歌
百度在金融、無人車、醫療與整體製造上的機會>谷歌
美國IT是五巨頭並列:蘋果、谷歌、臉書、亞馬遜、微軟
百度在中國定位是IT的基礎(幕後的老大哥)


AI技術目前的發展
量子計算



03 在大數據與深度學習中蝶化的人工智慧

在歷史的重複中變化
我們的生活成為數據
透過數據(而非感覺)來做判斷
過去透過有限的經驗(=抽樣)來做決定,大數據與雲端運算讓窮舉法變得可行


運用大數據創造出熱門商品
Netflix紙牌屋影集用數據來決定主演男主角
川普競選靠數據分析
從民眾對於吃的FAQ可以描繪出不同地區與民眾的特徵


突破:機器學習與人工智慧 
類似Data Mining-先得到結果再反性推導模式與想涵義
人類透過搜尋引擎獲取資訊的行為,就是人與機器的對話
搜尋引擎的持續進化-透過資訊找人、舉一反三:知道搜尋者的意思、位置、身分與習慣來提供搜尋結果

搜尋就是AI專案計畫




04 中國大腦計劃:從下而上的超級工程

人機世界迫切需要新大腦
DNA是生物世界的程式語言
地球這部生物電腦運太慢,只有人腦創造出來的電腦,可以超越人腦
深度學習就是讓程式自己改造自己=>百度大腦的嘗試


AI的金字塔結構
底層是GPU/FPGA的運算平台、數據儲存與程式碼平台
中間是人工智慧基礎智慧層-語意圖像辨識等認知功能
上層則是SaaS(Software as a Service)各種應用

CPU/GPU/FPGA的差異
摘錄:
圖形處理器GPU最初是用在個人電腦、工作站、遊戲機和一些移動設備上運行繪圖運算工作的微處理器,可以快速地處理圖像上的每一個像素點。後來科學家發現,其海量數據並行運算的能力與深度學習需求不謀而合,因此,被最先引入深度學習。2011年吳恩達教授率先將其應用於谷歌大腦中便取得驚人效果,結果表明,12顆英偉達的GPU可以提供相當於2000CPU的深度學習性能,之後紐約大學、多倫多大學以及瑞士人工智能實驗室的研究人員紛紛在GPU上加速其深度神經網絡。
中央處理器CPU需要很強的處理不同類型數據的計算能力以及處理分支與跳轉的邏輯判斷能力,這些都使得CPU的內部結構異常複雜;而圖形處理器GPU最初面對的是類型高度統一的、相互無依賴的大規模數據和不需要被打斷的純淨的計算環境,所以GPU只需要進行高速運算而不需要邏輯判斷。目標運算環境的區別決定了GPUCPU不同的設計架構: CPU擁有專為順序邏輯處理而優化的幾個核心組成的串行架構,這決定了其更擅長邏輯控制、串行運算與通用類型數據運算;而GPU擁有一個由數以千計的更小、更高效的核心組成的大規模並行計算架構,大部分晶體管主要用於構建控制電路和Cache,而控制電路也相對簡單,且對Cache的需求小,只有小部分晶體管來完成實際的運算工作。所以大部分晶體管可以組成各類專用電路、多條流水線,使得GPU的計算速度有了突破性的飛躍,擁有了更強大的處理浮點運算的能力。這決定了其更擅長處理多重任務,尤其是沒有技術含量的重複性工作。
當前最頂級的CPU只有4核或者6核,模擬出8個或者12個處理線程來進行運算,但是普通級別的GPU就包含了成百上千個處理單元,高端的甚至更多,這對於多媒體計算中大量的重複處理過程有著天生的優勢。





  
(米國)為未來人工智慧做好準備 23條建議

沒有留言: