設為首頁  加入最愛網
會員中心 贊助提供 徵求志工 線上電台 優惠精品 合作夥伴 關於我們 連絡我們
 
         
  首頁 > 影音網>人工智慧第二講:深度學習 Deep Learning
人工智慧第二講:深度學習 Deep Learning

[原著]

[施永強教授]於2019-12-02 03:12:57上傳[]

 




CH 1




人工智慧第二講:深度學習 Deep Learning
Professor FRANK Y. SHIH, 施永強教授
College of Computing Sciences, New Jersey Institute of Technology, Newark, NJ 07102
     筆者在New Jersey Institute of Technology任職正教授三十年,曾經歷電腦系系主任、NJIT全校教授升等暨終身聘任權的評鑑委員會主席、研究所所長、博士委員會主席、碩士委員會主席。獲得多項美國國科會的研究獎金,美國航空太空總署、美國陸軍、海軍、空軍及工業界(AT&T、IBM)的研究計畫獎金,現擔任十多個國際專業學術期刊的主編及副編,擔任過許多國際學術研討會的主席和委員。發表過逾兩百五十多篇的學術研究論文,並著有六本專業的大學及研究所教科書。筆者於8/29/2018 受邀請在New Jersey Living Well Club演講:人工智慧。因為反應熱烈深受聽眾關切,續受邀請於10/30/2019 在 New Jersey Living Well Club演講人工智慧第二講:深度學習。希望透過我三十多年研究AI領域的經驗介紹,能讓大家對人工智慧更感興趣,有正確的認知。以下是演講的内容摘要:
     人工智慧的起源在1943年,由神經生理學家Warren McCulloch 和 數學家Walter Pitts 建構腦神經運作模型。在1956年,由史丹佛大學教授John McCarthy 提出Artificial Intelligence (AI) 『人工智慧』一詞。Intelligence 一詞由拉丁文 legere 演變而來,是蒐集和組合,並從事選擇、進而能瞭解和感受的意思。筆者的研究經驗,早從1984年起,在美國Purdue University攻讀博士學位,即從事Artificial Intelligence和Pattern Recognition的研究,博士畢業後在紐澤西州立理工大學擔任教授,更擴大從事Robot Vision, Multimedia Data Security, Intelligent Watermarking, Steganography, Forensics等專門研究領域。迄今,著作了6本書,出版了250篇專業論文
     機器學習是將無明顯秩序的數據轉化為有價值的方法。也就是説機器學習的價值,乃是從數據中抽取規律並用來預測未來。機器學習的應用廣泛,舉凡:(一)分類問題 : 圖像識別、垃圾郵件識別;(二)回歸問題:股價預測、房價預測;(三)排序問題:電擊率預估、推薦;(四)生成問題:圖像生成、圖像風格轉換、圖像文字描述生成。機器學習的方法可以分為兩種:(一)符號式學習(Symbolic Learning):將事例依其特徵以文字或符號方式表示,然後嘗試取出其分類規則;(二)連結式學習(Connectionist Learning):將事例的特徵用數值形式表示,然後用類神經網路的機制來學習其分類規則。
     深度學習早在1940 年代就有研究,並不是新穎的概念,它是機器學習(Machine Learning)的一種方法,是目前人工智慧的主流。它的最佳代表作包括擊敗世界棋王的 Google AlphaGo和奪得美國Jeopardy電視節目比賽冠軍的 IBM Watson。常有人問:「要設計出比天才還厲害的電腦的人,一定要比天才還聰明,對不對?」答案是:不對。同樣的,要建立一套深度學習的網路,其實沒有想像中困難,只要有基本的了解,再搭配網路資源自己學習,就可以開始建立自己的深度學習網路。
     要怎麽做才能把大象放進冰箱?只需要三個步驟:「打開冰箱、放進大象、關上冰箱門。」同樣的,深度學習只需要三個步驟:建立網路、設定目標、開始學習。深度學習本身就是函數集,神經網路就是一大堆函數的綜合體。當我們丟進去一堆數值,整個網路就送出一堆數值,從這裡面找出一個最好的結果,也就是機器運算出來的最佳解答,機器可以依此決定下一步要如何行動,人類也可以按照這個建議作因應決策。我們可以在深度學習的神經網路這個函數裡加進各種變數,在電腦執行程式後,我們可以很快地看到結果,還可以告訴機器,這個結果是正確的還是錯誤的,並且來調整函數內容,來來回回漸近式地達到正確結果。這個過程,就是所謂的「學習」,經過大量資料的訓練過程,最終機器就能找到一個最佳函數,得出最佳的答案了。
     圖一顯示人工神經元細胞(neuron)結構。由於生物神經元具有不同的突觸性質和突觸強度,所以對神經元的影響不同,我們用加權值來表示,其正負模擬了生物神經元中突出的興奮和抑制,其大小則代表了突出的不同連接強度。由於累加性,我們對全部輸入信號進行累加整合,相當於生物神經元中的膜電位。類神經網路模擬神經細胞的運作以達到類似學習功能,人腦約有一千億個神經細胞,每個神經細胞約有一千根連結與其他神經細胞相連。因此,人腦中約有一百萬億根連結,形成一個高度連結網狀的神經網路(圖二)。學習過程可有逐步學習和批次學習。逐步學習是在每一訓練樣本,計算其加權值與門檻值的修正量後立即修改;批次學習則是在一個學習循環後,計算所有訓練樣本的加權值與門檻值的修正量後才修改。
     假設神經網路每一層有1000個神經元細胞,那每一層中間就有100萬個權值,疊加越多層越可怕,這怎麼會簡單?如果所有的權值都要人們去設定,那就不叫做「機器學習」了,在神經網路裡的千百萬個數值,都是機器自己學出來的,由人類定義學習規則和提供大量的學習資料,告訴機器什麼答案是對的,機器就會自己去調整權值來做出正確的判斷。在深度學習中有很多模型可辨識圖像,基本的作法跟人腦很像,第一層先處理線條,由小區域慢慢組合成一些形狀,最後看整個大區域,就能判讀出圖形的内容。
     以 AlphaGo 為例,當團隊設定好神經網路後,將大量的棋譜資料送入,讓 AlphaGo 學習下圍棋的方法,最後它就能判斷棋盤上的各種狀況,並根據對手的落子做出相對回應。AlphaGo 雖然下圍棋很高竿,但拿它的神經網路去開車就不行了。深度學習並不是萬能的,它只能針對某種特定需要來設計,它的各種應用都才開始而已,還有很多領域需要人們去開發、設計、發展、測試。
     現今所有企業都可以稱為「AI公司」或「科技公司」,在2000年有「網路企業」如Yahoo、Google,今天沒有這種說法。10幾年前有所謂的「互聯網產業」,但今天我們都稱為「智慧+」產業,如智慧製造、智慧醫療。10幾年後,我們會把「智慧」兩個字省略。如今AI對產業的衝擊,涵蓋各行各業,從傳產到科技,從藍領到白領。張忠謀表示,未來25年內,很多職業將被AI取代;導致失業率增加。李開復表示,未來30年,將有45%的工作被人工智慧取代。張忠謀更說,現在的年輕人,辛苦念書20多年,卻要小心工作被 AI 取代。
     李開復預測未來40種工作受到AI影響的情況,分成4大類,每類各有10種。
1.    「名存實亡」: 很快會被淘汰,如電話行銷員、電話接線員、收銀員、速食店員等
2.    「抱火臥薪」: 看似安全,實則危機四伏,如保全人員、卡車司機、記帳員、市場研究等。
3.    「有驚無險」: 看似危險但其實很難被取代的工作,如清潔工、保母、養老護理員、導遊
4.    「高枕無憂」: 包括醫療護理人員、小說家、電腦工程師、老師和管理者(真正的領導者)。
     另外人工智慧對太空船有相當的貢獻,當初美國太空總署〈NASA〉的卡西尼號太空船〈CASSINI〉,運用人工智慧設備,其生存機會大於一般的太空船。其原因在於遇到狀況時,CASSINI能夠自行處理。宇宙是如此的浩瀚,在遙遠行星中的太空任務中,人類無法忍受長達數十年的星際探險,更不可能在不適合人類生存的星體進行任務。因此具備智慧的人工探險家將可替代人類來達成這些不可能的任務。
     總而言之,人工智慧的研究乃在利用電腦來模擬人的智慧,有關人類智慧的探討、人類智慧的運作、與設計智慧型系統的研究,均包含在人工智慧的領域裡。因此與人工智慧相關的研究領域甚廣,除資訊科學外,尚包含:心理學、語言學、神經學、邏輯學、哲學、認知科學、生物學……等等。在現代的電腦中,處處可以看到人工智慧的應用,讓電腦變的更有智慧。

Advertisements