人工智能、機器學習、深度學習的區(qū)別在哪?
有人說,人工智能(Artificial Intelligence)是未來。人工智能是科幻小說。人工智能已經(jīng)是我們?nèi)粘I畹囊徊糠?。所有這些陳述都 ok,這主要取決于你所設想的人工智能是哪一類。
例如,今年早些時候,Google DeepMind 的 Alphago 程序擊敗了韓國圍棋大師李世乭九段。人工智能、機器學習和深度學習這些詞成為媒體熱詞,用來描述 DeepMind 是如何獲得成功的。盡管三者都是 AlphaGo 擊敗李世乭的因素,但它們不是同一概念。
區(qū)別三者最簡單的方法:想象同心圓,人工智能(AI)是半徑最大的同心圓,向內(nèi)是機器學習(Machine Learning),最內(nèi)是深入學習(Deep Learning)。
從概念的而提出到繁榮
自從幾位計算機科學家在 1956 年的達特茅斯會議上提到這個詞以后,人工智能就縈繞在實驗研究者們心中,不斷醞釀。在此后的幾十年里,人工智能被標榜為成就人類文明美好未來的關(guān)鍵。
在過去的幾年里,特別是 2015 以來,人工智能開始大爆發(fā)。這在很大程度上提高了 GPU 的廣泛可用性,使得并行處理速度越來越快,使用更便宜,而且功能更強大。整個大數(shù)據(jù)運動擁有無限的存儲和大量的數(shù)據(jù):圖像,文本,交易,映射數(shù)據(jù)等等。
人工智能——機器所賦予的人的智能
早在 1956 年夏天的會議上,人工智能先驅(qū)者的夢想是建立一個由新興計算機啟用的復雜的機器,具有與人的智能相似的特征。這是我們認為的「強人工智能」(General AI),而神話般的機器則會擁有我們所有的感知,甚至更多,并且像人類一樣思考。你已經(jīng)在電影中見過這些機器無休止地運動,像朋友如 C-3PO,或者敵人如終結(jié)者。一般的人工智能機器仍然只是出現(xiàn)在電影和科幻小說中。
我們目前可以實現(xiàn)的還是局限于「弱人工智能」(Narrow AI)。這些技術(shù)能夠像人類一樣執(zhí)行特定的任務,或者比人類做的更好。像 Pinterest 上的圖像分類,F(xiàn)acebook 上的人臉識別等。
這些都是弱人工智能實踐中的例子。這些技術(shù)展示了人類智力的一些方面。但如何展示?這些智力是從哪里來的?這些問題促使我們進入到下一個階段,機器學習。
機器學習——一種實現(xiàn)人工智能的方法
機器學習最根本的點在于使用算法來分析數(shù)據(jù)的實踐、學習,然后對真實的事件作出決定或預測。而不是用一組特定的指令生成的硬編碼軟件程序來解決特定任務,機器是通過使用大量的數(shù)據(jù)和算法來「訓練」,這樣就給了它學習如何執(zhí)行任務的能力。
機器學習是早期人工智能人群思考的產(chǎn)物,多年來形成的算法包括決策樹學習、歸納邏輯編程、聚類、強化學習、貝葉斯網(wǎng)絡等等。正如我們所知,所有這些都沒有實現(xiàn)強人工智能的最終目標,而早期的機器學習方法甚至連弱人工智能都沒有觸及到。
事實證明,多年來機器學習的最佳應用領(lǐng)域之一是計算機視覺,盡管仍然需要大量的手工編碼來完成這項工作。人們會去寫手工編碼分類器,如邊緣檢測濾波器,以便程序可以識別一個目標的啟動和停止;進行形狀檢測以確定它是否有八個側(cè)面;同時確保分類器能夠識別字母「s-t-o-p.」從那些手工編碼分類器中,機器就會開發(fā)算法使得圖像和「學習」更有意義,用來確定這是否是一個停止標志。
結(jié)果還算不錯,但這還不夠。特別是在霧天當標志不那么清晰,或有一棵樹掩蓋了標志的一部分時,就難以成功了。還有一個原因,計算機視覺和圖像檢測還不能與人類相媲美,它太脆弱,太容易受到周圍環(huán)境的影響。
隨著時間的推移,學習算法改變了這一切。
深度學習——一種實現(xiàn)機器學習的技術(shù)
在過去的幾十年中,早期機器學習的另一種算法是人工神經(jīng)網(wǎng)絡。神經(jīng)網(wǎng)絡的靈感來自于我們對人類大腦生物學的理解:所有這些神經(jīng)元之間的相互聯(lián)系。在一定的物理距離內(nèi),生物大腦中的任何神經(jīng)元可以連接到其他神經(jīng)元,而人工神經(jīng)網(wǎng)絡有離散的層、連接和數(shù)據(jù)傳播的方向。
例如,你可以把一個圖像分割成很多部分,這些可以輸入到神經(jīng)網(wǎng)絡的第一層。在第一層中的單個神經(jīng)元,然后將數(shù)據(jù)傳遞到第二層。第二層神經(jīng)元做它的任務,等等,直到最后一層,那么最終結(jié)果就產(chǎn)生了。
每個神經(jīng)元都為其輸入分配權(quán)重,分配的權(quán)重正確與否與執(zhí)行的任務相關(guān)。結(jié)果,最終的輸出由所有的權(quán)重所決定。這樣,還是以「停止」標志牌為例。將「停止」標志牌圖像的元素抽離分析,然后由神經(jīng)元「檢查」:其八邊形的外形,消防車火紅的顏色,鮮明的字母,交通標志的大小,處于運動或靜止的狀態(tài)。神經(jīng)網(wǎng)絡主要任務是總結(jié)是否是個停止標志。隨即,基于權(quán)重、經(jīng)過深思熟慮「概率向量」的概念出現(xiàn)。該案例中,該系統(tǒng)中 86% 的可能是停止標志,7% 的可能是速度限制標志,5% 的可能性是掛在樹上的風箏等等。這樣,網(wǎng)絡結(jié)構(gòu)便會告知神經(jīng)網(wǎng)絡是否正確。
但這個例子還是非常超前。因為直到最近,神經(jīng)網(wǎng)絡還是被人工智能研究所忽略。實際上,在人工智能出現(xiàn)之初,神經(jīng)網(wǎng)絡就已經(jīng)顯現(xiàn)了,在「智能」方面還是產(chǎn)生很小的價值。問題是甚至最基本的神經(jīng)網(wǎng)絡都是靠大量的運算。不過,多倫多大學的 Geoffrey Hinton 領(lǐng)導的一個研究小組始終專注于其中,最終實現(xiàn)以超算為目標的并行算法的運算且概念的證明,但直到 GPU 得到廣泛利用,這些承諾才得以實現(xiàn)。
回到之前「停止」標志的例子。神經(jīng)網(wǎng)絡是被調(diào)制或「訓練」出來的,并且不時遇到錯誤的應答。它所需要的就是訓練。需要呈現(xiàn)成百上千甚至上百萬的圖像,直到神經(jīng)元輸入的權(quán)重被準確調(diào)制,那么實際上每次都能得到正確的信息,無論是否有霧,無論晴天還是雨天。只有在那一點,神經(jīng)網(wǎng)絡才學會一個停止標志是什么樣的,F(xiàn)acebook 上你媽媽的臉是什么樣,又或者是吳恩達(Andrew Ng)教授 2012 年在 Google 上學習到的貓的樣子。
吳恩達的突破在于將這些神經(jīng)網(wǎng)絡顯著增大,增加了層數(shù)和神經(jīng)元,并通過系統(tǒng)的訓練運行大量的數(shù)據(jù)。在吳教授所舉案例中,數(shù)據(jù)就是 YouTube 視頻中 1000 萬張圖像。他將深度學習中添加了「深度」,也就是這些神經(jīng)網(wǎng)絡中的所有層。
通過在某些場景中深度學習,機器訓練的圖像識別要比人做得好:從貓到辨別血液中癌癥的指標,再到核磁共振成像中腫瘤。Google 的 AlphaGo 先是學會了如何下棋,然后它與自己下棋訓練。通過不斷地與自己下棋,反復練習,以此訓練自己的神經(jīng)網(wǎng)絡。
深度學習,賦予人工智能光明的未來
深度學習使得許多機器學習應用得以實現(xiàn),并拓展了人工智能的整個領(lǐng)域。深度學習一一實現(xiàn)了各種任務,并使得所有的機器輔助變成可能。無人駕駛汽車、預防性醫(yī)療保健、甚至的更好的電影推薦,都觸手可及或即將成為現(xiàn)實。人工智能就在現(xiàn)在,也在未來。有了深度學習,人工智能可能甚至達到像我們暢想的科幻小說一樣效果。我拿走了你的 C-3PO,當然,你有《終結(jié)者》就行。