人工智能(AI)、機器學習(machinelearning)和深度學習(deeplearning)都用上了。這三者在AlphaGo擊敗李世乭的過程中都起了作用,但它們說的并不是一回事。
今天我們就用最簡單的方法——同心圓,可視化地展現出它們三者的關系和應用。
如下圖,人工智能是最早出現的,也是最大、最外側的同心圓;其次是機器學習,稍晚一點;最內側,是深度學習,當今人工智能大爆炸的核心驅動。
五十年代,人工智能曾一度被極為看好。之后,人工智能的一些較小的子集發展了起來。先是機器學習,然后是深度學習。深度學習又是機器學習的子集。深度學習造成了前所未有的巨大的影響。
從概念的提出到走向繁榮
1956年,幾個計算機科學家相聚在達特茅斯會議(DartmouthConferences),提出了“人工智能”的概念。其后,人工智能就一直縈繞于人們的腦海之中,并在科研實驗室中慢慢孵化。之后的幾十年,人工智能一鎮旦直在兩極反轉,或被稱作人類文明耀眼未來的預言;或者被當成技術瘋子的狂想扔到垃圾堆里。坦白說,直到2012年之前,這兩種聲音還在同時存在。
過去幾年,尤其是2015年以來,人工智能開始大爆發。很大一部分是由于GPU的廣泛應用,使得并行計算變得更快、更便宜、更有效。當然,無限拓展的存儲能力和驟然爆發的數據洪流(大數據)的組合拳,也使得圖像數據、文本數據、交易數據、映射數據全面海量爆發。
讓我們慢慢梳理一下計算機科學家們是如何將人工智能從最早的一點點苗頭,發展到能夠支撐那些每天被數億用戶使用的應用的。
人工智能(ArtificialIntelligence)——為機器賦予人的智能
成王(Kingme):能下國際跳棋的程序是早期人工智能的一個典型應用,在二十世紀五十年代曾掀起一陣風潮。(譯者注:國際跳棋棋子到達底線位置后,可以成王,成王棋子可以向后移動)。
早在1956年夏天那次會議,人工智能的先驅們就夢想著用當時剛剛出現的計算機來構造復雜的、擁有與人類智慧同樣本質特性的機器。這就是我們現在所說的“強人工智能”(GeneralAI)。這個無所不能的機器,它孫伍有著我們所有的感知(甚至比人更多),我們所有的理性,可以像我們一樣思考。
人們在電影里也總是看到這樣的機器:友好的,像星球大戰中的C-3PO;邪惡的,如終結者。強人工智能現在還只存在于電影和科幻小說中,原因不難理解,我們還沒法實現它們,至少目前還不行。
我們目前能實現的,一般被稱為“弱人工智能”(NarrowAI)。弱人工智能是能夠與人一樣,甚至比人更好地執行特定任務的技術。例如,Pinterest上的圖像分類;或者Facebook的人臉識別。
這些是弱人工智能在實踐中的例子。這些技術實現的是人類智能的一些具體的局部。但它們是如何實現的?這種智能是從何而來?這就帶我們來到同心圓的里面一層,機器學習。
機器學習——一種實現人工智能的方法
健康食譜(Spamfreediet):機器學習能夠幫你過濾電子信箱里的(大部分)垃圾郵件。(譯者注:英文中垃圾郵件的單詞spam來源于二戰中美國曾大量援助英國的午餐肉品牌SPAM。直到六十年代,英國的農業一直沒有從二戰的損失中恢復,因而從美國大量進口了這種廉價的罐頭肉制品。據傳聞不甚好吃且充斥市場。)
機器學習最基本的做法,是使用算法來解析數據、從中學習,然后對真實世界中的事件做出決策和預測。與傳統的為解決特定任務、硬編碼的軟件程序不同,機器學習是用大量的數據來“訓練”,通過各種算法從數據中學習如何完成任務。
機器學習直接來源于早期的人工智能領域。傳統算法包括決策樹學習、推導邏輯規劃、聚類、強化學習和貝葉斯網絡等等。眾所周知,我們還沒有實現強人工智能。早期機器學習方法甚至都無法實則旅或現弱人工智能。
機器學習最成功的應用領域是計算機視覺,雖然也還是需要大量的手工編碼來完成工作。人們需要手工編寫分類器、邊緣檢測濾波器,以便讓程序能識別物體從哪里開始,到哪里結束;寫形狀檢測程序來判斷檢測對象是不是有八條邊;寫分類器來識別字母“ST-O-P”。使用以上這些手工編寫的分類器,人們總算可以開發算法來感知圖像,判斷圖像是不是一個停止標志牌。
這個結果還算不錯,但并不是那種能讓人為之一振的成功。特別是遇到云霧天,標志牌變得不是那么清晰可見,又或者被樹遮擋一部分,算法就難以成功了。這就是為什么前一段時間,計算機視覺的性能一直無法接近到人的能力。它太僵化,太容易受環境條件的干擾。
隨著時間的推進,學習算法的發展改變了一切。
深度學習——一種實現機器學習的技術
放貓(HerdingCats):從YouTube視頻里面尋找貓的圖片是深度學習杰出性能的首次展現。(譯者注:herdingcats是英語習語,照顧一群喜歡自由,不喜歡馴服的貓,用來形容局面混亂,任務難以完成。)
人工神經網絡(ArtificialNeuralNetworks)是早期機器學習中的一個重要的算法,歷經數十年風風雨雨。神經網絡的原理是受我們大腦的生理結構——互相交叉相連的神經元啟發。但與大腦中一個神經元可以連接一定距離內的任意神經元不同,人工神經網絡具有離散的層、連接和數據傳播的方向。
例如,我們可以把一幅圖像切分成圖像塊,輸入到神經網絡的第一層。在第一層的每一個神經元都把數據傳遞到第二層。第二層的神經元也是完成類似的工作,把數據傳遞到第三層,以此類推,直到最后一層,然后生成結果。
每一個神經元都為它的輸入分配權重,這個權重的正確與否與其執行的任務直接相關。最終的輸出由這些權重加總來決定。
我們仍以停止(Stop)標志牌為例。將一個停止標志牌圖像的所有元素都打碎,然后用神經元進行“檢查”:八邊形的外形、救火車般的紅顏色、鮮明突出的字母、交通標志的典型尺寸和靜止不動運動特性等等。神經網絡的任務就是給出結論,它到底是不是一個停止標志牌。神經網絡會根據所有權重,給出一個經過深思熟慮的猜測——“概率向量”。
人工智能
人工智能英文縮寫為AI,它是研究、開發用于模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能是計算侍盯機科學研究領域的一個重要分支,又是眾多學科的一個交叉學科,它企圖了解智能的實質,并生產出一種新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括語音識別、圖像識別、機器人、自然語言處理、智能搜索和專家系統等等,人工智能可以對人的意識、思維的信息過程的模擬。人工智能包括眾多的分支領域,比如大家熟悉的機器學習老燃和、自然語言理解和模式識別等。
機器學習
機器學習屬于人工智能研究與應用的一個分支領域。機器學習的研究更加偏向理論性,其目的更偏向于是研究一種為了讓計算機不斷從數據中學習知識,而使機器學習得到的結果不斷接近目標函數的理論。
機器學習,引用卡內基梅隆大學機器學習研究領域的著名教授Tom Mitchell的經典定義:
如果一個程序在使用既有的經驗E(Experience)來執行某類任務T(Task)的過程中被認為是“具備學習能力的”,那么它一定要展現出:利用現有的經驗E,不斷改善其完成既定任務T的性能(Performance)的特質。
機器學習已經有了十分廣泛的應用,例如:數據挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰略游戲和機器人運用。在我們當下的生活中,語音輸入識別、手寫輸入識別等技術,識別率相比之前若干年的技術識別率提升非常巨大,達到了將近97%以上,大家可以在各自的手機上體驗這些功能,這些技術來自于機器學習技術的應用。
深度學習
深度學習的概念源于人工神經網絡的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發現數據的分布式特征表示。晦澀難懂的概念,略段核微有些難以理解,但是在其高冷的背后,卻有深遠的應用場景和未來。
關系
嚴格意義上說,人工智能和機器學習沒有直接關系,只不過是機器學習的方法被大量的應用于解決人工智能的問題而已。目前機器學習是人工智能的一種實現方式,也是最重要的實現方式。
深度學習是機器學習比較火的一個方向,其本身是神經網絡算法的衍生,在圖像、語音等富媒體的分類和識別上取得了非常好的效果。
人工智能(AI)和機器學習(ML)現在是兩個非常熱門的流行語,通常似乎可以互換使用。但這二者并不完全一樣,但是有時會導致人們的看法有一些混亂,因此需要解釋這二者之間的區別。當大數據、數據分析,以及更廣泛的技術變革浪潮席卷全球時,這兩個術語都會頻繁出現。總之,最好的答案是:人工智能是一種機器能夠以人們認為“聰明”的方式執行任務的更廣泛的概念。而且,機器學習是人工智能的一個最新應用,它基于這樣一個想法:真的應該能夠讓機器訪問數據,讓他們自己學習。
通俗理解機器學習:機器從數據中學習,慎納進而得到一個更加符合現實規律的模型,通過對模型的使用使得機器比以往表現的更好。
舉個例子:
中學階段,學生通過做大量的練習題,為的就是在高考解決問題。高考的題目一般來說是之前肯定沒寬返沒有遇到過的(無原題),但是這并不意味著這些題目我們無法解決。通過對之前所做過的練習題的分析,找到解題方法,同樣可以解決陌生的題目,這就是人類的學習。機器學習就是模擬人類學習的過程。
機器學習其實就是將這一套方式運用到機器上,利用一些已知的數據(平時的練習題)來訓練機器(做,讓機器自己分析這些數據,并世戚找到內在聯系(學習解題方法),構建模型,從而對未知的數據(高考題)進行預測判定等。
關于機器學習一些算法? 可以關注 機器學習學習筆記?
我覺的可以到這邊來看看就清楚了,互聯網it