娛樂 科技 時尚 健康 遊戲 母嬰 歷史 動漫 旅遊 美食 星座 星座 寵物 探索 文藝

人工智慧不智慧,聽谷歌工程師講孩子長大後要面對的這個最大競爭對手

那麼,如何給孩子解釋機器究竟如何“學習”?它和人的學習一樣嗎?“深度學習”深在哪兒?要回答這些問題,我們先將視線拉回到二十年前。

01

機器究竟如何“學習”?

1997 年 5 月,美國紐約,IBM 的超級計算機“深藍”擊敗國際象棋世界冠軍卡斯帕羅夫。

2017 年 5 月,中國烏鎮,Google 的人工智慧圍棋軟體 AlphaGo 擊敗排名世界第一的柯潔。

可能在公眾看來,這兩場比賽沒有本質的區別。電腦花二十年變得更聰明瞭,能在更難的棋類上戰勝人類,好像也沒什麼大不了的。但是,從計算機的角度來看,它們有著天壤之別。

對弈雙方腦子裡的句式通常都是:“如果我走這步,你可以這樣或那樣走,如果你那樣走的話,我可以這麼這麼走……”。這就像順著一棵樹往上爬,每個枝椏都是分岔選擇,腦容量越大的人爬得越高、看得越廣,也就更可能擊敗對手。

另一方面,經驗豐富的玩家腦中儲存了許多“殘局”或“定勢”,當他們看到局面呈現出某種特徵時,就知道這個局勢對自己是否有利,而不需要浪費時間繼續在這片枝椏上探索。

計算機毫無疑問有著遠超人類的“腦容量”。他們能在短時間裡進行成千上萬次準確無誤的“分支檢索”。然而,再快的計算機也無法窮盡所有可能(這正是這些複雜棋類的迷人之處),於是經驗豐富的人類就有了打敗計算機的機會。

那如果將計算機的算力和頂級棋手的經驗結合起來呢?

深藍就是這樣一件傑作。它在許多象棋大師的幫助下,記錄了海量必勝或必敗的殘局,並且設計出一系列計分方法來判斷局面是否有利,進而避免將算力浪費在不利分支上。深藍是象棋大師和計算機專家共同的智慧結晶。

AlphaGo 走的完全是另一條道路。和深藍相同的是,它也需要進行大量分支檢索和對局面的判斷。但不同的是,它做這些並不需要專家的知識,而是通過大量自我博弈收集海量案例之後,構造一個龐大、複雜但又精確的數學函式,將當前局面轉化成一個“分數”(比如必勝是100分,必敗是0分,大部分情況介於兩者之間),再選擇分數最高的那個分支走下一步棋。

注意,這個分數不是專家賦予它的,而是它自己“學習”獲得的。

計算機的學習,是基於大量棋局樣本和每個樣本對應的分數,產生一個函式,這個函式用於一個沒有見過的樣本時,猜出的分數八九不離十。

打個比方,我想賣一套房子,但不清楚定價多少合適;於是我搜集許多市場上最近賣出的房子,看看房價與哪些因素有關(比如地段、面積、新舊、學區、層高等),然後設計一個函式,將這些因素設定為函式的輸入值(或者說自變數),並且使得函式套到每個案例上時輸出的結果和實際房價非常接近,那我就很有信心把這個函式用在我自己的房子上,預測它大概值多少錢。

如果熟悉數學的話,你知道函式的種類五花八門,什麼四則運算、平方開方、正弦餘弦、微分積分……我應該選什麼函式呢?其實,AlphaGo 用的函式形式並不複雜,主要是加法、乘法和一些邏輯判斷(比如是正數還是負數)。重要的是,這個函式中的引數必須是可以調整的。

打個比方,函式是一臺機器,引數是上面的開關和旋鈕,你每次調整引數的值,就得到不同的函式,儘管函式的形狀沒有變化。引數變了,對同樣的輸入值,結果自然不一樣。機器學習的過程,就是隨著輸入樣本的積累,不斷調整引數,讓輸出結果總體上的準確率達到最高。隨著樣本積累越來越多,引數會趨於穩定,那這個函式就訓練地差不多了,可以用來預測沒有見過的樣本了。

02

“深度學習”深在哪兒?

我們經常聽到的“深度學習”,其實就是這樣一大類函式的總稱,也是 AlphaGo 使用的函式型別。在下圖中,黃點是輸入值,紅點是輸出值,藍點是中間計算結果。每條線都代表一個引數。實際應用的深度學習網路比這個要複雜得多,多達成千上萬個引數,處理百萬甚至上億個樣本。

“深度學習”之深,就體現在這個網路結構的龐大上。這對於普通計算機來說是無比龐大的任務,不過藉助於影象處理器和並行運算等先進的計算機軟硬體技術,這項工作成為可能。

深度學習在影象識別、語音識別和自然語言處理上表現非常突出。影象識別的簡單情形是給計算機許多被標註的照片,計算機將每張照片轉換成一系列數字,訓練一個深度學習模型,來預測沒有見過的照片裡的物品。在每年一度的 ImageNet 影象識別比賽裡,計算機的準確率已經高達 95% 以上,比許多人類做的還要好。

03

機器學習和人的學習一樣嗎?

“機器學習”與“人工智慧”常被混用,但有著本質區別。

機器學習歸根到底是構造一個複雜精巧的函式。它是非常強有力的武器,但需要非常高超的技巧才能用好它。如果套用人的“學習”概念,它相當於是原始的歸納總結。

和人相比,儘管計算機運算很快,但效率卻非常低。小孩可能看了十張貓和狗的照片後就能分辨出下一張照片是貓還是狗,但計算機可能需要花成千上萬張照片。

人類的智慧遠不止歸納總結,還包括邏輯推演、類比、反事實條件分析等等複雜的思維模式,這些在目前的機器學習領域還是非常困難的問題,機器還遠遠沒有達到“智慧”的標準。

目前的機器學習還有許多被人詬病的地方。比如,深度學習的詮釋性很差,像個黑盒子。人們知道它效能很好,但不知道為什麼好,而且時不時出現一些低階錯誤。

另外,機器學習很難構建統一的“常識”,每一個任務都有一套獨立的模型,這個模型是為這個特定的任務驚現除錯的,稍微有點超綱就不靈了,更不用說沿用到其他領域了。

近十幾年機器學習取得了許多驚人的成就,但它只在非常初級的意義上實現了“學習”,離“智慧”還差得很遠。人類的“學習”是非常引人入勝的行為,人類對此知之甚少。

或許,他山之石可以攻玉,機器學習的進步可以幫助人們反思人類學習的本質,進而讓機器學得更好。

五一就該這樣過

16位洞察者給家庭的通識閱讀計劃

現已上線

趙楚領讀《水滸傳》

謝剛領讀《自控力》

潘採夫領讀《帕爾街的男孩》

藍藍領讀《出賣笑的孩子》

馬軍領讀《梅西傳》

原價¥108 五一限時掃碼¥39?