剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

夏乙 編譯整理

量子位 出品 | 公眾號 QbitAI

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

給吳恩達三塊白板和一支馬克筆,聽他講一節精彩的課。

剛剛,在O’reilly舉辦的AI Conference上,吳恩達做了個25分鐘的演講,主題依然是“AI is the new electricity”,但內容可以說是充滿誠意非常乾貨了。

吳恩達老師這節課,主要講了這四部分內容:

  • AI能做什麼?各種算法有多大商業價值?

  • 做AI產品要注意什麼?

  • 怎樣成為真正的AI公司?

  • 給AI領導者的建議

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

現場視頻截圖,主要看字

量子位看著視頻寫了一份筆記,將其中的乾貨摘錄如下:

吳恩達的老師的開場白,依然是AI像當年的電力一樣,正開始改變所有行業。

要理解AI,就要先進入我們的第一部分:

AI能做什麼?

目前,AI技術做出的經濟貢獻幾乎都來自監督學習,也就是學習從A到B,從輸入到輸出的映射。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

比如說,輸入一張照片,讓機器學會判斷這張照片是不是你,輸出0或1。

現在最賺錢的機器學習應用,應該說是在線廣告。在這個例子中,輸入是廣告和用戶信息,輸出是用戶會不會點擊這個廣告(還是0或1)。

監督學習還可以應用在消費金融領域,輸入貸款申請信息,輸出用戶是否會還款。

過去幾年裡,機器學習經歷了迅速的發展,越來越擅長學習這類A到B的映射,創造了大規模的經濟效益。

同時,AI的進步也體現在監督學習的輸出不再限於0或1的數字。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

比如說語音識別的任務,也是一種端到端的學習,輸入音頻,輸出文本。只要有足夠的數據,語音識別就能達到很好的效果。

這類算法為語音搜索、亞馬遜Alexa、蘋果Siri、百度DuerOS等等提供了基礎。

還有輸入英語輸出法語的機器翻譯,輸入文本輸出音頻的TTS(Text to Speech)等等,都是監督學習的應用。

監督學習的缺點是它需要大量的標註數據,這影響了它的普及。

經常有人問我,為什麼神經網絡已經存在了這麼多年,AI卻近年來才開始快速發展?

很多人可能見過我畫這張圖:

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

橫軸是數據量,縱軸是算法的性能。

隨著數據量的增加,傳統機器學習算法的性能並沒有明顯提升,而神經網絡的性能,會有比較明顯的提升,神經網絡越大,性能的提升就越明顯。

為了達到最佳的性能,你需要兩樣東西:一是大量的數據,二是大型的神經網絡。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

擦乾淨白板繼續講~

還有一個問題,有很多人問我:機器學習中最大的趨勢是什麼?算法如何創造價值?

現在來看,創造最多價值的還是監督學習。

如果你問我監督學習之後是什麼,我認為遷移學習現在也開始創造不少經濟效益。可能因為這個概念不夠性感,所以人們談論得不多。

比如說你的算法從一個像ImageNet那樣的大數據集學到了圖像識別,然後用遷移學習,用到醫學影像診斷上。

非監督學習,我認為是非常好的長期研究項目。它也創造了一些經濟價值,特別是在自然語言處理上。

強化學習也很有意思,我研究了很多年,現在也還在這方面做一些微小的工作。但是我認為,強化學習的輿論熱度和經濟效益有點不成比例。

強化學習對數據的飢渴程度甚至比監督學習更嚴重,要為強化學習算法獲取到足夠的數據非常難。

在打遊戲這個領域,強化學習表現很好,這是因為在電子遊戲中,算法可以重複玩無限次,獲取無限的數據。

在機器人領域,我們也可以建立一個模擬器,相當於能讓強化學習agent在其中模擬無人車、人形機器人,重複無限次“遊戲”。

除了遊戲和機器人領域之外,要把強化學習應用到商業和實踐中還有很長的路要走。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

現在,監督學習、遷移學習、非監督學習、強化學習這四類算法所創造的經濟效益是遞減的。

當然,這只是目前的情況。計算機學科不斷有新突破,每隔幾年就變個天。這四個領域中的任何一個都可能發生突破,幾年內這個順序就可能要重排。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

我注意到的另一件事情是,機器學習依靠結構化數據,比非結構化數據創造了更多的經濟效益。

舉個結構化數據的例子,比如說你的數據庫記錄了用戶的交易情況,誰什麼時候買了什麼東西,誰什麼時間給誰發了信息,這就是結構化數據。

而像圖像、音頻、自然語言等等,就是非結構化數據。

雖然非結構化數據聽起來更吸引人,輿論熱度更高,但結構化數據的價值在於它通常專屬於你的公司,比如說只有你的打車公司才有用戶什麼時候叫車、等了多長時間這樣一個數據集。

所以,不要低估結構化數據結合深度學習所能創造的經濟價值。

在前面談到的幾類學習算法中,單是監督學習就已經為公司、創業者創造了大量的經濟價值和機會。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

再擦一塊白板(×2),繼續~

做AI產品要注意什麼?

有一個很有意思的趨勢,是AI的崛起正改變著公司間競爭的基礎。

公司的壁壘不再是算法,而是數據。

當我建立一家新公司,會特地設計一個循環:

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

先為算法收集足夠的數據,這樣就能推出產品,然後通過這個產品來獲取用戶,用戶會提供更多的數據……

有了這個循環之後,對手就很難追趕你。

這方面有一個很明顯的例子:搜索公司。搜索公司有著大量的數據,顯示如果用戶搜了這個詞,就會傾向於點哪個鏈接。

我很清楚該如何構建搜索算法,但是如果沒有大型搜索公司那樣的數據集,簡直難以想象一個小團隊如何構建一個同樣優秀的搜索引擎。這些數據資產就是最好的壁壘。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

工程師們還需要清楚這一點:

AI的範圍,比監督學習廣泛得多。我認為人們平時所說的AI,其實包含了好幾類工具:比如機器學習、圖模型、規劃算法、知識表示(知識圖譜)。

人們的關注點集中在機器學習和深度學習,很大程度上是因為其他工具的發展速度很平穩。

如果我現在建立一個AI團隊,做AI項目,很多時候應該用圖模型,有時應該用知識圖譜,但是最大的機遇還是在於機器學習,這才是幾年來發展最快、出現突破的領域。

接下來我要和大家分享一下我看問題的框架。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

計算機,或者說算法是怎樣知道該做什麼的呢?它有兩個知識來源,一是數據,二是人工(human engineering)。

要解決不同的問題,該用的方法也不同。

比如說在線廣告,我們有那麼多的數據,不需要太多的人工,深度學習算法就能學得很好。

但是在醫療領域,數據量就很少,可能只有幾百個樣例,這時就需要大量的人工,比如說用圖模型來引入人類知識。

也有一些領域,我們有一定數量的數據,但同時也需要人工來做特徵工程。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

當然,還要談一談工程師如何學習。

很多工程師想要進入AI領域,很多人會去上在線課程,但是有一個學習途徑被嚴重忽視了:讀論文,重現其中的研究。

當你讀了足夠多的論文,實現了足夠多的算法,它們都會內化成你的知識和想法。

要培養機器學習工程師,我推薦的流程是:上(deeplearning.ai的)機器學習課程來打基礎,然後讀論文並復現其中的結果,另外,還要通過參加人工智能的會議來鞏固自己的基礎。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

再擦一塊白板(×3)

怎樣成為真正的AI公司?

我接下來要分享的這個觀點,可能是我今天所講的最重要的一件事。

從大約20年、25年前開始,我們開始看見互聯網時代崛起,互聯網成為一個重要的東西。

我從那個時代學到了一件重要的事:

商場 + 網站 ≠ 互聯網公司

我認識一家大型零售公司的CIO,有一次CEO對他說:我們在網上賣東西,亞馬遜也在網上賣東西,我們是一樣的。

不是的。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

互聯網公司是如何定義的呢?不是看你有沒有網站,而是看做不做A/B測試、能不能快速迭代、是否由工程師和產品經理來做決策。

這才是互聯網公司的精髓。

現在我們經常聽人說“AI公司”。在AI時代,我們同樣要知道:

傳統科技公司 + 機器學習/神經網絡 ≠ AI公司(全場笑)

公司裡有幾個人在用神經網絡,並不能讓你們成為一家AI公司,要有更深層的變化。

20年前,我並不知道A/B測試對互聯網公司來說有多重要。現在,我在想AI公司的核心是什麼。

我認為,AI公司傾向於策略性地獲取數據。我曾經用過這樣一種做法:在一個地區發佈產品,為了在另一個地區發佈產品而獲取數據,這個產品又是為了在下一個地區發佈產品來獲取數據用的,如此循環。而所有產品加起來,都是為了獲取數據驅動一個更大的目標。

像Google和百度這樣的大型AI公司,都有著非常複雜的策略,為幾年後做好了準備。

第二點是比較戰術性的,你可能現在就可以開始施行:AI公司通常有統一的數據倉庫

很多公司有很多數據倉庫,很分散,如果工程師想把這些數據放在一起來做點什麼,可能需要和50個不同的人來溝通。

所以我認為建立一個統一的數據倉庫,所有的數據都存儲在一起是一種很好的策略。

另外,普遍的自動化新的職位描述也是AI公司的重要特徵。

比如說在移動互聯網時代,產品經理在設計交互App的時候可能會畫個線框圖:

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

然後工程師去實現它,整個流程很容易理清楚。

但是假設在AI時代,我們要做一個聊天機器人,這時候如果產品經理畫個線框圖說:這是頭像,這是聊天氣泡,並不能解決問題。

聊天氣泡長什麼樣不重要,我需要知道的是,這個聊天機器人要說什麼話。線框圖對聊天機器人項目來說沒什麼用。

剛剛,吳恩達講了乾貨滿滿的一節全新AI課,全程手寫板書

如果一個產品經理畫了個無人車的線框圖,說“我們要做個這個”,更是沒什麼用。(全場笑)

在AI公司裡,產品經理在和工程師溝通的時候,需要學會運用數據,要求精確的反饋。

給AI領導者的建議

時間好像不夠了,給高管的建議嘛,歡迎閱讀我給《哈佛商業評論》寫的文章

互動時間

如果你對吳恩達最後提到的那篇文章感興趣,可以在量子位微信公眾號(QbitAI)對話界面,回覆:“hbr”三個字母,即可獲得地址。

— 完 —

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回覆“招聘”兩個字。

量子位 QbitAI

վ'ᴗ' ի 追蹤AI技術和產品新動態


分享到:


相關文章: