觀看吳恩達關於人工智能專訪的一點思考

在2020年的2月份,吳恩達,這位深度學習領域的知名學者,眾多深度學習從業者的引路人,前百度IDL領頭羊,接受了Lexpodcast的專訪,談論了關於人工智能,在線教育以及真實世界AI的一些觀點,其中很多都對我產生了很大的影響,差不多一個半小時的採訪,前前後後看了四五遍。其實,最近剛復工,而且工作壓力也比較大,本沒有太多空閒時間來觀看這部比普通電影還要長的專訪,或許是由於自己住的離單位較遠,坐在地鐵上又閒來無事,處於打發時間的考慮,反正閒著也是閒著,微博水木刷累了,就看點科技類的視頻,也還是不錯的。

觀看吳恩達關於人工智能專訪的一點思考

或許是正因為住的遠了,在地鐵上就有了一點獨處的時間。我記得在一篇散文中看到過一段話,具體作者臨時忘了,大概的意思就是他喜歡每週坐一次環城公交,靠在車窗外,什麼也不錯,什麼也不想,就貼著車窗玻璃,任由光怪陸離的世界從眼前閃過,成為記憶。獨處的時間不是孤獨的,而是自由的。最近一兩年,在地鐵上我看了三遍喬布斯傳,更確切地說是聽了三遍有聲書,看了兩遍紅樓夢,學習一些TED的視頻,有段時間還迷上了BBC的Six Minutes,二倍速播放當天最新的節目。可惜,都沒有養成習慣。在吳恩達的專訪中,Lex問他對深度學習研究者有什麼建議,特別是那些打算讀博或者做科研的人來說,學習論文方面有什麼經驗。吳恩達這樣回答,每週其實並不需要看太多論文,選擇兩篇優秀的論文來學習就行,關鍵是要養成一種習慣,堅持每週都收穫兩篇,一年下來也有一百多篇論文,這是一個不小的成就。可惜的是,我之前做的這些,都沒有養成習慣,反而是玩遊戲卻成了一種癮,之前住的近的時候,每天起床之前總要開黑若干局,說是若干其實是不固定,順風的時候玩個一兩局可能就撤了,逆風的時候總想撈回來,就剎不住車了。這種癮厲害到什麼程度呢,有時候甚至玩到了第二天,有時候在電梯裡也要繼續。好在這次戒癮已超半年,半年來從未染指一次。

觀看吳恩達關於人工智能專訪的一點思考

在採訪中,Lex還問到吳恩達是什麼時候開始對計算機對人工智能產生興趣的。果然,大牛的童年就是不一樣,在我們都還在穿開襠褲玩過家家的時候,五歲的吳恩達就開始照著書本上面的程序敲代碼了,而且還饒有興趣地主動去學習其他東西,特別是後來中學的時候去新加坡做交換生,也拓寬了自己的眼界和思路。培養了嚴謹的習慣和良好的興趣,這一點特別是在後來吳恩達教書授課的時候,在大多數人都普遍採用PPT的情況下,還依然堅持板書,後來的深度學習網課,也依然對著寫字板一步一步地推到梯度下降等深度學習算法,在吳恩達看來,只有這樣,才能更好地理解算法原理,因為數學公式本身就是一步一步推導出來的,這樣也比直接打出一屏幕的公式,更易於初學者理解。而對於為什麼熱衷於在線教育,吳恩達也有自己的想法。在開始創辦coursera之前,吳恩達是斯坦福大學的教授,每年授課,儘管接觸到的是新的學生,但是自己不得不重複講同樣的笑話,而且課堂授課,座位有限學生的數量也就有限,但是轉戰在線教育就不同了,全世界各地的人都可以同時學習,而且可以根據自己的喜好隨時隨地地學習,你可以快速播放,也可以循環播放。

為了準備coursera上面的課程,吳恩達一般都會在晚上十點到第二天凌晨三四點的時候,獨自在學校的辦公室中錄製,利用自己的業餘時間,整個課程的錄製週期前後花了大概16周。看到現在深度學習課程的受眾超過百萬,而且依然在持續增加,吳恩達的說自己很欣慰,也很感激對他的信任,但也有遺憾,就是在推出在線課程的時候,沒有出版配套的書籍。

觀看吳恩達關於人工智能專訪的一點思考

而對於目前AI熱潮,Lex也問到,進行深度學習技術研發,是不是一定需要博士學位。這一點,吳恩達博士也有自己的看法。首先,

他對當前從事人工智能行業的人員進行分類,有些人是做學術研究的,但是大多數人則是從事開發的工作。其實,如果不是去高校和研究所做學術研究,博士學位也不是必須的。他特別提到目前的中國大陸,很多AI從業人員其實都是程序開發人員,很大一部分人都沒有碩士或者博士學歷。就像現在很多人看書,但是寫書的人不多,吳恩達認為,在未來,也將會是這個現象,真正做AI底層算法開發的人不會很多,大多數人都是在上面進行開發。其實這個在目前來看,也是差不多,深度學習的框架,包括TensorFlow,caffe,pytorch以及百度和阿里自己的框架,很多人都只是採用這些框架而已。但是這樣下去,其實不好,因為一直從事芯片行業,也瞭解到我國的一些實際情況,我們卻芯片設計人員,但是更缺操作系統編譯器工具鏈等軟件人員,我記得前些年上課的時候一個做操作系統的老師,國內能夠進行操作系統底層開發的人員,不到100人。

觀看吳恩達關於人工智能專訪的一點思考

就像我們的程序開發人員都在用java,但是開發java底層的卻都是外國人。開發一個深度學習框架,的確費時費力,在國內的大背景下,一切都是向快錢看齊,哪些來的快,就做哪些。做芯片的也一樣,這幾年AI芯片比較火,就出現了眾多的AI創業公司,但是真正成功的卻沒幾個,深鑑科技算一個。但是,以色列的AI芯片初創企業,好幾個基本上不到兩年就以十幾幾十億美元被英特爾/微軟等大公司收購,國內大部分的則依然靠著資本運作續命。當然,對這一塊不熟悉,也就不再討論。不過,這兩天的一個新聞,著實讓人感到興奮,谷歌受制於美國政府的限制,去年決定不再支持華為手機使用GMS服務,但是華為自己研發了HMS服務,谷歌一看不行了,就向美國政府申請想重新向華為提供GMS服務,這一點可以看出,不是我們做不出來高科技,只不過有便宜的可以用,人都是有惰性的,只有在毫無退路的時候,才會破釜沉舟。

觀看吳恩達關於人工智能專訪的一點思考

還有一個問題,是關於目前AI算法和傳統算法研究的不同之處,吳恩達的見解也讓我受益匪淺。熟悉目前基於深度學習的AI系統,其性能評估都有一個數據集作為參考,比如imagenet,比如coco等,誰的算法性能好,誰的論文水平高,唯一的評價標準就是誰在這些數據集上面的準確率更高。但是,這就存在一個問題,數據集本身就有侷限性,數據集並不能代表真實世界,他只是真實世界的一個子集,或者是依著葫蘆畫出來的瓢,很多時候你在數據集上面得到了很高的評分,準確率很高,但是在實際場景下卻不能使用。一個常見的例子就是清華大學的學者之前發表的一篇論文,對於一個圖像識別算法,在數據集上面的識別準確率基本上達到了99%,但是加入我們在圖像上稍微加一點噪聲,論文中舉的例子是阿爾卑斯山,加了噪聲之後,人是很容易就能看出來依然是阿爾卑斯山的,但是這個算法卻識別成了一隻狗。

觀看吳恩達關於人工智能專訪的一點思考

觀看吳恩達關於人工智能專訪的一點思考

這也就是為什麼吳恩達現在在做科研的時候,並沒有只採用深度學習技術來完成功能,而是多種方法同步展開,特別是現在一直在推崇真實世界人工智能,也就是Real-world AI。李飛飛課題組也在機器人領域展開相應的研究,叫長時間SLAM導航定位,一個機器人要既能夠在白天進行導航,也能夠在晚上進行導航,既能夠在春暖花開的季節使用,也要能夠在綠樹成蔭或者白雪皚皚的時候使用,這樣的機器人才是真實的,使用場景不能侷限於某一特定環境下。當然這有很長的路要走。當我們在談論算法性能的時候,不要說你算法的準確率針對數據集提升了百分之零點幾,而是它能夠多大程度上解決實際問題。就像今年AAAI的圖靈獎論壇上面Yann LeCun說,目前的無人駕駛算法在數據集上面效果都不錯,但是距離真正的上路,還有很多工作要做。

觀看吳恩達關於人工智能專訪的一點思考

觀看吳恩達關於人工智能專訪的一點思考

最後,其實也不是吳恩達專訪的最後,這篇短文呢也沒有按照專訪的順序整理。對於AI創業公司,或者大公司剛組建項目團隊,如果開展研究工作,如果制定一個切實的目標,吳恩達以自己在谷歌和百度的經驗告訴我們,切勿貪多妄大,一定要實事求是。就像之前開展谷歌大腦項目時候,就沒有在一開始就定下一個模擬完整人類大腦的目標,而是一步一步迭代升級。而對於AI創業公司而言,做的項目,一定要有實際意義,而不是為了追求科技水平的高低,因為只有有人願意為你的產品買賬,才能說明你的項目是成功的,否則即使科技水平世界前列,也依然無濟於事,至少對於創業公司來說是失敗的。

觀看吳恩達關於人工智能專訪的一點思考

很多人可能對於做產品和做科研不太容易分的開,因為現在大多數的創業人員都是由科研背景的,總是喜歡拿之前做項目發論文的思路開展產品設計,其實這兩者之間存在很大的差別,這也是為什麼很多公司在考察科研項目的時候,都非常謹慎,因為實驗室的結果很好,並不能夠說明在實際中能夠很好地解決問題,而實驗室成果距離產品上線,依然存在鴻溝。通常發論文,你可以使用一些tricks來規避一些corner case來達到預期目標,但是做產品則不一樣,你需要考慮到所有的corner case提前演練推導,否則用戶就會幫你找bug,不過那個代價就無法估量了。所以,在我們芯片行業,即使你的測試用例100%通過,各種覆蓋率也達到100%,你依然不敢保證芯片流片回來不會是一堆無用的石頭,“再怎麼驗證都不為過”,絕對的至理名言。

吳恩達專訪視頻鏈接:http://t.cn/A6hrKUjP


分享到:


相關文章: