大咖AI聊|商湯科技錢晨:人工智慧需要真正落到實處

火熱的AI時代,初入人工智能領域做研究,如何規劃職業方向?計算機視覺技術發展之快,怎樣才能做出有意思且有意義的事情?面對人工智能層出不窮的新挑戰,我們應該如何面對?本期「大咖AI聊」我們邀請到了商湯科技研究總監 錢晨。作為校招大咖的「收官」訪談,錢晨分享了在CV領域做研究最真實感受,對於未來的AI領航員,他提到「基礎性研究工作對人工智能進一步認知尤為重要」。

大咖AI聊|商湯科技錢晨:人工智能需要真正落到實處

錢晨

  • 目前負責研究方向包含人臉關鍵點,人體姿態,手勢識別,視線追蹤等相關研究領域。

  • IEEE國際期刊TCSVT期刊審稿人。本科就讀於清華大學交叉信息研究院軟件科學實驗班(姚班),碩士畢業於香港中文大學。

  • 曾任谷歌山景城總部軟件工程師,期間組織華人googler技術論壇。碩士於亞洲微軟研究院實習期間,以第一作者於國際頂級會議(CVPR)發表全自由度實時手勢追蹤系統論文,並被大會邀請演講(錄取率5%),該技術被用於微軟hololens手勢識別系統研究中。

今年的CVPR 大會您和團隊取得了卓越的成績,spotlight環節以4分鐘口述報告分享了計算機視覺領域的貢獻和創新之處,多年在人臉關鍵點、姿態識別、手勢識別、視線追蹤等相關領域做研究,您最大的感受是什麼?

對於整個計算機視覺領域而言,這些年最大的感觸就是技術發展快,新的問題和新的挑戰層出不窮,讓我們有很多有意思且有意義的事情可以做。比如ImageNet圖片分類做了很多年,但是最近注意力機制才開始被成功應用。我們今年CVPR的文章在圖片分類上成功地應用了注意力機制,將基礎模型進一步完善,提高了參數效率。

大咖AI聊|商湯科技錢晨:人工智能需要真正落到實處

在這個過程中,總會面臨各種新挑戰帶來的新問題。當你發現這些問題用之前的很多方法解決不了的時候,這就迫使我們不斷地積累想法,不斷地探索。所以我們見證了從想法的產生到技術落地化,再到為人所用這樣一個過程。

計算機視覺是一個很大的領域,其中包括很多方面。每一個方面都會有從荒蕪到爆發的過程,在不斷地解決問題中,大家就會發現一些嶄新的機會和思路。所以,對於我們能夠參與其中的人,做學術研究有挑戰性,這也是讓我們為之興奮的原因。

大咖AI聊|商湯科技錢晨:人工智能需要真正落到實處

另外,計算機視覺領域的特點是開放和共享。大家的工作是公開的,每個人都願意把研究成果分享出來,這是在任何其他研究領域都很少見的。因為我們知道,有了大家的的通力合作,才能在一起解決問題。現在我們也明顯地感受到論文發佈的速度非常快,不像之前只有在學術頂會上才知道最前沿的技術,很多人如果有了最新的技術成果,他們會及時分享出來。當別人看到這些開放的成果後,就可以沿著這個結果繼續推進,所以計算機視覺領域的發展速度快,迭代週期短,這是我感受最深的兩點。

您負責的研究領域,平時工作中是否遇到技術難點或者壁壘?我們公司在這方面是怎麼做的?

其實商湯最擅長的有兩個部分。一是我們解決了學術領域的「通常狀況」到產品化過程中「所有狀況」的難題。大家都知道,學術研究領域解決的是一個通常情況的問題,但如果我們在某項技術產品化的情況下,就要用大量的數據和訓練去驗證在所有情況下都能工作才行。

比如,我們想要做的人臉關鍵點定位,通常68個點的人臉關鍵點定位在±45度之間做得比較準確就可以,這在學術上就有了解法。但如果我們要用到產品裡去,客戶就會提出問題:極端的表情,極端的姿態,極端的光照,是不是都可以定位得很好?

大咖AI聊|商湯科技錢晨:人工智能需要真正落到實處

我們最近提出的240點人臉關鍵點技術就是與實際的美妝場景結合,在各種極端的表情下都能做得非常準確,這才算技術真正落到產品裡去。

二是將學術上探索的結果推到極致,這也是我們擅長的。在學術上我們大概有十萬,幾十萬的訓練集和一些測試集去探索這些方法,但實際場景中我們有更多的資源,可以把數據的大小推到百萬甚至千萬。一旦數據的量級到達一定程度,會有很多獨特的問題出現,比如說如何分佈式訓練,如何清理數據等等。

三是從算法成本的角度,成本越低應用範圍越廣。比如計算開銷、時間成本、內存消耗等。在產品化過程中,降低成本的消耗也是要解決實際的問題,而這些問題的解決,也有很多需要研究的地方。

總結起來,大量的數據、降低算法成本的開銷、與場景和業務緊密結合,這三個部分我認為是技術產品化的難點。我們公司在這三方面積累很深,如果說僅僅拿一些開源技術去做產品,這三個壁壘都會出現,也正因為這樣,商湯堅持做原創技術。

對於想進入人工智能領域或CV研究的畢業生,您有什麼關於職業方向的建議?如何才能將人工智能落到實處?

人工智能這個領域最近比較火熱,那麼各種機會就呈現出來。當一個領域特別受追捧的時候,我們更應該腳踏實地一些。對於人工智能的研究,大家可能主要關心兩個方面。

首先,在研究方向上,我建議大家可以做些關於人工智能的底層研究,人工智能現在比較缺少 fundamental 的工作。

在這麼火熱的時期,很多人不清楚為什麼,只是借人工智能的名義做一些初淺的嘗試,並沒有深入的研究。如果研究者把大量的精力投入在這方面,整個圈子就會浮躁,所以我希望更多的人投入些基礎性的、底層的研究,對人工智能產生進一步認知,還是很有必要的。


大咖AI聊|商湯科技錢晨:人工智能需要真正落到實處

圖源自網絡

另外,現在很多人說人工智能是拿著錘子找釘子,像商湯也在這些方面有很多探索,把人工智能引進來,無論從節省成本還是帶來新的功能方面,真正對整個行業和領域產生有利的改變。

商湯在安防、增強現實、手機以及互聯網視頻等領域做的事情,是我們通過大量的工作,驗證了在這些領域人工智能確實可以帶來新東西和有利改變,也在實際的生活中潛移默化地影響大家。所以年輕人應該在人工智能如此火熱的階段,踏實下來,把人工智能真正落到實處。

在可預見的未來中,您覺得有什麼高科技產品或者技術將會被淘汰?有哪些新產品或技術會將其替代?

近期,我個人認為不會有哪類高科技的產品被淘汰,但是會有改變,就是技術的升級。很多人想做一些顛覆性的產品,但事實上,很多時候證明一步到位還是比較困難的。即便是顛覆性的工作,比如AR、無人車等等,大家也在慢慢地從技術層面一步一個腳印兒去做。

大咖AI聊|商湯科技錢晨:人工智能需要真正落到實處

圖源自網絡

之前大家覺得AR帶上了眼鏡就是一步到位了,但很多技術達不到這個程度,慢慢地就藉助於手機平臺,一點點增強AR的能力,利用手機讓大家感受到了增強現實的技術。進行產品升級,增強現有的功能。

還有就是無人車,之前谷歌研發的全自動駕駛汽車,想用無人車代替公交汽車和人為駕駛,如果一步到位的話,產生的困難比較大。大家現在也是從無人駕駛每個階段上,一步步進行技術更新。

如果有同學想加入您的團隊,哪類人才是你們需要的?從個人來說,您更看重的是哪些能力?

學習能力。因為計算機視覺技術發展非常快,所以接受知識的速度以及學習能力非常重要。

創新能力。在工作中遇到某些新問題,當前人沒有一個較為完備的解決方法,這就需要當你無論好壞,都要提出自己的看法,有一個解決問題的方法去嘗試。

交流和溝通的能力。現在人工智能做落地,你需要把自己的研究成果、新技術講給大眾聽,所以無論你跟其他部門還是客戶,工作中會有大量的交流和討論,如果有高效的溝通和表達能力也是加分項。

在人才選拔上,我覺得客觀來說,無論是誰不會具備所有能力,這樣每個人的優勢就顯得格外重要。如果在簡歷和麵試中能夠突出優勢,之前的學習經歷或實習經歷能夠證明你的長處,有接受新事物、不斷學習的潛質,我們會優先考慮這樣的人選。

我們最近一直在籌劃AI領航員的計劃,旨在從應屆畢業生中選拔優秀的人才,我司對於AI領航員有哪些具體的要求?

AI領航員應該在AI的某些子領域有獨到的想法,對整個領域有一定的把控能力,這些很難按照某些特定的標準來衡量。比如對待某個問題上,經過長期的積累,形成自己的想法和計劃,對整個領域有一定的基礎理解能力,這是我比較看好的。我覺得這不是通過哪些標準來篩選人才,除一些定向的標準外,我覺得還是從面試當中,深度瞭解、溝通,才會有合理的判斷。


分享到:


相關文章: