對話AI「最強大腦」,深入「魔法學校」,探訪「絕密實驗室」

對話AI“最強大腦”,深入“魔法學校”,探訪“絕密實驗室”

李飛飛、吳恩達、張潼、馬維英、Pieter Abbeel、Oussama Khatib……;騰訊、阿里、今日頭條、滴滴、科大訊飛、唯品會、斯坦福、UC伯克利、清華……集齊全球頂尖的AI領域領軍人物,踏訪中美兩國科學研究及應用探索前沿的科技公司/大學的AI實驗室,濃縮在飛越太平洋的9天內密集拜訪和交流,這是一種什麼感受?

一句話:大腦的“CPU”、“存儲空間”和“接口”都已不夠用。

9月14日-22日,紅杉中國攜手真格基金,定向邀請三十餘位成員企業的創始人和高管,一起享受了一場智能超感的“北京-硅谷AI雙城記”之旅。這是一次名副其實的大腦體操,對於在各個垂直領域已經取得初戰勝果的創業者們,這更像是一趟尋找AI+商業“終極算法”的解惑之旅。紅杉資本全球執行合夥人沈南鵬和真格基金創始人徐小平也參與了“AI雙城記”硅谷段的部分活動環節,兩位都非常關心AI產業將對教育領域帶來哪些改變。

對話AI“最強大腦”,深入“魔法學校”,探訪“絕密實驗室”

紅杉資本全球執行合夥人沈南鵬:人工智能是信息科技高速發展的重要產物,如果企業家能夠把握好未來5-10年市場研發方向與機會,應當可以獲得前所未有的長足進步,獲得跨越式發展。

對話AI“最強大腦”,深入“魔法學校”,探訪“絕密實驗室”

真格基金創始人徐小平:工業時代是把流水線上的人變成機器,而AI時代則是把機器變成人。AI的廣泛應用,如果能夠極大提高生產力、極大地解放人類,將是非常了不起的事情。

紅杉中國為什麼要做這件事?

從計算時代、網絡時代到AI時代,是紅杉資本與全球技術創新浪潮並進的45年。即使你已熟悉車庫故事、多次到訪沙丘路,但你仍然可能對硅谷——這片長約25英里的狹長谷地有所不知。從早期的通訊技術研發基地,到半導體巨頭的搖籃;從斯坦福的工業園,到風險資本的初始之地;從軟件、互聯網的勃興,到今日AI之風勁吹,硅谷已成為全球技術變革的代名詞,並一次次挺立於創業創新的潮頭。

在計算時代,紅杉資本發掘了蘋果、投資了Oracle、思科……;在網絡時代,它投資了谷歌、雅虎、領英、YouTube、Airbnb、阿里巴巴、京東、滴滴、今日頭條……;現在,當科技世界叩響AI時代的大門,它再一次以超越科技躍進和市場波動的眼光,把握先機,提前佈局。

搭建中美AI前沿對話的平臺,投資早期AI創新創業之新荷。紅杉中國致力於成為頂級高成長企業最早、最重要的投資人,作為創業者背後的創業者,不僅是發掘和以資金資源支持創業新秀,更不一樣的是,給予創業者以成長幫助並陪伴長跑。怎樣為創業者打開世界觀?紅杉中國願意成為AI前沿對話的“搭橋者”、“造雨人”、“連接器”,為創業者提供有針對性的高端對話機會,搭建更廣闊的深度互動交流平臺。

紅杉資本中國基金合夥人周逵帶隊參與了北京段的參訪行程。他說,組織這一場活動,初衷是給紅杉中國投資的AI領域成員企業提供實際有效的幫助,為此主辦方為每一站活動主題都儘量做了細化、聚焦,希望令所有參與人的興趣點更加集中,溝通更有效率。

紅杉中國今年已舉辦了近十場類似的投後服務活動,希望通過這些高質量的交流活動,幫助CEO瞭解到產業核心企業的動態和想法,認識行業最牛的人,做最準確的業務判斷。

在為期9天如此密集的知識大爆炸中, 我們和“AI雙城記”的團員們一起,不僅和“機器之心”同頻共振,還與如此之多的“最強大腦”超距連接,大家都收穫到了什麼?

敲黑板!敲黑板!以下是我們的隨行筆記,要劃重點了:

01

未來競爭的壁壘不再是算法,而是數據擁有的量和質。

從1950年代中期人工智能概念的第一次被提出,及至今天出現的三次人工智能浪潮,各類算法已趨近成型。而從應用層來看,監督學習、遷移學習、非監督學習、強化學習這四類算法所創造的經濟效益是遞減的,就目前而言,AI技術做出的經濟貢獻幾乎都來自第一種:監督學習,也就是讓機器學會從A到B,從輸入到輸出的映射。它依靠結構化數據,確實比非結構化數據創造了更多的經濟效益,並且已經擴展到在線廣告、消費金融、語音交互、機器翻譯等應用場景中。

此次拜訪的多位AI大牛都談到,當算法模型的優劣已不再是關鍵差異(就像所有安卓手機都系出安卓平臺),未來科技公司在AI應用上的較量更多取決於誰擁有更多、更好的數據。以及,怎麼策略性地持續獲取更多數據。

對話AI“最強大腦”,深入“魔法學校”,探訪“絕密實驗室”

如此圖所示,處於金字塔頂端的結構化數據,將是任何一家公司的寶藏。

02

建立數據獲取和訓練的飛輪,對手就很難追趕你。

在此行“AI雙城記”中,創業者向谷歌雲機器學習與人工智能首席科學家李飛飛教授提出了這樣一個問題:大公司毫無疑問擁有巨大的數據獲取優勢,那麼創業公司還有機會嗎?

李飛飛的回答是,大公司在獲取跟自己產品相關的數據方面,這一優勢肯定是無法匹及的。但是,AI應用的場景是多種多樣的,在許多領域還有待開掘。對於初創公司來說,怎麼通過產品來撬動數據獲取才是最重要的。

吳恩達也持同樣觀點。他在白板上一邊畫圖一邊解釋:一家新公司需要特地設計一個循環:先為算法收集足夠的數據,這樣就能推出產品;然後通過這個產品來獲取用戶,而用戶會提供更多的數據……啟動了這一飛輪後,對手就很難追趕你。

以今日頭條為例。今日頭條副總裁、人工智能實驗室負責人馬維英

在分享中亦提到,用戶使用今日頭條越多,會發現它越智能。原因就是,用戶會在使用時不斷餵給機器第二輪大數據:他的偏好、點擊次數、停留時長、負向反饋……從而讓頭條更懂用戶。

就如同互聯網時代已經發生過的故事那樣:大平臺之外,還有諸多垂直細分的數據領域有待挖礦。

03

大數據不追求因果性,更追求相關性。

原因是,只依據統計數據是不足以得出變量之間的因果性的。想要得出因果性,必須從理論上證明兩個變量之間確實有邏輯上的因果性,並且要排除掉第三個隱含變量同時影響這兩個變量的可能性。就像著名的啤酒尿布的故事,它只是說明這兩項商品的購買人群中存在較大概率的重合度。

正如“AI雙城記”團員、唯品會美國研發中心總經理、AI負責人謝楠在分享中提到AI 技術有幾大趨勢:算法“開源化”,計算“雲服務化”,數據“私有化”。因此,就算法、數據和運算能力這三大 AI 要素來說,企業最需要建立起壁壘的是數據。AI的商業應用與學術論文研究有所不同,算法模型的準確率不必是唯一的研發目標。在有限的時間與資源的情況下,也許有商業ROI 更高的研發目標,譬如算法對某業務場景的覆蓋範圍。在特定的應用場景中,80%的算法模型準確率可能就可以做很多過去做不到的事情。如何在不完美準確率的情況下構建一個可行的商用場景是真正挑戰商業AI實踐者的地方,需要對業務及客戶需求有深刻的洞察與理解。

04

傳統科技公司 + 機器學習/神經網絡 ≠ AI公司。

吳恩達分享的主題就是:當AI成為新的電力,它將怎樣改變世界?

AI的崛起正在改變公司間競爭的基礎,那麼,到底什麼才是真正的AI公司?吳恩達首先談到了互聯網時代,究竟如何定義什麼是互聯網公司這件事——商場 + 網站 ≠ 互聯網公司。

“我認識一家大型零售公司的CIO,有一次CEO對他說:我們在網上賣東西,亞馬遜也在網上賣東西,我們是一樣的。”但其實不是的,互聯網公司應該如何定義呢?不是看你有沒有網站,而是看做不做A/B測試、能不能快速迭代、是否由工程師和產品經理來做決策。這才是互聯網公司的精髓。

對話AI“最強大腦”,深入“魔法學校”,探訪“絕密實驗室”

同樣地,現在經常聽人說“AI公司”。在AI時代,我們同樣要知道:傳統科技公司 + 機器學習/神經網絡 ≠ AI公司。吳提出三個衡量維度——

第一,AI公司傾向於策略性地獲取數據。

第二,AI公司通常有統一的數據倉庫。

第三,普遍的自動化以及對人工智能產品經理的新定位(從哪兒獲取數據,如何獲取數據,對數據精準度的要求)。

05

機器學習就是,讓機器學習怎樣學習。

OpenAI研究員、加州大學伯克利分校教授Pieter Abbeel,和OpenAI創始人、YC總裁 Sam Altman在與“AI雙城記”團員的分享中,均提到了他們的最新研究方向——在小數據的前提下發展 AI:讓機器學會“學習”,在自訓練(self-play)中訓練智能體。

Pieter Abbeel更為具體地提到了一個有效的方法——元學習(Meta Learning):給系統很多訓練數據,最後得到的是一個自學習的系統,它會隨著獲得的數據進行更新和快速的學習。

這顛覆了傳統的深度學習模式必定需要大量數據集的情況,意味著其實深度學習也可以在少量數據的情況下,得到不錯的結果。

對話AI“最強大腦”,深入“魔法學校”,探訪“絕密實驗室”

其中一個應用領域就是醫療診斷。對於一些發病率並不那麼高的腫瘤類疾病,無法獲得大量CT數據來訓練機器學會識別腫瘤,就可以使用類似的相關聯數據進行初步訓練。紅杉中國Family成員企業推想科技正是這麼做的。其本質就是,教會神經網絡怎樣從模仿人類行為,到自主學習,猶如嬰兒的成長。

06

AI應用需要從進化力、執行力上升到理解力。

阿里巴巴的技術專家們這樣談到他們對AI應用的理解:

進化力是互聯網公司的看家本領,在網絡時代,可以比傳統企業更快速地迭代、試錯、響應用戶需求,而這正是開發AI應用的一大優勢。

而上升到第二階段就是執行力——你能夠連接服務的數量、被新的交互手段所賦能的執行力,就變得非常重要。也就是怎樣讓AI真正在實際場景中應用起來。

再往前推演,就是理解力。怎樣讓AI自我學習、自我進化,理解環境、人的需求甚至具有自我意識。從計算、算法到數據,都對機器的理解力提出更高的要求。

由此看來,進化力體現在AI在商業上的淺層次應用上;而執行力則會考慮企業是否能夠用AI改造自我基因,轉變為真正的AI公司;在理解力層面,則意味著,AI不僅是機器處理流程的自動化,單純替代人力的機械性勞動,而是具有創新創造的能力。

07

沒有改變的用戶需求仍然是這兩個字:“愛”和“怕”。

在萬紫千紅的移動互聯網時代,從用戶需求的角度來說,幾乎所有服務應用其實都可以歸為這兩類:“愛”,讓用戶享受到便利、折扣、好處、愉悅,於是越來越沉迷其中、愛不釋手,社交、電商、遊戲、文娛、資訊、工具類APP均可以歸為這一類;“怕”,則是讓用戶擁有免於某種恐懼的自由,比如殺毒、隱私、醫療、安全類應用。

在不同時期,解決這兩類需求的新方式,總會帶來新的商業機會。AI時代亦會如是。

滴滴信息安全戰略副總裁、滴滴研究院副院長、Didi Labs負責人弓峰敏博士是硅谷資深的信息安全專家,他談到了AI時代將會面臨的各種可能的技術安全問題,可一窺硬幣的另一面。

在他看來,機器學習本身的確增加了方法和模型的複雜度,和軟件時代一樣,複雜程度本身就是一個可能引起更多漏洞和威脅的弱點。但在今天來說,AI應用引發黑客攻擊的可能性實際上已經不是新鮮的事情,越來複雜的機器學習,已經有對抗的味道在裡面了。這意味著,機器需要做更多自適應的學習,不斷更新,去應對可能出現的安全風險。

從另一方面說,給機器喂的訓練所需的數據時就要考慮到,其應用場景是什麼樣的,對於噪音、干擾、信息汙染的承受程度是怎樣的,如果預見性差,很可能致使這一學習系統被誤導,其學習結果也相對不會理想。

也因此,解決AI未來應用的安全性問題,也會是一個蓬勃興起的新領域。

08

AI時代,人類將真正第一次在最本質意義上覆原成“智人”。

越過奇點後,人類的工作越來越多被機器替代,人還何以為人?關於這個問題,已經讓社會學家、未來學家和經濟學家爭論許久。真格基金聯合創始人王強老師在此次“AI雙城記”的一次分享中,談到了他的理解:

“這一場AI越來越凸顯特色的智能化革命,實際上就是兩個方向。一是不斷釋放人的大腦所承載了千百年的所有功能,這是繼工業革命之後,釋放人腦潛力、釋放人力資源的又一次革命。用越來越用智能化、高效率的方式,來替代人腦不應該承載的任務。

“另一方面,當人腦的部分工作被人工智能所解放,它必定在呼喚著新的東西。就像人作為靈長類高等動物,古生物學家給人類的祖先命名為‘智人’,隨著AI的不斷演進,可能人將真正第一次在最本質意義上覆原成為‘智人’。”

不僅是AI在學習人類,人類也在和機器的互動中學習。就像圍棋高手們也從AlphaGo的很多新穎的走法中獲得啟發。相信在未來世界,這樣的交互會越來越頻繁的發生,對教育來說,AI將帶來一些重要的改變,從教育產品到教育本身都會有,它會讓人類變得更聰明。


分享到:


相關文章: