03.14 想不到,亞馬遜的人工智能發展史竟如此坎坷

近日,《連線》雜誌撰文揭秘了亞馬遜的人工智能之路。

在21世紀第二個十年的初期,跟谷歌、微軟等技術巨頭比,亞馬遜已然在AI上顯出落後之勢,業務部門和技術人員互不交流,被稱為“工程師海洋上的 AI 孤島”,學術大牛都無意加盟。

也是亞馬遜,後來首發智能音箱Echo,引得各大企業爭相跟進;AWS雲業務2017全年營收超170億美元,相當於第2名到第15名的營收總和……

創始人Bezos立下了獨特的“六頁紙”文化:任何計劃只能在六頁紙之內,這些“六頁紙”在亞馬遜內部帶來旋風般的深刻變革。現在,AI特性正在深入這家零售巨頭的肌骨,從文化到業務,而內部的機器學習學術會議幾乎受到全司上下所有人的關注。

看完此文,讀者或能對亞馬遜的AI逆襲之路瞭解一二。未來圖靈編譯如下:

想不到,亞馬遜的人工智能發展史竟如此坎坷

原文題目:

INSIDE AMAZON'S ARTIFICIAL INTELLIGENCE FLYWHEEL

發佈於:WIRED

攝影:IAN C. BATES

ADAM GLANZMAN

編譯:全須全尾

2014年初,Srikanth Thirumalai見了亞馬遜CEO Jeff Bezos。Thirumalai是一名計算機科學家,他2005年離開IBM擔任亞馬遜推薦團隊的負責人,他此次提出了一項全新的計劃,將最新的人工智能研究成果應用於自己的部門。

Thirumalai只帶了六頁紙見Bezos,很早以前Bezos規定,給他的產品和服務計劃必須在六頁以內,其中還要包括一份描述最終成果的模擬新聞稿。現在,Bezos正靠著副手們將公司轉型成一座AI發電站。

早前,亞馬遜的商品推薦功能就集成了AI技術,如發貨調度和倉庫機器人。但近年來,AI領域正在掀起一場革命:機器學習越來越高效,尤其是在深度學習進步的推動下,它已經為計算機視覺、語音識別、自然語言處理等方面帶來了飛速的發展。

在21世紀第二個十年的早期,亞馬遜並沒有大力發展這些技術,但後來意識到該項需求的迫切性。AI是這個時代最重要的競爭領域:谷歌、Facebook、蘋果和微軟都押注重兵於上,而亞馬遜已經落後。“當時我們問每個團隊的負責人,‘你要如何利用這些技術,將它們整合進自己的業務?’”亞馬遜設備和服務副總裁David Limp回憶說。

Thirumalai 記住了這事,他找到Bezos說了他關於機器學習的想法。他當時很清楚,機器學習最佳的應用場景是與亞馬遜核心業務不相關的圖像識別和語音識別,而亞馬遜的核心業務已發展20多年,利用機器學習技術重新開發現有系統風險太大。

“還沒有人將深度學習用在商品推薦上取得重大成果,我們自己要有信心。”他說。雖然他並沒有準備好,但Bezos想要更多,所以他直接拿出了更大膽的方案, 利用深度學習技術重新定義商品推薦的方式。

這可能要求他團隊尚不具備的能力,現階段還沒人寫出的工具和算法。Bezos喜歡這個賭注,Thirumalai重寫新聞稿後就去開工了。

想不到,亞馬遜的人工智能發展史竟如此坎坷

Srikanth Thirumalai, 亞馬遜搜索業務副總裁

Thirumalai並不是唯一帶六頁紙去見Bezos的人。過去幾年,不少其他部門負責人都找過 Bezos,他們負責完全不同的產品,服務並不重合的客戶,但想法都跟Thirumalai類似:用先進的機器學習技術改造亞馬遜的某個部分。還有一些主管提出要重塑現有業務,比如機器人業務和數據中心 AWS。另一部分則要開發全新的業務,例如基於語音的家電,後來成為Echo智能音箱。

這次會面的影響遠超單個項目。Thirumalai表示,之前亞馬遜的 AI 人才是相互分散的。“我們會進行交流,但不會互相分享太多進展,因為經驗不太容易直接套用。”他們是廣闊工程師海洋上的 AI 孤島。不過,用機器學習改造公司的努力改變了一切。

儘管提交計劃書的都是特定團隊,但 AI 的加入讓各個團隊開始打破界限,展開跨項目合作,團隊間開始分享解決方案。AI孤島開始相互連接。

隨著亞馬遜 AI 野心的增長,越來越複雜的挑戰也成為了吸引頂尖人才的磁石,特別是對那些想看到成果顯出成效來的人來說。

這改變了亞馬遜對純學術研究的厭惡,這家公司的文化要求所有創新必須以服務客戶為中心。

亞馬遜喜歡使用“飛輪”一詞來描述業務的不同部分如何運轉,並形成統一的永動機。現在,這臺永動機上多了AI這個重要的飛輪,它能通過創新為其他團隊提供動力,而別的團隊則可借新技術開發新產品和服務,從而影響其他團隊甚至整個公司,形成一個良性循環。此外,還能為其它公司提供付費服務,盈利的同時收集更多數據反哺技術。

從深度學習的門外漢到令人生畏的巨頭,亞馬遜花了無數個“六頁紙”。轉型的成果在公司內隨處可見,比如基於機器學習基礎架構的推薦系統。在推薦你讀什麼書、買什麼東西和看什麼電影時,亞馬遜變得更智能了。

今年,Thirumalai成了亞馬遜搜索的主管,準備把深度學習融入搜索服務的各方面。

“如果你七八年前問我,亞馬遜在 AI 領域有多大影響,我肯定會說‘什麼都算不上’,”華盛頓大學頂級計算機科學教授Pedro Domingos說,“但隨後它們便來勢洶洶,正在成為一股強大勢力。”

或許已經是了。

Alexa效應

亞馬遜進軍人工智能的旗艦產品是智能音箱Echo,以及背後的Alexa語音平臺。這些項目同樣來自“六頁紙”。

2011 年,它以“運營計劃 1號”為名提交給Bezos。參與者之一是2004年就供職於亞馬遜的Al Lindsay。他當時被要求轉而負責Prime技術團隊,從事全新的項目。他還記得那時構想的新產品:“一款大腦完全在雲端的低成本計算機,靠語音完成交互。”

當時,打造這樣的系統聽起來就像將Bezos最愛的《星際迷航》中的話癆計算機變成現實。亞馬遜沒有這樣的AI技術。更糟糕的是,有能力開發此類系統的人才很稀缺,願意在亞馬遜工作的就更少。谷歌和Facebook搶走了大量AI頂尖人才,“我們是弱者。”Lindsay說。他現在已晉升為副總裁。

想不到,亞馬遜的人工智能發展史竟如此坎坷

Al Lindsay,亞馬遜Alexa引擎業務副總裁

“亞馬遜給人印象不太好。在外界看來,它們對研究型人才不友好。”華盛頓大學教授Domingos說。

亞馬遜完全專注於客戶,其零碎的文化氛圍不符合學術界,而且它們的待遇也比不過競爭對手。“在谷歌你被照顧得無微不至,” Domingos說,“在亞馬遜你可能得在小隔間裡自己組裝電腦。”

更可怕的是,外界一直認為亞馬遜將創新工作視為企業機密。

2014 年,機器學習大神 Yann LeCun 受邀在內部會議上向亞馬遜的科學家做演講。當時 LeCun 已經拿到Facebook的工作邀約,但他還是去了。他先是在一個可容納600 人的禮堂發表演講,隨後被領進一間會議室,不同的小組挨個進來向他提問,但他的反問卻沒得到任何回應。LeCun最終選擇了Facebook,一部分原因是Facebook同意開源 AI 團隊的大部分工作。

因為缺乏人才,亞馬遜只能憑藉強大的財力到處收購。

“在 Alexa 的開發初期,我們收購了很多公司。”Limp說道。2011 年 9 月,亞馬遜收購了語音轉文本技術公司Yap。2012年,又將英國劍橋的Evi收入麾下,它們的軟件能像 Siri 一樣響應各種語音要求。2013 年 1 月,亞馬遜收購波蘭的Ivona,一家語音轉文本技術公司,該技術是Echo 開口說話的關鍵。

然而,亞馬遜的保密文化還是阻礙了頂尖人才加盟的腳步。業內大牛Alex Smola曾是潛在候選人,他曾供職於雅虎和谷歌。“他稱得上是深度學習教父之一。”亞馬遜 AWS 業務深度學習和 AI 主管Matt Wood說。(谷歌學術搜索上列出了9萬多篇引用斯莫拉成果的論文。)但亞馬遜高管不願向候選人透露他們未來的工作內容。最終Smola拒絕了亞馬遜,選擇去帶領卡耐基梅隆大學的一所實驗室。

“即使在 Echo 發佈前,我們依然不受待見。”Lindsay 說,“他們會說,‘我為什麼要在亞馬遜工作,我對賣給別人東西不感興趣。’”

不過亞馬遜確實有一點充滿吸引力。由於是從想象中的最終產品去反推,所以藍圖中包括許多尚未發明出來的功能,這些棘手的問題對雄心勃勃的科學家極具吸引力。Echo 的語音特性需要一定水平的 AI 技術支持,比如“喚醒詞”(嘿,Alexa!)、識別並轉譯命令、提供正確答案等,而這些技術當時都不存在。

即使亞馬遜沒有給出任何細節,這個項目也吸引了Rohit Prasad。他是一名備受尊敬的語音識別科學家,來自波士頓的技術承包商雷神BBN(亞馬遜因此讓他在老家組建一支團隊)。他認為,缺乏 AI 專家是亞馬遜的一大特點,而不是 bug。“這裡是一塊帶開墾的新天地。”他說,“谷歌和微軟做語音項目已經很多年。在亞馬遜我們可能得從頭做起並解決很多難題。”2013 年剛加入亞馬遜,他就被派去做Alexa項目。“就硬件而言,該設備已經存在,但在語音識別上還處在早期階段。”

Echo項目中最棘手的部分在於遠場語音識別。為了解決這個問題,亞馬遜被迫涉足新領域,並推動了機器學習整體的發展。遠場語音識別是指在一定距離遠處識別語音,要克服各種外界噪音和其它聽覺干擾。另一大挑戰是,設備不能浪費時間去思考你究竟說的是什麼,它必須把語音即時發送至雲端並迅速反饋答案,整個過程就像對話一樣。這還需要大量用戶和Echo的聊天數據,當時亞馬遜並不清楚,該從何處獲得這些數據。

想不到,亞馬遜的人工智能發展史竟如此坎坷

Limp介紹,遠場技術此前已經被實現,但當時是用在三叉戟潛艇的鼻錐上,研發耗資達到10億美元。亞馬遜不造核潛艇,只是想把這項技術整合進一個廚房設備,它必須足夠便宜。“當時我的團隊裡有 90% 的人都認為這根本做不到。”Prasad 說,“我們其實有個技術諮詢委員會,我們沒有告訴他們具體要做什麼。不過他們說,不管做什麼,別碰遠場識別。

Prasad豐富的經驗給他帶來了信心。然而,亞馬遜並不具備工業級系統將機器學習應用於產品開發。“我們有少數科學家在研究深度學習,但我們缺乏基礎設施將這些技術應用於生產。”他說。好消息是,亞馬遜有所有模塊:無與倫比的雲計算服務、安裝了大量GPU能運行機器學習算法的數據中心,以及熟悉操縱數據的工程師。

他的團隊用這些模塊搭建了平臺,不止對於Echo項目,這個平臺本身就是一筆寶貴的資產。“當我們搞定了 Echo 這款遠場語音識別設備,就發現了更大的機會——我們可以將 Alexa 做成語音服務。”Alexa 高級首席科學家Spyros Matsoukas 說。

他們擴展 Alexa 的一種直接方式是允許第三方開發者打造自己的語音技術小程序,就是後來所說的“技能”,這些“技能”可在 Echo 上運行。不過,這僅僅是個開始。

想不到,亞馬遜的人工智能發展史竟如此坎坷

Spyros Matsoukas, 亞馬遜高級首席科學家

在Alexa脫離Echo的限制後,亞馬遜的AI文化開始凝聚。公司內部團隊開始意識到,Alexa也可以為他們的項目提供語音服務。“儘管單線程自主模式已經很成熟,但各種數據和技術開始凝聚在一起。”Prasad說。

隨後,第一批亞馬遜產品開始集成Alexa。只要開口,你就能在 Alexa 設備上訪問 Amazon 音樂、Prime 視頻和獲得個性化推薦等。接著,這項技術開始推廣至其他業務。“一旦我們擁有了基礎語音能力,我們就能把它融入到非 Alexa產品中,比如 Fire TV、語音購物、Dash Wand,及最終的 AWS。”Lindsay 說。

亞馬遜內部的AI孤島開始逐漸靠近。

轉型的另一大關鍵在於,一旦數百萬用戶(亞馬遜拒絕透露具體數字)開始使用Echo和其他Alexa設備,亞馬遜就能獲得海量數據。這或許是史上最大的語音驅動設備的交互集合。

這些數據成為了潛在招聘的有力籌碼,突然間,亞馬遜就成了機器學習專家們夢寐以求的僱主。去年加入亞馬遜的Alexa機器學習副總裁Ravi Jain表示:“Alexa對我的最大吸引力之一在於,只要你賣出一臺設備,就掌握了獲得信息反饋的來源。這些數據對於優化一切是如此重要,尤其是對底層平臺來說。”

因此,隨著越來越多用戶使用Alexa,亞馬遜獲得的信息不僅能改進系統性能,還能推進其機器學習工具和平臺的發展,併成為機器學習科學家的吸鐵石。

“飛輪”終於轉起來了。

更智能的雲

2014 年起,亞馬遜開始面向 Prime 會員銷售 Echo。同年,Swami Sivasubramanian 開始對機器學習產生興趣。彼時他負責 AWS 數據庫和分析業務,去印度旅行時因為時差和小女兒哭鬧,深夜還在電腦前使用谷歌 Tensorflow 和 Caffé 等工具,這些是Facebook 和學界都非常青睞的機器學習框架。

他發現,將這些工具與亞馬遜的雲服務結合可以創造巨大的價值。他認為,通過更容易地在雲端運行機器學習算法,亞馬遜能深挖出更多潛在的需求。“我們每個月都為數百萬開發者提供服務,”他說,“他們中大多數人都不是麻省理工的教授,而是沒有機器學習背景的普通開發者。”

想不到,亞馬遜的人工智能發展史竟如此坎坷

Swami Sivasubramanian, 亞馬遜AI業務副總裁

下一次見Bezos時,他帶著“史詩級的”六頁紙計劃書。從某種意義上來說,那六頁紙就是為AWS添加機器學習服務的藍圖。不過,Sivasubramanian看得更遠:AWS將會成為整個行業機器學習活動的中心。

確實,為成千上萬的亞馬遜雲服務用戶提供機器學習是大勢所趨。從某種意義上來說,“在首次提出 AWS 的商業計劃時,我們的任務是充分利用只有財力雄厚的公司才能掌握的技術,並儘可能地去推廣,”AWS 機器學習經理 Wood 解釋,“在計算、存儲、數據分析和數據庫方面我們已經取得成功,現在機器學習要走相同的道路。”更有利的是,AWS團隊可以借鑑公司內部其他團隊的經驗。

Wood介紹,2015 年,AWS的亞馬遜機器學習服務推出,讓類似C-Span的客戶可以建立私有的頭像目錄,Zillow用它來估算房價,Pinterest則用它來做可視化搜索。此外,多家自動駕駛創業公司也利用AWS機器學習,通過數百萬公里的上路測試來優化產品。

2016年,AWS發佈新的機器學習服務,更直接地利用Alexa的創新,加入文本轉語音組件Polly 的和自然語言處理引擎Lex。

這些產品幫助AWS的客戶,包括Pinterest、Netflix和多家小型創業公司打造屬於自己的迷你Alexa。還有涉及可視化技術的第三方服務Rekognition,利用了此前Prime Photos取得的成果,嘗試在谷歌、Facebook和蘋果的照片產品中植入同樣的深度學習功能。

這些機器學習服務不但是亞馬遜的金礦,還是其 AI 飛輪運轉的關鍵。各類機構,包括NASA和橄欖球大聯盟,都是亞馬遜機器學習服務的大客戶。如果企業在AWS平臺內開發關鍵的機器學習工具,那麼轉移至亞馬遜雲計算競爭對手平臺的可能性就會大幅下降。

以Infor為例,規模數十億美元的企業應用領域巨頭,最近發佈了一款名為 Coleman的應用,該應用通過會話式界面幫助客戶實現各種流程的自動化,分析性能並與數據交互。這款聊天機器人是使用AWS的Lex技術生成的。“反正亞馬遜已經做好了,所以我們幹嘛還要花時間重來一遍呢?我們瞭解自己的客戶,我們可以讓這款應用適合他們。”Infor 高級副總裁Massimo Capoccia解釋說。

AWS在雲計算領域的主導地位給了它相較於其它對手的戰略優勢,尤其是谷歌。

谷歌此前曾希望利用機器學習技術的領先優勢,在雲計算市場趕超AWS。是的,谷歌服務器或許向客戶提供了超快速、針對機器學習優化的芯片。

但使用AWS的企業能更方便地與其它也使用AWS的企業互動以及銷售產品。

“就像Willie Sutton說的,他之所以去搶銀行是因為銀行裡有錢,”DigitalGlobe CTO Walter Scott 在解釋自家公司為何選擇亞馬遜當合作夥伴時打了個形象的比方,“我們使用AWS的機器學習技術是因為我們的客戶也在這個平臺上。

去年11月,在AWS re:Invent大會上,亞馬遜發佈了更全面的機器學習工具SageMaker,一個複雜但相當易用的平臺。它的開發者之一正是Alex Smola,那位五年前拒絕了亞馬遜的機器學習大神。當他決定重回工業界時,就立志要打造一款強大的工具,讓普通的軟件開發人員也用上這項技術。所以,他加入了他認為能帶來最大影響的平臺。“亞馬遜非常強,你不會放棄這樣的機會,”他解釋道,“你可以寫論文,但如果做不出真正的產品,就不會有人用你漂亮的算法。”

當Smola 告訴 Sivasubramanian,打造一個惠及數百萬人的機器學習工具比發表一篇論文更重要時,他得到了一個意外之喜。“你的論文一樣可以發表!”Sivasubramanian說。是的,在允許科學家發表論文方面,亞馬遜正變得更開放。

“這不僅有助於吸引頂尖人才,還讓外界瞭解了亞馬遜到底在研究什麼。”Spyros Matsoukas 說,正是他參與設立了亞馬遜開放方針。

目前還無法判斷,AWS的數百萬用戶是否會用SageMaker將機器學習應用於產品,這樣做的開發者往往都會投入大筆資金。

此外,這個平臺足夠成熟,就連包括 Alexa在內的亞馬遜內部團隊也準備轉向 SageMaker,與外部公司使用相同的工具集。它們相信,這可以節約他們大量的時間,把更多精力用於更高級的算法研究。

即使最終只有部分 AWS 用戶選擇SageMaker,但亞馬遜已經掌握了關於系統性能的大量數據(當然,客戶自己保管的機密數據除外),從而促使更優的算法、更好的平臺和更多的客戶。飛輪正在全速運轉。

AI 無處不在

隨著機器學習逐漸成熟,亞馬遜的 AI 屬性滲透到公司各個領域,這讓 Bezos 和副手們非常滿意。

雖然亞馬遜沒有設立 AI 中心,但有一個部門專門負責機器學習的推廣和技術支持,而另一些部門則嘗試應用研究成果,推動新科技進入亞馬遜的項目。目前,亞馬遜的核心機器學習小組由 Ralf Herbrich 領導,他曾供職於微軟和 Facebook ,2012 年加入亞馬遜。“

公司內部建立個自己的社區非常重要。”他表示。(這個項目同樣也是六頁紙孵化)。

他的部分職責是培育亞馬遜快速發展的機器學習文化。因為亞馬遜堅持以客戶為中心的政策,即總是嘗試解決問題而不是單純地做研究,高管們承認,他們在招聘中總是傾向於那些有興趣開發產品,而不是追求科技突破的人才。Facebook的LeCun 從另一個角度解釋:“即使不領導學術先鋒,也能做得很好。”

不過,在培訓員工適應AI方面,亞馬遜正在學習 Facebook 和谷歌的經驗。它開設了許多有關機器學習的內部課程,並組織內部專家開展研討會。從 2013 年起,每年春天都會在總部舉辦一次內部的機器學習學術會議,可以說是內部的NIPS大會。

“剛開始只有幾百人參會,現在已經有幾千人了。”Herbrich 說道。“西雅圖總部最大的會議室也容不下那麼多人同時開會,因此除了主會場外,我們還向園區中的其他6個會議室直播。”一位亞馬遜高管表示,如果人數繼續增加,亞馬遜機器學習大會了乾脆直接叫亞馬遜就行了。

Herbrich 的團隊還在繼續推動機器學習技術滲透公司。例如,物流部門希望更好地預測,如何根據顧客的訂單在8種尺寸的包裝盒中做選擇,它們找到 Herbrich 尋求幫助。“物流部門不需要自己的科研團隊,但需要方便使用的算法。”Herbrich 說道。

David Limp在另一個例子裡講述了亞馬遜是如何預測用戶有多大可能購買新產品,“我在消費電子領域30 年了,有25年都依靠人類判斷、電子表格、魔術貼和碰運氣,”他說,“但加入機器學習後,錯誤率顯著下降。”

有時,Herbrich團隊也得用上尖端技術來解決問題。以亞馬遜生鮮服務為例,雖然經營已有10年,但仍需要更好的方式來評估生鮮果蔬的質量。人工檢測速度太慢,且無法保持標準的一致性。他的柏林團隊開發了搭載傳感器的硬件和新算法,彌補了現有系統不能觸摸和嗅探食物味道的缺陷。“三年後,我們就能拿出原形產品,能更可靠地判斷生鮮食品的質量。”Herbrich 說。

當然,這樣的技術進步可以滲透入整個亞馬遜生態系統。以最新的Amazon Go 無人超市為例,亞馬遜Go技術副總裁Dilip Kumar表示:“作為AWS的客戶,我們從規模效應中受益。但AWS也是受益者。”

Amazon Go 有自己獨特的流媒體數據系統,能從數百個追蹤顧客購物活動的攝像頭傳送數據。他團隊的創新影響了名為Kinesis的AWS服務,該服務讓用戶能從多個設備將流媒體視頻傳到AWS雲端,AWS對其進行處理、分析,優化機器學習算法。

未使用機器學習平臺的亞馬遜服務,也可以主動參與到這一過程中。亞馬遜的Prime Air無人機快遞服務還處於原型階段,由於不能靠雲端連接必須搭建自己的AI系統。不過,Prime Air也從 AI 飛輪上獲益良多,向公司其他部門汲取營養,摸清該用什麼工具。

在我們看來這就是餐廳菜單,每個人都在分享自己的拿手菜。”Prime Air副總裁Gur Kimchi說道。他也相信,自己的團隊也會有貢獻出拿手菜。“在Prime Air,我們學到的經驗和解決的問題未來肯定會引起其他亞馬遜團隊的興趣。”

這個預言已經開始應驗。“如果有人在公司看到一張圖片,比如 Prime Air 或 Amazon Go,他們可能就會學到什麼或打造一個新算法,跟公司其他人討論,”亞馬遜機器人部門首席科學家 Beth Marcus說,“然後,我團隊中有些人就可以借鑑,比如弄清楚一張商品的圖片在物流中心裡是怎麼移動的。”

想不到,亞馬遜的人工智能發展史竟如此坎坷

Beth Marcus,亞馬遜機器人高級首席技術官

那麼,一個以產品為中心的公司能打敗那些坐擁大量深度學習大牛的競爭者嗎?

亞馬遜正在為此創造實例。“儘管它們還在追趕,但發佈的產品令人印象深刻。”艾倫人工智能研究所CEO Oren Etzioni說,“它們是家世界級的公司,發佈了世界級的 AI 產品。”

飛輪還在旋轉著,還有許多我們不知道的“六頁紙”藏在暗處,未來可能會有更多的數據、更多的用戶、更好的平臺和更多的人才。

如果你在搭載Alexa的平臺問:Alexa,亞馬遜的AI 表現如何?

答案可能是 Bezos的放聲大笑。


分享到:


相關文章: