淘金還是技術需要?AI催生晶片「軍備競賽」

目前在AI芯片市場上還沒有x86,人們看到了淘金熱,這是毫無疑問的。

多年來,半導體行業似乎已經達到了一種穩定的平衡:英特爾在服務器領域幾乎擊敗了所有的RISC處理器,同時AMD也逐漸陷入低迷,使得英特爾的x86成為了主導者。而在GPU領域起步較晚的英偉達,在上世紀90年代就已經淘汰了大多數競爭對手。而突然之間,就只剩ATI(現已被AMD收購)仍然在市場上存在。它只佔英偉達之前市場份額的一半。

在較新的移動領域,似乎也是類似的壟斷故事:ARM統治著市場,英特爾曾用Atom處理器嘗試與之競爭,但在遭遇多次失敗後,在2015年最終選擇了放棄。就這樣,一切都與以往不同了,AMD重新成為了x86的競爭對手;針對大數據等專門任務的現場可編程門陣列(FPGA)的出現創造了一個新的利基市場。但實際上,隨著人工智能(AI)和機器學習(ML)的出現,芯片世界的巨大轉變也隨之而來。隨著這些新興技術的出現,大量的新處理器已經到來。並且,它們都來自於不太可能的來源。

英特爾在2016年收購了初創公司Nervana Systems,進入了AI芯片市場,隨後它又收購了另一家公司Movidius,目的是開發圖像處理AI;

微軟正在為其HoloLens VR/AR頭戴設備開發人工智能芯片,而且有可能在其它設備中使用;

谷歌針對神經網絡開發了一種特殊的人工智能芯片——“張量處理單元(TPU)”,該處理器可用於谷歌雲平臺上的人工智能應用;

亞馬遜正在為其Alexa家庭助理開發人工智能芯片;

蘋果正在研發一款名為“神經引擎(Neural Engine)”的人工智能處理器,該處理器將為Siri和FaceID提供動力;

ARM公司最近推出了兩款新處理器——ARM機器學習(ML)處理器和ARM物體檢測(OD)處理器,這兩者都專注於圖像識別;

即使是特斯拉這樣的非傳統科技公司也想要進入這個領域,其首席執行官埃隆馬斯克(Elon Musk)去年承認,前AMD和蘋果芯片工程師Jim Keller將在特斯拉負責硬件製造,這些還沒有將初創公司計算在內。《紐約時報》指出,據不完全統計,專注於人工智能的芯片創業公司(不是單純的軟件公司或芯片公司)已經達到了45家,並且仍在繼續增長。

為什麼在多年的芯片製造停滯之後,硬件突然出現了爆炸式的增長?畢竟,人們已經達成共識,英偉達的GPU對人工智能來講非常優秀,而且已經被廣泛使用,為什麼我們現在需要更多的芯片,並且是更多不同的芯片?

答案有些複雜,就像人工智能本身一樣。

投資導向和技術發展的影響

Intersect360 Research公司CEO Addison Snell說,儘管x86目前仍是計算領域的主流芯片架構,但對於像人工智能這樣高度專業化的任務來說,它太普通了,該公司的主要業務是HPC(高性能計算)和人工智能。“人們希望AI成為一個通用的服務器平臺,因此,它必須在所有事情上都做得很好”他說,“在其他芯片的基礎上,各個公司正在開發專門針對某一應用的產品,而操作系統和基礎設施的任務仍然留給x86來做。”

處理人工智能實際任務的過程與標準計算或GPU處理是非常不同的,因此需要專門針對人工智能的芯片,x86 CPU可以完成人工智能任務,而實際只需要3個步驟的任務,它在執行時需要經過12個步驟,在某些情況下,GPU也可能把任務變得過於繁雜。

一般而言,科學計算是以確定性的方式完成的,比如你想知道2加3等於5,並計算到所有小數部分——x86和GPU可以做得很好。但是人工智能的本質是,通過長期的觀察得出2.5加3.5等於6,而不需要真正去計算,如今人工智能的關鍵是從數據中發現的模式,而不是確定性的計算。

從更簡單的角度來說,人工智能和機器學習的定義是,它們利用過去的經驗並加以改進。比如,著名的AlphaGo就通過模擬大量的圍棋比賽改進技術。另一個我們熟悉的例子就是Facebook的面部識別AI,經過多年的訓練,它可以精確地標記你的照片(Facebook最近幾年進行了三次重大的面部識別收購:2012年收購Face.com、2016年收購Masquerade,2016收購Faciometrics)。

一旦用人工智能開展學習,就不需要重新學習了。這是機器學習的標誌(人工智能更大定義的一個子集)。從本質上講,機器學習(ML)是一種使用算法來解析數據、從中學習、然後根據這些數據做出判斷或預測的實踐。這是一種模式識別的機制——機器學習軟件記住2加3等於5,所以整個人工智能系統可以使用這些信息。

再比如說,自動駕駛汽車的AI,並不是通過確定的事物來判斷周圍物體的活動路徑,它通過以往的經驗,表示曾經有一輛車,按照這樣的方式行駛。因此,系統能夠預測到特定類型的動態。

這種預測問題解決的結果是,人工智能計算可以通過單精度計算來完成。因此,雖然CPU和GPU都可以很好地完成,但實際上它們對任務來說是多餘的。一個單精度芯片足以完成這項工作,並且能在更小、更低的功耗下完成。

毫無疑問,對於芯片來說,功耗和範圍是一個大問題——也許對人工智能來說尤其如此,因為一個尺寸並不能適用於這一領域的所有情況。在人工智能中包含機器學習,機器學習中又包含深度學習,所有這些都可以通過不同的設置被部署到不同的任務中。“並非所有的人工智能芯片都是一樣的,”英特爾旗下Movidius公司的營銷總監Gary Brown說。Movidius針對深度學習過程製作了一個自定義芯片,因為深度學習涉及的步驟在CPU上受到高度限制。

“每個芯片可以在不同的時間處理不同的智能問題,我們的芯片是視覺智能,算法通過由攝像頭輸入的內容學習。這是我們的重點。”Gary Brown表示,甚至有必要對網絡邊緣和數據中心等其加以區分——而在這個領域,公司只是意識到他們需要在不同的地方使用不同的芯片。

“處於邊緣的芯片無法與數據中心的芯片競爭,”他說,“像Xeon這樣的數據中心芯片必須具備高性能的性能,它與智能手機中的AI是不同的。在那裡你必須將功耗降到1瓦以下,所以問題是,“哪裡(的本地處理器)還不夠好,所以需要一個輔助芯片?”

畢竟,如果想在智能手機或AR頭戴設備上使用人工智能,電源是一個挑戰,英偉達的Volta處理器在人工智能處理領域佔很重要的地位,但其功耗可達300瓦。所以不可能被用於手機中。

Sean Stetson是自動駕駛工業車輛製造商Seegrid的技術進步總監,他也認為人工智能和機器學習到目前為止一直受到普通處理器的不好的影響。他表示:“為了讓算法發揮作用,無論是機器學習、圖像處理還是圖形處理,它們都有非常具體的工作流。”如果沒有專門針對這些模式設置的計算核心,那麼就會進行大量的無用數據加載和傳輸。當你在最低效的時候移動數據時,就會產生很多信號和瞬態的能量。而處理器的效率是以每條指令使用的能量來衡量的。”

當然,更加專業化以及更高的能效並不是這些新的人工智能芯片存在的全部原因。IBM公司研究員兼IBM Power systems開發副總裁Brad McCredie表示,人們都爭先恐後地加入這一行列的更明顯的原因是:回報將會非常豐厚。他說:“IT行業幾十年來第一次看到了增長,我們看到了指數增長的拐點。”預期會有新的資金進入這一行業,而這一切都圍繞著人工智能。這就是導致大量風投湧入這一領域的原因,人們看到了淘金潮,這是毫無疑問的”。

一個全新的生態系統

專注於人工智能的芯片並不是憑空設計的,伴隨它們的是處理人工智能和機器學習高度並行性的新方法。如果你構建了一個人工智能協處理器,但是使用過時的標準PC技術甚至是過時的服務器,那麼這就像把法拉利引擎放在大眾甲殼蟲中一樣。

英特爾公司首席技術官兼Nervana聯合創始人Amir Khosrowshahi表示。“當人們談論人工智能和AI芯片的時候,構建人工智能解決方案需要大量的非人工智能技術,它會涉及到CPU、內存、SSD和互連等,要讓所有這些都發揮作用,是非常關鍵的。”

例如,當IBM為任務關鍵系統設計其Power9處理器時,它使用英偉達的高速NVLink來支持核心互連、PCI Express Generation 4,以及它自己的接口OpenCAPI(相干加速器處理器接口),OpenCAPI是一種新的連接類型,它為內存、加速器、網絡、存儲和其他芯片提供高帶寬、低延遲連接。

McCredie說,x86的生態系統沒有跟上。他指出,PCI Express Gen 3在市場上已經有7年沒有重大更新(第一次只是最近才出現),而IBM是最早採用這一技術的公司之一,x86服務器仍在使用PCIe Gen 3,它的帶寬只有4 Gen的一半。他說:“計算能力的爆炸式增長將需要更大的計算能力,我們需要處理器來做它們能夠完成的所有事情,然後在這個基礎上再多做一些,該行業終於開始關注內存帶寬和輸入/輸出帶寬的性能,這些東西正成為系統性能的一階約束”。

McCredie繼續說道:“我認為加速器將會增長,將來會有更多的工作負載,因此需要更多的加速。我們甚至會回過頭來加速常見的工作負載,例如數據庫和ERP(企業資源規劃)。我認為,我們正看到行業中一個堅實的趨勢開始,現在我們更加註重加速,更加註重市場適應性。

但是硬件本身並不能在機器學習中學習,軟件才是主要的部分。在所有這些新芯片的熱潮中,幾乎沒有提到與硬件協同工作的軟件。“幸運的是,這是因為這些軟件在很大程度上已經存在,它正在等待芯片趕上來,”金融分析和人工智能開發商OTAS Technologies的首席執行官Tom Doris說。

“我認為,如果你看一看以前的歷史,就會發現一切都是硬件驅動的,算法並沒有太大的改變,技術進步都是由硬件的進步推動的,這對我來說有點意外,因為我已經離開這個領域好幾年了,自90年代末以來,軟件和算法方面並沒有發生太大的變化,基本上都是計算能力的改變”他說。

彭博首席技術官辦公室的數據科學家David Rosenberg也認為,目前軟件的狀況良好。他表示:“在某些領域,軟件還有很長的路要走,這與分佈式神經計算的技術有關,但對於我們已經知道解決方法的問題,軟件已經得到了很好的改進。現在的問題是硬件怎樣能夠足夠快地、高效地執行軟件。”

事實上,目前的情況是,硬件和軟件正在並行開發,目的是支持這一新的人工智能芯片及其用例。前斯坦福大學教授Ian Buck說,在英偉達,軟件和硬件團隊的規模大致相同。Buck教授開發了CUDA編程語言(CUDA允許開發者編寫應用程序並使用Nvidia的GPU進行並行處理,而不是CPU)。Buck在英偉達主要負責的是人工智能領域。

他說:“我們正在針對系統軟件、程序庫、人工智能框架和編譯器開發新的架構,所有這些都是為了利用每天出現的新方法和神經網絡,在人工智能領域取得成功的唯一途徑,不僅僅是構建偉大的芯片,而且要緊密地整合到軟件的堆棧中,以實現和優化每天都在發明的新網絡。”

因此,對於Buck來說,人工智能代表一種新的計算方式的原因之一是,他相信它確實構成了硬件和軟件之間的一種新型的關係,我們不需要考慮向後的兼容性,我們正在重新設計那些擅長處理此類任務的處理器,並與軟件一起運行。

這場芯片競賽的未來在哪?

雖然現在人工智能芯片領域有很多潛在的開發商,但圍繞這些計劃的最大問題之一是,有多少會進入市場,有多少能夠接觸到供應商,又有多少會被淘汰。畢竟如今大多數的人工智能芯片仍然只是幻影。

當涉及到許多非CPU製造商設計的人工智能芯片時,比如谷歌、Facebook和微軟等,似乎這些公司正在為自己的使用定製芯片,而且很可能永遠不會把它們推向市場。這些實體擁有數十億美元的收入,完全有能力投入到定製芯片的研發中,而無需立即得到投資回報。因此,用戶可能會依賴谷歌的TPU作為谷歌雲服務的一部分,但谷歌不會直接出售TPU服務。這也是Facebook和微軟期望的模式。

而其他芯片則肯定會上市,英偉達最近宣佈了三款新型芯片:為智能機器人設計的Jetson Xavier系統芯片、為自主出租車的深度學習而設計的Drive Pegasus芯片以及針對半自動駕駛汽車的Drive Xavier。為所有這些提供動力的是Isaac Sim虛擬仿真環境,開發者可以用它來訓練機器人,並用Jetson Xavier進行測試。

與此同時,英特爾承諾,其收購Nervana公司後推出的的首款機器學習處理器將在2019年以Spring Crest的代號進入市場。目前,該公司還擁有一款名為“Lake Crest”的人工智能芯片,利用這一芯片,開發者們可以使用人工智能來解決自己的問題。英特爾表示,Spring Crest最終將提供三到四倍於Lake Crest的性能。

所有這些都能存活嗎?“我認為,在未來,我們將看到人工智能的進化過程,”Movidius公司的Gary Brown說。“如果你想要在數據中心使用AI,就需要一個數據中心芯片,如果你想要一個頭戴設備,你也可以找到一個對應的芯片,這將是AI芯片的發展趨勢,我們可能會看到不同的芯片有不同的優勢,這些可能會被集成到CPU中,我們可能還會看到有多個功能的芯片。”

如果所有的感覺都像是似曾相識,也許現實就是這樣,人工智能芯片的發展在某種程度上與過去芯片的演變過程相匹配——從高度專業化和眾多競爭對手開始,但最終一些產品獲得了動力,少數幾個市場領導者則具備多個功能。30年前,80386是最重要的桌面芯片,如果你需要在Lotus 1-2-3中做大量計算,你可以為你的IBM PC-AT購買數學協微處理器80387。接著是80486,英特爾成功地將數學處理器集成到CPU中。然後,CPU慢慢地獲得了諸如安全擴展、內存控制器之類的東西,之後是GUP。

就像其他技術一樣,目前新興的人工智能芯片產業領域眾多競爭對手的局面不會維持太久。例如,OTAS的Doris指出,許多不上市的內部使用芯片會成為高級技術人員的主要項目,而更換政權通常意味著採用行業標準。Intersect360的Snell指出,今天的人工智能芯片初創公司也將減少——正如他所說,“現在有太多的競爭對手需要整合。”事實上,許多初創公司只是希望開闢出一個利基市場,吸引大公司來收購它們。

IBM的McCredie說:“我同意,這將會是一個艱難的過程,但是範圍必須縮小,有一天,這可能意味著這個新的芯片領域看起來與老的芯片領域並無兩樣——就像之前的x86、英偉達GPU、ARM等。

但就目前而言,這種人工智能芯片競賽剛剛起步,許多新進入者都打算繼續向前。


分享到:


相關文章: