阿里自研NPU將於下半年推出,阿里雲十年再出發,達摩院加持

智能升級後,阿里雲(智能)於 3 月 21 日召開了第一場發佈會,主論壇上,不僅發佈了與 AI 相關的產品,還透露了阿里自研的第一款 NPU 將於今年下半年推出的消息。

2018 年,雙十一之後不久,阿里巴巴集團 CEO 張勇對阿里架構進行了重大調整:阿里雲升級為阿里雲智能,集團首席技術官(CTO)張建鋒兼任阿里雲智能事業群總裁。

3 月 21 日,2019 阿里雲峰會·北京在國家會議中心召開,這是「阿里雲」升級為「阿里雲智能」後的首場開發佈會,也是張建鋒上任後首次公開亮相。

阿里自研NPU將於下半年推出,阿里雲十年再出發,達摩院加持

阿里雲「十年再出發」

會上,張建鋒首先闡述了阿里雲的戰略思考。通過十年,阿里雲的市場份額達到 2-8 名總和。阿里雲組織架構的升級意味著「阿里雲」將變成「雲上的阿里巴巴」,成為「阿里巴巴經濟體的技術底座」和「阿里巴巴所有技術和產品的輸出平臺」。

阿里自研NPU將於下半年推出,阿里雲十年再出發,達摩院加持

阿里雲前 logo(左)、阿里雲現 logo(右)

升級後的「阿里雲」具備以下四個優勢:

1. 技術:達摩院加持的雲。整個阿里巴巴的技術變成阿里雲的一部分,達摩院的先進技術作為雲智能的一個基礎部分。

2. 產品,數據智能的雲。產品一定是基於數據智能的、非常穩定可靠的雲。

3. 商業,最佳實踐的雲。「我們和絕大多數雲服務商不一樣,我們是自帶最佳實踐的雲。我們運營了最大的電子商務平臺,也運營了最大的支付平臺。我們有非常多的技術實踐、產品實踐和商業實踐,阿里雲是一個最佳實踐的雲。」

4. 生態,被集成的雲。「我們會跟合作伙伴建立更緊密的關係,我們的合作伙伴成功了,我們的客戶成功了,才說明阿里雲這個雲智能模式、這個系統、這個產品、這個技術是成功的。今天是阿里雲第一次明確說我們是一個被集成的、生態化的雲。

張建鋒指出,未來一到兩年,阿里巴巴 100% 的業務要跑在公共雲上,自己用的技術會跟阿里雲上的產品保持一致,將來阿里巴巴經濟體內的 To B 服務都會通過阿里雲平臺對外輸出。阿里雲將加大科研投入,持續擴大雲的技術代差;將加大行業戰略性投入,聚焦新零售、新金融、數字政府

他還表示,阿里雲將練好內功「被集成」,把阿里雲變成合作夥伴行業解決方案的一部分。「阿里雲自己不做 SaaS,讓大家來做更好的 SaaS。」

自研的第一款阿里巴巴 NPU 將在下半年正式發佈

「三年前成立了達摩院,我們在持續加大投入。在量子計算、機器智能、嵌入式芯片、數據庫進行了廣泛投入。在芯片端我們在 IoT 端嵌入式芯片發展非常快,去年銷售約 2 億片芯片。」張建鋒在會上透露。

很快,網上便出現了「阿里達摩院去年芯片賣出 2 億片」、「阿里雲張劍鋒:去年阿里雲 IOT 芯片賣出 2 億元」等相關報道。機器之心記者就「阿里 IoT 端嵌入式芯片發現非常快,去年銷售約 2 億片芯片」一事向阿里雲、達摩院多位公關求證後獲悉,這約 2 億片 IoT 端嵌入式芯片是「中天微」的。

去年 4 月 20 日,阿里巴巴宣佈全資收購中天微。當時,中天微是中國大陸唯一基於自主指令架構研發嵌入式 CPU 並實現大規模量產的 CPU 供應商,專注於 32 位嵌入式 CPU IP 研發與規模化應用,面向多媒體、安防、家庭、交通、智慧城市等 IoT 領域,全球累計出貨超過 7 億顆芯片。

宣佈收購中天微的前一天(2018 年 4 月 19 日),阿里宣佈,達摩院在研發一款神經網絡芯片——Ali-NPU, 該芯片將運用於圖像視頻分析、機器學習等 AI 推理計算。

張建鋒透露,自研的第一款阿里巴巴 NPU 將在今年下半年正式發佈,並且,這個芯片的性能「在這個同等芯片裡面都是非常非常領先的,它不是領先一倍兩倍的問題,是領先十倍以上的。」

與 AI 相關的幾款產品

2019 阿里雲峰會·北京主論壇上,共發佈了數十款產品,第一個被推出的是神龍異構超算集群 SCC-GN6

這款產品採用了英特爾定製的 96 核 CPU,採用英偉達 V100、單機 8 卡、可提供 1000T-TFLOPS 性能,支持 1Tb/s 的高性能 CPFS 並行文件系統,50Gbps 的 RDMA 高速網絡、時延小於 2us(微秒)。

阿里自研NPU將於下半年推出,阿里雲十年再出發,達摩院加持

據介紹,SCC-GN6 是首個基於彈性裸金屬服務器神龍 X-Dragon 架構的超算異構產品,能將深度學習訓練時間縮短至分鐘級,可滿足無人駕駛、智能推薦、機器翻譯等人工智能場景的高性能計算需求。

在媒體群訪環節,針對「SCC-GN6 能將深度學習訓練時間縮短至分鐘級」這個點,阿里雲智能創新產品線負責人張獻濤、阿里雲異構計算研發負責人龍欣、阿里雲高級產品專家王志坤做了如下拓展:

「在 AI 的深度學習的場景中,特別是訓練場景下,單機的計算力已經沒有辦法滿足在絕大部分場景下訓練訴求,需要天甚至上月的時間才能達到比較好的模型的收斂。在很多場景下,大家希望把多臺機器去互聯起來做集群性運算,去加速模型的訓練。但是這種背景下,傳統虛擬化網絡,其實是沒有辦法滿足在多機訓練場景下的訴求。

在超算場景下,一直有它的一些解決方案,類似於 IB 或者 RDMA 這樣的網絡協議,這種協議天然地和數據中心是不兼容的,因為它有安全上的一些問題。

神龍的出現解決了一個什麼樣的問題?不僅解決了計算的物理機交互,還解決了網絡上和虛擬網絡不兼容的這樣一個物理網絡的交付,通過 RDMA 把我們多臺訓練的機器進行互聯。一是,高帶寬的互聯,同時保證了在多機互聯的情況下,我們的線性伸縮比會非常好,這是我們要用一個物理的網絡去把它接起來,把它稱做超級計算集群很重要的點。這項技術最重要,其實就是我們的神龍技術。」

「單機情況下,我們現在交付的是單節點 1000 TFLOPS 的性能,根據客戶需求,可以選擇 8 個節點或者 16 個節點,這個數字就可以做一個簡單的倍加,就得到一個算力。」他們還透露,「最多我們現在單集群可以支持 512 個節點,就是 4000 個 GPU 的計算力,近似於線性的形式做。人工智能的客戶,比如在一些大模型訓練上面,效率提升是非常高的。」

阿里雲表示,以 ImageNet 競賽的 128 萬張圖片的數據集為例,用普通計算資源訓練 ResNet50 模型,如要達到 75% 的精度需要數天甚至一週的時間,而使用該神龍異構超算集群產品,模型訓練可以縮短到幾分鐘,大大提升 AI 算法研發效率,加速業務創新。

此外,阿里雲還發布了國內首個公共雲上的輕量級 GPU 異構計算產品——vGN5i,打破傳統直通模式侷限,提供比單顆物理 GPU 更細粒度的服務,從而讓用戶以更低成本、更高彈性開展業務。

會上還推出了機器學習和深度學習平臺 PAI v3.0

阿里自研NPU將於下半年推出,阿里雲十年再出發,達摩院加持

據悉,PAI 3.0 推出了全新的算法模型市場,涵蓋電商、社交、廣告、金融等多個行業,數十種場景的算法模型;新增流式算法組件、圖神經網絡、增強學習組件等平臺工具。

據「AI 前線」報道,作為機器學習平臺的內核,PAI 的智能計算引擎也進行了全面升級,通過編譯技術優化通用計算引擎,訓練性能提升 400%;深度學習優化分佈式引擎,單任務支持上千 worker 併發訓練,支持 5k+ 超大規模異構計算集群;發佈大規模圖神經網絡,緩存機制效率提升 40%,算子速度提升 12 倍,系統端建圖時間從數小時降至 5 分鐘。

「大家可能知道,人工智能今天還不能做到去通用解決任何問題,但是它可以很好地解決在某一個專業領域、專業點的問題。我們也是有這樣一個算法平臺開放出來,讓豐富的算法放到這個平臺當中,同時提供和過去相比高達 4 倍的計算效率。」阿里雲智能產品管理部經理馬勁在現場介紹道。

通州區引入城市大腦,防控環境汙染

阿里自研NPU將於下半年推出,阿里雲十年再出發,達摩院加持

主論壇上,北京市通州區宣佈與阿里雲在生態環境綜合治理方面達成合作。

據瞭解,通州副中心規劃面積 155 平方公里。預計在「十二五」期間,新城將初具規模。

由於當前處於施工建設期,如何保障城市環境不受影響成為當地最為關注的問題之一,通州區決定引入城市大腦技術。全區接入了 1437 路城市環境監測視頻、1100 個大氣監測及揚塵預警傳感設備;打通融合城管委、住建局、環保局等多部門的信息平臺;平均每 10 分鐘就可以完成一次全區域視頻掃描。

通州區副區長蘇國斌介紹,「城市大腦·生態環境」平臺在通州上崗以來,實現了通州核心區的環境汙染事件從人工發現到實時自動感知,從多部門多頭處置到一網通辦的本質提升。

蘇國斌副區長還表示,未來水源監測、建築施工、垃圾清理、排汙降噪等等也將引入城市大腦相關技術。


分享到:


相關文章: