20個適合深度學習的AI晶片!速度最快的是TPU?

機器學習,特別是深度學習技術正在推動人工智能(AI)的發展。 一開始,深度學習主要是軟件遊戲。 從2016年開始,學術界和工業界對AI / ML / DL的更高效硬件加速的需求得到了認可。 今年,我們看到越來越多的參與者,包括世界頂級半導體公司以及一些初創公司,甚至是科技巨頭谷歌,也紛紛加入競爭。

20個適合深度學習的AI芯片!速度最快的是TPU?

英特爾——Nervana

英特爾收購了Nervana Systems,除了Nervana Engine ASIC之外,他還開發了GPU /軟件方法。 可比性能尚不清楚。 英特爾還計劃通過Knights Crest項目整合到Phi平臺。 NextPlatforms建議,對於某些寬度的OP,28nm的2017目標可能是55 TOPS / s。 英特爾計劃於12月推出NervanaCon,所以也許我們會看到第一批成果。

英特爾 Nervana 神經網絡處理器(NNP)重新定義AI。

Mobileye EyeQ

Movidius

Myriad X是第一款採用神經計算引擎的VPU,這是一種用於運行設備上深度神經網絡應用的專用硬件加速器。

FPGA

英特爾FPGA OpenCL和解決方案。

Loihi

英特爾的Loihi測試芯片是首款自學芯片。

高通——Nvidia

Qualcomm人工智能引擎為Snapdragon移動平臺提供AI功能。Nvidia的最新GPU可以執行15個TFlops的SP或120個TFlops,其新的Tensor核心架構是FP16乘法和FP32累積或增加以適應ML。

20個適合深度學習的AI芯片!速度最快的是TPU?

SoC

在邊緣,Nvidia提供NVIDIA DRIVE?PX,用於自動駕駛的AI車載計算機和JETSON TX1 / TX2 MODULE,“用於自主一切的嵌入式平臺”。

NVDLA

Nvidia在GTC2017上獲得了“XAVIER DLA NOW OPEN SOURCE”。 我們還沒有看到Early Access版本。

NVIDIA深度學習加速器(NVDLA)是一種免費開放式架構,旨在促進設計深度學習推理加速器的標準方法。 憑藉其模塊化架構,NVDLA具有可擴展性,高度可配置性,旨在簡化集成和可移植性。 硬件支持各種物聯網設備。

三星

三星熱烈推出“新款Exynos 9810帶有2.9GHz定製CPU的高級功能,業界首款6CA LTE調制解調器和深度學習處理功能”。

AMD

即將發佈的AMD Radeon Instinct MI25承諾提供12.3 TFlops SP或24.6 TFlops FP16。 如果你的計算適合Nvidia的Tensors,那麼AMD就無法參與競爭。 Nvidia的帶寬為900GB / s,而AMD為484 GB / s。

AMD九年來首次將非常好的X86服務器處理器推向市場,並且它還具有匹配的GPU,為其OEM和ODM合作伙伴提供了一個可靠的替代方案,可將HPC和AI工作負載轉換為Intel Xeon和Nvidia的組合 特斯拉這些天主導著混合計算。

20個適合深度學習的AI芯片!速度最快的是TPU?

XILINX

Xilinx提供“從邊緣到雲的機器學習推理解決方案”,並且自然地聲稱他們的FPGA最適合INT8和他們的白皮書。

雖然FPGA的每瓦特性能令人印象深刻,但供應商的大型芯片長期以來一直在為更大的芯片提供驚人的高芯片價格。 在價格和功能之間找到平衡是FPGA面臨的主要挑戰。

IBM

TrueNorth是與DARPA SyNAPSE計劃一起開發的IBM的Neuromorphic CMOS ASIC。它是一個芯片設計的多核處理器網絡,具有4096個核心,每個核心模擬256個可編程硅“神經元”,總共只有超過一百萬個神經元。

NXP——ADAS芯片

S32V234:用於前置和環繞視覺相機,機器學習和傳感器融合應用的視覺處理器。

聯發科

聯發科技為跨平臺消費者設備推出其邊緣人工智能平臺和人工智能技術。通過硬件和軟件,人工智能處理單元(APU;人工智能處理單元)和NeuroPilot SDK的組合,聯發科技將把AI帶入其廣泛的技術組合 - 這一組合每年為智能手機提供15億個消費產品, 智能家居,汽車等。

海思

麒麟智能手機

HiSilicon Kirin 970處理器通過專用的神經網絡處理單元進行了宣傳。

移動相機SoC

根據Hi3559A V100ESultra-HD移動相機SoC的簡要數據表,它具有:雙核CNN @ 700 MHz神經網絡加速引擎。

瑞芯微

瑞芯微推出首款人工智能處理器RK3399Pro - NPU性能高達2.4TOP

谷歌

谷歌的原始TPU在GPU上取得了很大的領先優勢,並幫助DeepMind的AlphaGo在Go錦標賽中擊敗了Lee Sedol。

20個適合深度學習的AI芯片!速度最快的是TPU?

谷歌在2017年I/O大會上已經明確喊出“AI First”(人工智能優先)的口號,在今年的IO大會上,谷歌推出了第三代TPU。根據官方介紹,TPU3.0的計算能力最高可達100PFlops,是TPU2.0的8倍多。它是谷歌自主研發的針對深度學習加速的專用人工智能芯片。TPU是專為谷歌深度學習框架TensorFlow設計的人工智能芯片。著名的AlphaGo使用的就是TPU2.0芯片。

此外,谷歌還發布了Edge TPU,特定用途 ASIC 芯片,專為在設備上運行 TensorFlow Lite ML 模型而設計。針對Edge TPU的新設備是:AIY Edge TPU Dev 開發板和 AIY Edge TPU 加速器,二者皆採用 Google 的 Edge TPU 芯片。

20個適合深度學習的AI芯片!速度最快的是TPU?

亞馬遜

亞馬遜可能正在為Alexa開發AI芯片。

該信息今天上午有一份報告稱亞馬遜正致力於為Echo構建AI芯片,這將使Alexa能夠更快地解析信息並獲得這些答案。

AWS

Amazon EC2 F1是具有現場可編程門陣列(FPGA)的計算實例,您可以對其進行編程以為您的應用創建自定義硬件加速。

微軟

有線電視在MSFT上使用FPGA也做了一個很好的故事,“微軟在可重編程計算機芯片上迎合它的未來”。如果想要了解微軟對雲中FPGA的願景,那麼基於Microsoft FPGA的可配置雲內部也是一個很好的參考。

蘋果

蘋果推出新款處理器,為新款iPhone 8和iPhone X - A11 Bionic提供動力。 A11還包括Apple稱為“神經引擎”的專用神經網絡硬件,每秒可執行高達6000億次操作。Core ML是Apple目前對機器學習應用的熱衷。

Facebook

Facebook正在組建一個團隊來設計自己的芯片。Facebook公司正在建立一個團隊來設計自己的芯片,這增加了科技公司提供自我供應的趨勢,並降低了對英特爾和高通公司等芯片製造商的依賴,據業內人士和熟悉此事的人士表示。


分享到:


相關文章: