什么是NPU?

珂珂346

NPU,全称是Neural network Processing Unit,即神经网络处理器。


与它相近的还有好几个XPU,包括:

• CPU全称:Central Processing Unit, 即中央处理器;

• GPU全称:Graphics Processing Unit, 即图像处理器;

• TPU全称:Tensor Processing Unit, 即张量处理器;

• DPU全称:Deep learning Processing Unit, 即深度学习处理器;

• BPU全称:Brain Processing Unit, 即大脑处理器。


AI芯片火热,到底NPU是什么?

它是神经网络处理器,在电路层模拟人类神经元和突触,并且用深度学习指令集直接处理大规模的神经元和突触,一条指令完成一组神经元的处理。相比于CPU中采取的存储与计算相分离的冯诺伊曼结构,NPU通过突触权重实现存储和计算一体化,从而大大提高了运行效率。


NPU的典型代表有国内的寒武纪芯片和IBM的TrueNorth,中星微电子的“星光智能一号”虽说对外号称是NPU,但其实只是DSP,仅支持网络正向运算,无法支持神经网络训练。而且从存储结构上看,该款芯片是基于传统的片上存储,而非神经网络芯片的便携式存储。


前段时间,华为推出麒麟970,号称全球第一枚集成NPU神经网络单元的移动芯片。简而言之,麒麟970有了NPU单元之后,至少在拍照和图像处理上,比之前单纯依赖CPU和GPU要快得多。而对于竞争对手,麒麟970最直接的就是保持高效率,并且更加的省电。


就目前AI芯片之争来看,由于传统CPU、GPU和DSP本质上并非以硬件神经元和突触为基本处理单元,相对于NPU在深度学习方面天生会有一定劣势,在芯片集成度和制造工艺水平相当的情况下,其表现必然逊色于NPU。


打个比方,就像无论是再好的轿车(CPU/GPU)要去拉货,也不可能和真正大马力、高负载的货车(NPU)相比。


来自科技行者对一看到A、B、C、D...XPU就拍脑袋的DAWN老师

科技行者

APU将通用运算x86架构CPU核心和可编程矢量处理引擎相融合,把CPU擅长的精密标量运算与传统上只有GPU才具备的大规模并行矢量运算结合起来。AMD APU设计综合了CPU和GPU的优势,为软件开发者带来前所未有的灵活性,能够任意采用最适合的方式开发新的应用。AMD APU通过一个高性能总线,在单个硅片上把一个可编程x86 CPU和一个GPU的矢量处理架构连为一体,双方都能直接读取高速内存。AMD APU中还包含其他一些系统成分,比如内存控制器、I/O控制器、专用视频解码器、显示输出和总线接口等。AMD APU的魅力在于它们内含由标量和矢量硬件构成的全部处理能力。 所谓APU其实就是“加速处理器”(Accelerated Processing Unit)的英文缩写,是AMD推出的整合了x86/x64 CPU处理核心和GPU处理核心的新型“融聚”(Fusion)处理器,因此我们也能在网上找到“融聚加速处理器”的说法。AMD的APU平台分两种,一种是此前已经能在市面上买到的E系列入门级APU,一种是2011年才在欧美市场正式上市的A系列主流级APU,A系列APU分A4/A6/A8/A10四大系列,就是我们一般讲的“Llano APU处理器”(拉诺APU处理器)。

NPU:为深度学习而生的专业芯片   从技术角度看,深度学习实际上是一类多层大规模人工神经网络。它模仿生物神经网络而构建,由若干人工神经元结点互联而成。神经元之间通过突触两两连接,突触记录了神经元间联系的权值强弱。   每个神经元可抽象为一个激励函数,该函数的输入由与其相连的神经元的输出以及连接神经元的突触共同决定。为了表达特定的知识,使用者通常需要(通过某些特定的算法)调整人工神经网络中突触的取值、网络的拓扑结构等。该过程称为“学习”。在学习之后,人工神经网络可通过习得的知识来解决特定的问题。   由于深度学习的基本操作是神经元和突触的处理,而传统的处理器指令集(包括x86和ARM等)是为了进行通用计算发展起来的,其基本操作为算术操作(加减乘除)和逻辑操作(与或非),往往需要数百甚至上千条指令才能完成一个神经元的处理,深度学习的处理效率不高。因此谷歌甚至需要使用上万个x86 CPU核运行7天来训练一个识别猫脸的深度学习神经网络。因此,传统的处理器(包括x86和ARM芯片等)用于深度学习的处理效率不高,这时就必须另辟蹊径——突破经典的冯·诺伊曼结构。


问答知识

APU全称为AcceleratedProcessingUnit,中文翻译为加速处理器,简单的来说就是把CPU和GPU做到一块硅芯上。

NPU=network process units,翻译为网络处理器,简单点说就是一款专门为深度学习打造的处理器。对于人工智能有很大帮助。好了,简单单点说应该能听懂吧!

谢谢阅读


分享到:


相關文章: