淺析AI芯片性能亂象,AI芯片=DSP+DSP+……+DSP?

所謂人工智能,根據1956年達特茅斯會議的定義,就是“讓機器行為看起來就像是人所表現出來的智能行為一樣”。不過雖然這句話理解起來很簡單,想真正實現卻非常困難。在人工智能的發展過程中,逐漸劃分出兩個發展階段:強人工智能和弱人工智能。

強人工智能是屬於人類級別的人工智能,機器擁有思維和意識,可以實現自我推理和自主決策。弱人工智能則是指機器擅長於處理單一方面的問題,但並沒有真正的思維和意識。由於弱人工智能發展程度並沒有達到模擬人腦思維的程度,所以弱人工智能仍然屬於“工具”的範疇,與傳統的“產品”在本質上並無區別。

淺析AI芯片性能亂象,AI芯片=DSP+DSP+……+DSP?

目前整個業界所研發的全部人工智能產品,甚至是Alpha Go,都僅限於弱人工智能這個階段,許多打著各種幌子的“偽”人工智能也一併充斥在這片紅海中。與此同時,作為人工智能的硬件基礎,AI芯片也在短短的一年之內“滿山鮮花開滿坡”。

向上看,有谷歌TPU和NVIDIA GPU這樣的巨無霸,不是下棋就是開汽車,一個蘿蔔一個坑的佔著幾個攤子。向下看,有各大移動SoC廠商的AI芯片,輸了體積不輸陣,也都是規格明碼標價,性能頭頭是道。

然而,“你不覺得AI芯片是個偽概念嗎?”這樣的疑問卻從一位AI芯片從業者口中說出,“從半導體圈子的人來看,AI芯片概念比較怪,定義也非常寬泛。你做機器學習也是AI芯片,做深度學習也是AI芯片,做某幾種特定算法也是AI芯片。”

的確,對於目前這些AI芯片的功能,各家確實都少有明確的描述,基本上都是一句“AI任務”帶過。

淺析AI芯片性能亂象,AI芯片=DSP+DSP+……+DSP?

不明所以的「AI任務」

這“AI任務”到底是個啥?一番細看之下,原來大多數所謂的“AI任務”指的都是視頻、音頻、圖像處理這些方面。這些都是非常傳統的需求,而且也都有專用處理器來應對,音視頻處理有DSP,圖像處理有ISP。

其實無論是視頻音頻還是圖像處理,這些工作都可以在CPU上完成。之所以專門設計DSP和ISP芯片,是因為它們處理這些任務的效率比CPU高出許多。同樣的,如果全新的AI芯片能比傳統DSP和ISP更加高效,那在處理器中加入AI芯片的同時,我們理應看到DSP和ISP從現有芯片組成中消失才對。

在高通官網的驍龍845介紹中,“可提供更豐富的拍攝、語音、XR 和遊戲體驗”的人工智能平臺,依然被高通明確的歸結在Hexagon DSP下,說明現在各家AI芯片所宣傳的這些功能,並未達到真正意義上AI所在的層次,只是對既有需求的擴展而已。

淺析AI芯片性能亂象,AI芯片=DSP+DSP+……+DSP?

人工智能平臺依然被高通明確的歸結在Hexagon DSP下

坊間有過這樣的傳聞,說有一家公司出了款AI芯片,但實際上只是幾顆傳統DSP(數字信號處理器)芯片的組合,再加上一些軟件層面的修改。

對於這條傳言的由來,我們無據可考,雖然高通現如今將Hexagon DSP作為支撐AI的基石,看起來這種說法好像也有幾分道理,但也不能排除這只是“同行是冤家”所引起的非議。而且圖靈老爺子於1950年提出的圖靈測試,針對的是一個AI系統的整體表現,對於AI硬件的測試,目前市面上尚沒有專業的通用測試標準。

不過在前不久,魯大師在其評測軟件中添加了一套AI性能評測,同時支持海思麒麟的HiAI和高通的SNPE框架,也支持在CPU上運行TensorFlow推斷庫。這套AI測試包含了三種不同的神經網絡模型:VGG16,InceptionV3以及ResNet34,輸入的測試數據是ImageNet數據庫中的100張圖片。

淺析AI芯片性能亂象,AI芯片=DSP+DSP+……+DSP?

魯大師AI性能評測

國外知名媒體Anandtech選擇了使用麒麟960的華為Mate 9、使用麒麟970的華為Mate 10 Pro、使用驍龍835的谷歌Pixel 2 XL和LG V30四款手機,分別測試了ARM CPU、Hexagon DSP和NPU的AI性能,測試結果以性能(fps)和效能(mJ/inference)雙重指標來衡量。

我們首先注意到的一個結果是,NPU和CPU在處理AI運算時的性能有著幾十倍的巨大差異。這些算法在CPU上執行的速度最高不過2fps,同時還會消耗掉大量的電能。無論是驍龍835還是麒麟960的CPU平均功耗都已經超過可持續工作的上限。

作為對比,驍龍835的Hexagon DSP相比CPU約有8~10倍的性能提升,而麒麟970的NPU性能又可達到Hexagon DSP的1.5倍~4倍。不過在能耗比方面,雖然華為NPU相比CPU有著巨大到已經不在一個次元的優勢,但我們也很驚訝的看到,驍龍835的Hexagon DSP的綜合效率落後麒麟970的NPU僅6%左右。

淺析AI芯片性能亂象,AI芯片=DSP+DSP+……+DSP?

Anandtech的測試結果

雖然魯大師不管在PC和手機端,都素有“娛樂大師”這樣一個不怎麼好聽的綽號,單單這三個測試項也無法代表麒麟970的NPU的全部性能,但我想魯大師應該無意在目前的AI測試中對誰有所偏重,軟件中所選擇的這三個測試項目應該是比較常見且通用的。畢竟現階段的安卓陣營裡,宣稱有AI加速能力的也就只有驍龍835/845和華為麒麟970而已。

我們知道,AI芯片在美國要經過嚴苛的NSF認證:“要讓DNN(深度神經網絡算法)計算功耗比提升1000倍的芯片”,這也許是高通依然將人工智能平臺歸結在Hexagon DSP下的原因之一吧。

淺析AI芯片性能亂象,AI芯片=DSP+DSP+……+DSP?

瑞芯微自曝的RK3399Pro成績頗為驚人

我在之前的文章裡也曾經說過,目前絕大部分AI芯片,都是廠商對AI大潮反應過激的產物,好像如果名字裡沒有AI,都不好意思在江湖上報號。那個坊間傳聞,雖然並沒有任何實錘,但也許真的是目前AI芯片領域現狀的映射。

想要在量子計算時代到來前,在傳統半導體工業中實現真正的強人工智能,除了要進行大刀闊斧的芯片架構研發,還要引進新的電子元器件——憶阻。其實這東西說新也不新,憶阻是除電阻、電容、電感之外的第四大電路元件,早在 1971 年,任教於美國的柏克萊大學的華裔科學家蔡少棠便提出了憶阻器的概念。

現行的計算機體系中最常見的是“馮•諾依曼架構”,即計算機由存儲器、控制器、運算器、輸入輸出四部分組成,這和人腦的結構有著巨大的差別。人腦的存儲、控制和運算三位一體,而憶阻可以讓半導體電路具有和人腦一樣的“三位一體”特性。

淺析AI芯片性能亂象,AI芯片=DSP+DSP+……+DSP?

四大電路元件,憶阻在右下角

可以說,如果沒有憶阻,僅靠傳統的三大電路元件,任何模仿人腦模式的人工智能,在運算效率上都只能是事倍功半,除非人類能夠研發出一條與人腦完全不同的智能模式。

雖然AI芯片不可能僅靠一個憶阻便一朝功成,但更不是像如今這樣在名字裡貼上AI兩個字母就可以齊活兒的。那些以AI為名的芯片廠家,只有極少數廠家在有目的有方向的進行研發,其餘大多都是浮躁。

圖靈曾預測,人工智能的思考能力在2000年時可達到這項測試的標準。這項測試至今依舊被視為衡量人工智能發展水平的準繩,但目前卻仍沒有出現在哪家公司的roadmap中,我們達到圖靈測試的標準還遙遙無期。

路還很長,不知道這樣混沌的發展狀況,還要持續多長時間?


分享到:


相關文章: