"感知不強"又"徒增功耗"?為何今年5G手機也這麼重視AI

曉查 發自 凹非寺
量子位 報道 | 公眾號 QbitAI

今年你準備換手機了嗎?

小米10、一加8、OPPO Find X2、vivo NEX 3s、iQOO 3、realme X50 Pro……上半年一大波手機發布潮依然在繼續,簡直讓選擇困難症不知所措。

什麼才是你換機的最大動力?可能絕大部分人都會說是5G。

的確,5G讓手機的網絡速度更快,但還有一項指標性能的重要性一點不亞於5G。

從去年開始,各大手機評測開始給手機加入了一個新的評測維度——AI跑分。這個過去從來不受關注的參數,如今成為了不少人心中衡量手機性能必不可少的一項指標。

國內知名的性能測試軟件魯大師甚至還專門提供了AI跑分測試軟件AImark

在魯大師最新公佈的AImark跑分中,高通驍龍865以11萬的高分拿下芯片榜第一,不僅比高通上一代芯片提升一倍,也把蘋果的A13仿生芯片遠遠甩在身後。

高通為何要提升手機芯片看似“感知不強”的AI能力呢?

AI跑分又是否僅是一個“徒增功耗”、“方向錯了”的噱頭?

然而你可能不知道的是,至少在拍照這件事情上,如果沒有AI,旗艦手機今後可能真的無法玩轉了。有人也許不禁要問,AI技術和手機日常使用有什麼關係?

手機AI有什麼用

要解答這個問題,我們先來看看魯大師到底給驍龍865測試了什麼。

這次高通驍龍865奪冠的魯大師AImark 2.0測試總共包括了4項成績。這4項分別代表手機在4種不同神經網絡下的運算能力。

先看前兩項基本AI能力,ResNet-34Inception V3

ResNet是當前應用最廣的卷積神經網絡(CNN)的特徵提取網絡,多數處理圖片的AI模型或多或少的使用了ResNet。在神經網絡越來越複雜的今天,ResNet可以做到在更深的神經網絡上不降低性能。

Inception V3是Google開發的一個開源神經網絡模型,進一步提高了圖像分類效果。用了Inception之後,神經網絡結構的寬度和深度都可擴大,能夠帶來2-3倍的性能提升。

如果說前兩項是考察芯片的基礎AI能力,那麼後兩項就是靠具體單科能力了。

MobilenetSSD是一種目標檢測算法,具有速度快,精度高的特點。所謂目標檢測就是讓AI找出圖像中的物體,指出它們的位置和種類。SSD表示一次拍攝即可檢測圖像中的多個對象。

這種模型目前在手機AI中有廣泛的應用。比如手機拍照中的場景識別,目標能夠知道你拍攝的是美食還是植物。

當識別出照片主體的內容後,拍照算法就會對畫面做出特定的優化,拍出更美的照片。

在實測中,高通驍龍865能讓整個識別的過程不到1秒就能完成,真正提升了拍照場景識別的易用性。

Deeplab V3+是目前在手機設備上效果最好的

圖像語義分割模型之一。

語義分割比目標檢測更進一步,目標檢測僅能識別出物體的大致位置,而語義分割要求對識別出的物體做到像素級的劃分,精確畫出邊緣。

更通俗地說,這一項跑分測試的是手機AI“摳圖”能力。

由於受到體積所限,手機攝像頭單靠光學成像不能做到和單反相機一樣的背景虛化能力,這時候就需要語義分割模型的幫助。

不僅如此,今年各家手機主打超強變焦、8K視頻、超級防抖,都需要AI計算的支持。

到這裡,你還會覺得手機芯片性能強大的用處只能用來打遊戲嗎?

遊戲滿幀運行對旗艦手機來說早就不是難事,但是各種新奇拍照玩法直到近兩年才嶄露頭角,最重要的原因就是驍龍系列芯片AI能力的巨大提升。

AI性能翻倍的法寶——張量核心

那麼高通又是如何在短短一年內將AI性能翻倍的呢?

我們先來看看驍龍865的構造:

除去SoC中最基本的CPU、GPU和圖像處理單元ISP,驍龍865中集成的Hexagon處理器中包括一個專門為AI運算加速的Hexagon張量加速器(HTA)。

其實Hexagon之前是SoC中的數字信號處理單元,也就是常說的“DSP”,之前主要被用來處理語音和音視頻解碼。但是隨著AI技術的興起,高通終於給Hexagon升級了。

在去年驍龍855的Hexagon 690中,高通首次引入HTA實現了專用的可編程的AI加速。作為驍龍865集成的第五代Qualcomm人工智能引擎AI Engine的核心,Hexagon 698的HTA能效比上代提升了35%。

此外,驍龍865還在GPU上改善了浮點運算和AI性能,系統整體運算能力與前代(7TOPS)相比提升一倍多,實現高達每秒15萬億次運算(15TOPS)。

這也與AImark的實際跑分相符,證明了高通AI運算能力是實打實的提升,而非針對跑分軟件做出的特殊優化。

但手機AI是需要對整體考量,不是靠堆料就能簡單地實現性能提升。

手機和雲端AI、PC端AI最大的差異是,需要考慮有限的續航與散熱能力,也要考慮開發端口的特殊性。

普通的GPU做的是16位或者32位的浮點運算,優點當然是精確度高、性能強大,但是能耗也更高。

而Hexagon支持的是8位和16位的定點運算,這種運算更適合壓縮後AI模型,雖然精度有些許損失,但是運算量大大減少,在邊緣設備上應用廣泛。

高通和Android開發商谷歌還對Hexagon上的應用開發做出了定向優化。

比如高通的神經處理器SDK、Android神經網絡API和高通Math庫等,都可以被開發者所用,用來快速開發高效的AI應用。

此外,高通還採用了一種深度學習帶寬壓縮的技術,將數據量壓縮一半,降低了運算能耗。

驍龍865的AI性能提升絕不僅止於此。在處理AI任務時,往往有大量的數據進入到芯片中,而處理這些海量數據需要消耗更多電能、增加功耗。

對此,高通開發了一項全新的專用技術——深度學習帶寬壓縮。這還是一項完全無損的壓縮技術,也就是說所有數據的精度不會有任何損失。

帶寬壓縮能夠對這些海量數據進行高達50%的壓縮,以節省電能、降低功耗。

在一些對AI性能要求極高的情形中,驍龍865與今年最新的LPDDR5高帶寬內存相互配合、相得益彰。

總之,驍龍865的AI不僅僅是簡單的加個神經網絡核心,而是從CPU、GPU、Hexagon處理器(包括張量加速器),再到軟件、內存帶寬壓縮等等的一整套AI解決方案。

AI讓手機真的“智能”了

當然,AI性能的提升不僅僅是性能指標,也給我們的生活帶來了突變。

高通在去年的AI Demo Day上,和多家手機廠商、軟件開發商展示了手機端AI應用的無限前景。

專門開發拍照算法的虹軟,基於驍龍移動平臺,用AI實現了更強大的超級夜景和全身塑形美顏。

AI行業巨頭曠視和商湯在人臉識別和3D建模上玩出了新花樣。

其實高通驍龍865豈止是在圖像處理上的性能提升,它也讓過去噱頭意味更濃的語音助手有了實用價值。

今年的Hexagon處理單元具有了對上下文感知低功耗AI語音助手的支持,對語音識別、聲音傳感器的處理再上一層樓。語音助手會比過去更靈敏,多輪對話也更智能。

在語音翻譯方面,鑑於驍龍865首次支持文本和語音實時翻譯的AI特性,網易有道還與高通合作開發了同聲傳譯的功能,出門再也不怕語言障礙。

過去需要大量運算的人工智能技術在手機這個小小的終端上實現,靠的是驍龍865等一系列芯片在AI性能上質變的提升

現在,你還覺得手機AI只是“感知不強”、“徒增功耗”的宣傳噱頭嗎?

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態


分享到:


相關文章: