GPU、CPU、加速器,英特爾終端側AI的“三種武器”

IT時報記者 王昕

AI無處不在。從低至100mW以下的超低功耗應用,到望不到邊際的計算機集群;從愛奇藝的4K、杜比電影頻道到AI、虎牙直播時的實時美顏;從互聯網遊戲中的AI人物設定到短視頻應用的AI換臉……英特爾的AI技術正滲透入互聯網應用的方方面面,變得無處不在。

終端側AI價值廣闊

英特爾視覺計算軟件合作部亞洲區總經理高源表示,相對雲端AI,終端側AI正在變得越來越重要,如電腦、手機、無人機、機器人等設備都開始具備承載AI的能力。

GPU、CPU、加速器,英特爾終端側AI的“三種武器”

英特爾視覺計算軟件合作部亞洲區總經理高源

高源認為,終端側AI有四大驅動力,分別是低延時、無網絡工作、隱私保護、節省服務器和帶寬成本。

“例如無人機自動避障的應用,需要隨時隨地採集視覺信息,並能非常快速做出反應,我們不可能把視覺信息傳到雲端,再從雲端做AI應用,這是來不及的。又如自動駕駛汽車開到了沒有網絡的森林,終端決策變得至關重要。”高源一一舉例,家庭私人照片放到雲端去之後怎樣實現隱私保護,在終端側做AI就可以很好地保護用戶隱私;隨著1080P、4K視頻的流行,互聯網服務商面臨帶寬和後端存儲的壓力,端能力的提升是環節源頭壓力的最好途徑。

在英特爾紫竹科學園內,一臺裝備低電壓版英特爾處理器的PC在僅數十兆帶寬的網絡環境下完美實現了4K視頻的流暢播放。英特爾工程師告訴記者,“低電壓版處理器加數十兆帶寬就足夠了,在性能、功耗、用戶體驗上都能滿足要求。”

三層架構擁抱AI

當終端側AI在蓬勃發展。多元化的應用場景又迅速定義了終端側AI不同的特性。如終端側AI需要長時間運行,對耗電敏感;偶爾運行、延時敏感;長時間運行,計算密集。

正是因為終端側AI有這麼多的使用場景以及非常不一樣的特性,所以我們覺得單一的架構很難滿足所有終端側AI的需求,“特別是我覺得在業內,因為歷史的原因,大家可能覺得一提到AI想到的就是需要一個獨立顯卡。”高源強調,這是一個很大的誤區,AI不等於獨立顯卡,它需要不同平臺來適應不同的AI應用。

對於英特爾來說,則從三類不同架構佈局了終端側AI的應用。

首先,GPU的硬件架構是高度並行化的,所以更適合一些很高性能的AI計算。但GPU也有自己的“短板”,計算啟動延時比較大,適合大型數據處理帶寬的應用。“其實,許多人不知道,英特爾是世界上最大的GPU供應商。”高源說,英特爾集成顯卡佔67%的市場份額,集成顯卡是和CPU是共享系統內存的,所以在很多AI應用當中,集成顯卡不需要在CPU、GPU之間來回拷貝內存的,這可以提升響應速度。


GPU、CPU、加速器,英特爾終端側AI的“三種武器”


GPU、CPU、加速器,英特爾終端側AI的“三種武器”

其次,CPU平臺最大的特點是無處不在。CPU是軟硬件非常統一的,無論是英特爾還是英偉達的都是X86架構,硬件和軟件都非常統一。把AI放在CPU平臺上很有效。例如,英特爾和相芯科技一起展示了利用PC同時對4路高清視頻進行AI應用,比如說換頭髮、手勢識別等,“大家可以看一下4路一起跑的時候,一個筆記本平臺,它的CPU佔用率也就是40%左右。很多AI應用對CPU的佔用都是非常小的,是完全可以承受的。”

GPU、CPU、加速器,英特爾終端側AI的“三種武器”

最後,英特爾專門設計了低功耗的AI加速器。一個是GNA,它不是一個獨立的硬件,它是專門設計的電路,是集成在CPU處理器當中,所以在新一代處理器裡已經有了。GNA的功耗小於100mw,所以它可以一直開著,不需要關的,這特別適合應用於語音應用。除此之外,英特爾還開擁有Movidius的VPU,VPU是專門為視頻類應用設計的,例如用VPU來研製無人機自動避障功能。

賦能中國企業

網易雷火事業群高級技術總監鄧傑表示,在GPU、CPU、硬盤等方面,網易都與英特爾保持了緊密的合作以優化遊戲性能。例如,《戰意》和《逆水寒》兩款採用自研引擎的遊戲,網易與英特爾工程師合作,提高了遊戲在多核上的性能,讓並行度分別提升了2.6倍和2.4倍,讓遊戲在比較低的配置上也可以流暢地運行。另外,網易還與英特爾一起針對華為最新筆記本電腦的雙屏應用開發了針對性的應用,例如將關鍵信息放到第二塊顯示屏上,如聊天窗口、小地圖、裝備等,這樣可以獲得更廣闊的遊戲視野。

GPU、CPU、加速器,英特爾終端側AI的“三種武器”

網易雷火事業群與英特爾針對華為雙屏筆記本開發針對性的應用

而在YY直播平臺,只要音頻和視頻的連線場景,如主播PK和觀眾連麥,都會有英特爾技術的介入,YY直播企業業務總監鄭龍哲介紹,YY將更多地實時處理都放到了端上,“端上設備性能越強大,我們可達到的效果就會越好。我們是國內第一大音視頻廠商,每月使用YY音視頻業務的市場已經達到了60億分鐘。”

除此之外,YY在UGC內容審核、音頻降噪、實時美顏、AR遊戲等方面都應用了端AI的策略,而YY在商業直播版塊的後端能力已具備了商業化推廣的條件,據悉,其虛擬導播臺技術可以低成本實現專業轉播設備的多路高清直播功能,正考慮向全社會商業化開放能力。

GPU、CPU、加速器,英特爾終端側AI的“三種武器”

相芯科技資深圖形引擎開發經理蔡銳濤介紹,其PC端在線教育平臺早期選擇了TensorFlow作為底層神經網絡推理框架,通過與英特爾的合作,展現了OpenVINO諸多優勢,對硬件做了非常好的優化,“在Ice Lake上,OpenVINO(VNNI)比TfLite fp32能夠得到9.82倍的性能提升,在AMD 3700上,OpenVINO也可以比TfLite有4.8倍的性能提升。”


分享到:


相關文章: