英特爾推出全新AI工具包:CPU

7月27日,英特爾在北京召開了主題為“智能端到端,英特爾變革物聯網”的視覺解決方案及策略發佈會。在此次發佈會上,英特爾面向中國市場推出了基於英特爾硬件平臺的專注於加速深度學習的OpenVINO工具包,可幫助企業在邊緣側快速實現高性能計算機視覺與深度學習的開發。

物聯網加速人工智能在邊緣計算中的應用

此前人工智能的很多運算處理都是發生在服務器、數據中心這樣的雲端,因為只有在這樣的一個環境裡面才能提供強大計算力和便利的支撐。但是,隨著物聯網時代的到來,將會有越來越多的設備和傳感器接入網絡,情況正在發生改變。

根據IDC預測,到2020年全球會有超過500億的智能設備,超過2120億個傳感器。這也意味著每天都將會產生海量的數據。

英特爾推出全新AI工具包:CPU/GPU/FPGA/VPU能力全面提升

根據研究機構預測,隨著物聯網的快速發展,到2020年每個互聯網用戶每天將生成約1.5GB的數據,一個智能醫院每天將產生超過3000GB的數據;每臺自動駕駛汽車每天將生成超過4000 GB的數據;聯網飛機每天將產生超過40000GB數據;一個智慧工廠聯網,假如說有一千多臺設備,每臺設備上有很多個傳感器,時時刻刻都會產生數據,那麼整個智慧工廠每天產生的數據量將是1PB。到2020年全世界每天產生的數據總量將是44ZB。(注:1ZB就是1000EB,1EB是1000PB、1個PB是1000TB,1TB是1000個GB。)

面對如此海量的數據,如果仍然只是依靠雲端來做數據處理的化,這將對雲端的計算力和網絡帶寬都帶來了極大的挑戰。雖然計算力和通信技術也在不斷髮展,但是這個速度還是難以趕上數據增長的速度。所以,邊緣計算,即數據在終端側進行人工智能分析和處理早已是大勢所趨勢。

IDC預測,到2018年將有45%的物聯網數據需要在邊緣進行存儲處理和分析(足見物聯網對於在終端側部署人工智能需求的增長之快),有50%的物聯網的網絡會面臨帶寬的問題。正是由於物聯網所帶來的海量數據的增長以及對於帶寬的極大挑戰,在終端側部署人工智能已經變得非常必要。

而且,在終端側部署人工智能,還有著數據處理的實時性更高、低延時,更低的帶寬需求的優勢。比如在自動駕駛領域,對應這方面的要求就非常的高。

另外,在終端側部署人工智能也有利於數據隱私的保護。因為很多用戶是不希望把數據上傳到雲端的,希望這些數據在本地進行處理,本地處理完以後,上傳的是一些是經過處理完以後的特殊的數據,對隱私保護相對比較高的場景,也需要一些數據放在邊緣進行處理。

可以說,隨著物聯網的發展,正在加速人工智能在邊緣計算中的應用,但是這並不意味著雲端人工智能就不需要了、就會走向消亡。雲端人工智能它能夠把數據源進行彙總,它能夠做一些更綜合的應用。如果要給用戶提供一個完整的人工智能服務和解決方案,一定是一種邊緣與雲端協同的端到端的人工智能解決方案。

英特爾推出全新AI工具包:CPU/GPU/FPGA/VPU能力全面提升

目前,包括英特爾在內的一些廠商都能夠提供端到端的架構了,所以現在“分佈式計算”的概念已經是一個比較成熟的概念。也就是說,做雲端解決方案的人需要把它的架構切到邊緣來,幫助解決邊緣的問題。

在英特爾看來,“視頻(攝像頭)是物聯網的終極傳感器”。確實,在邊緣側,視頻所帶來的信息流是最為龐大的。值得注意的是,2016年-2012年網絡視頻監控流量增長了700%。也就是說,在物聯網時代,視頻將是人工智能應用爆發的一個關鍵點。因此,視頻監控領域也成為了英特爾端到端人工智能方案的切入重點。

英特爾的全棧式AI硬件解決方案

對於英特爾來說,在雲端的服務器及數據中心市場,英特爾是絕對的老大,市場佔有率超過9成。針對這塊市場,英特爾擁有Xeon處理器與Xeon Phi處理器,以及能支持各種對特定運行負載進行最佳化的加速器,包括現場可編程化邏輯閘陣列(FPGA),以及Nervana。

相對來說,CPU並不適合用來做人工智能運算,不過英特爾依然能夠通過集成的GPU,再結合FPGA來實現雲端的人工智能運算加速。更何況,英特爾2016年還以4億美元的高價收購了機器學習初創公司Nervana,將推出一款專為深度學習而打造的神經網絡處理器。

在終端側,英特爾除了可以利用其現有的針對終端的CPU、集顯、FPGA產品之外,2016年9月,英特爾收購了計算機視覺芯片公司Movidius,開始加碼終端側的人工智能佈局。Movidius的Myriad 系列 VPU目前有被大疆Spark無人機、谷歌Clips相機等知名廠商的產品採用。去年,英特爾還推出了針對終端設備進行人工智能加速的Movidius神經計算棒。

英特爾推出全新AI工具包:CPU/GPU/FPGA/VPU能力全面提升

▲英特爾副總裁兼物聯網事業部中國區總經理陳偉博士

“我們英特爾有自己的CPU,有自己集顯GPU,在加上我們的MovidiusNervana這些加速技術,還有FPGA,至少從硬件的角度來講,我們是可以根據應用去勾勒出一個功耗、成本最優化的端到端的全棧式解決方案,這是我們的一個起點。”英特爾副總裁兼物聯網事業部中國區總經理陳偉博士表示:“要獲得好的人工智能體驗,就需要有多元的、高質量的硬件平臺,但是,將這些硬件直接應用到人工智能應用上,還有很多的壁壘。主要的壁壘是怎麼樣能夠深度的挖掘和充分的運用硬件的能力。”

我們都知道,同樣一種人工智能算法,應用到不同的硬件平臺上,所得到的效果差異會非常的大。因為一種算法通過是根據某個硬件平臺來優化的。

由於不同的網元所能提供的計算量是不一樣的,它能夠支撐的操作系統也各不相同的,因此有各自適用的不同的芯片架構。而不同的芯片往往有各自不同的開發方法,這樣對開發者而言就帶來一定的困擾,也就是說如果我們為某一種芯片所開發的軟件換了一個架構以後,它可能是不適用的,這樣無形中就增加了開發的門檻。

那麼如何讓終端廠商能夠輕鬆的採用同樣一套AI算法,輕鬆實現從雲端到終端側的跨平臺部署,併發揮出各個硬件平臺的能力呢?對此英特爾推出了全新的視覺推理和神經網絡優化工具套件OpenVINO。

強大的OpenVINO工具包

英特爾推出全新AI工具包:CPU/GPU/FPGA/VPU能力全面提升

OpenVINO是英特爾基於自身現有的硬件平臺開發的一種可以加快高性能計算機視覺和深度學習視覺應用開發速度工具套件,支持各種英特爾平臺的硬件加速器上進行深度學習,並且允許直接異構執行。

英特爾推出全新AI工具包:CPU/GPU/FPGA/VPU能力全面提升

具體來看,OpenVINO包括英特爾深度學習部署工具包,具有模型優化器和推理引擎,以及面向OpenCV和OpenVx的優化的傳統計算機視覺庫。OpenVINO工具包可通過基於英特爾架構的處理器(CPU)及核顯(Integrated GPU)和深度學習加速器(FPGA、Movidius VPU)的深度學習加速芯片,增強視覺系統功能和性能。

英特爾推出全新AI工具包:CPU/GPU/FPGA/VPU能力全面提升

▲英特爾中國區物聯網事業部首席技術官兼首席工程師張宇博士

“在計算機視覺領域,業界有兩類方法被廣泛的使用。一類是深度學習的方法(主要做物體檢測、目標識別),另外一類是傳統的計算機視覺的方法(比如做光流的計算或者圖像的增強),這兩類方法實際上都有在被使用。在OpenVINO裡面,我們對這兩類方法都有很好的支持(針對後一種,英特爾在OpenVINO中集成了媒體軟件開發套件Media SDK,可幫助開發者調用英特爾CPU裡面集成GPU資源來實現視頻的編碼、解碼以及轉碼的操作)。OpenVINO包含一個深度學習的部署工具套件,這個工具套件可以幫助開發者,把已經訓練好的網絡模型部署到目標平臺之上進行推理操作,所以OpenVINO是幫助大家做推理的,而不是幫助大家做訓練的。我們是幫助大家把這些訓練的結果更好的、更快的能夠部署到英特爾的目標平臺上做推理操作。”英特爾中國區物聯網事業部首席技術官兼首席工程師張宇博士解釋到。

英特爾推出全新AI工具包:CPU/GPU/FPGA/VPU能力全面提升

目前比較流行的深度學習的框架主要有Caffe、Tensor Flow、MxNet,英特爾在設計OpenVINO的時候考慮到了目前開發者的習慣,所以模型優化器通過配置以後可以把這三個主要的開發框架上所開發的網絡能夠導入到英特爾的平臺上,而且導入的過程中,英特爾會根據目標平臺的特性做一定的優化,把這些優化的結果轉換成中間表述文件——IR文件。這個文件裡會包含優化以後的網絡拓撲結構,以及優化之後的模型參數和模型變量。這個IR文件後面會被推理引擎進行讀取,推理引擎會根據開發者所選用的目標平臺去選用相應的硬件插件。目前,OpenVINO可支持英特爾的CPU的插件、GPU插件、FPGA的插件以及Myriad VPU的插件。

英特爾推出全新AI工具包:CPU/GPU/FPGA/VPU能力全面提升

總結一下英特爾的OpenVINO™工具套件能帶來的一些優勢:首先是性能方面的提升,因為通過OpenVINO,大家可以方便的使用英特爾的各種硬件的加速資源,包括CPU、GPU、VPU、FPGA,這些資源能夠幫助大家提升深度學習的算法在做推理的時候的性能,而且這些執行的過程中是支持異構處理和異步執行的,這樣的話能夠減少由於系統資源等待所佔用的時間。另外,OpenVINO™使用了經過優化以後的OpenCV和OpenVX,同時提供了很多應用示例,可以縮短開發時間。這些庫都支持異構的執行,所以大家如果編程的話,編寫一次,以後就可以通過異構的接口支撐跑在其他的硬件平臺之上。

另外在深度學習方面,OpenVINO帶有模型優化器、推理引擎以及超過20個預先訓練的模型,大家可以利用給大家提供的這些工具,快速的實現自己基於深度學習的應用,而且OpenVINO™使用了OpenCV、OpeenVX的基礎庫,大家可以利用這些基礎庫去開發自己特定的算法,實現自己的定製和創新。

英特爾推出全新AI工具包:CPU/GPU/FPGA/VPU能力全面提升

根據英特爾公佈的數據顯示,通過OpenVINO的提升,如果在英特爾的酷睿i77800X這個處理器平臺上去跑Google Nex這樣的一些開放網絡,它的相應的性價比是目前市面上解決方案(NVIDIA Tesla P4)的兩倍以上。如果選用英特爾的FPGA的產品Altera 10 1150KLE PCIe卡,它的推理性能/功耗/成本比值的綜合考量的因素性能大概能達到NVIDIA Tesla P4的1.4倍以上。如果是基於Movidius平臺的Myriad 2 VPU,其經過優化的性能/功耗/成本的比值相比NVIDIA Tegra TX2 Jetson模塊將提升5倍以上,所以我們從中可以看到,使用OpenVINO在英特爾硬件平臺上所帶來的提升還是非常明顯的。

客戶怎麼看?

現在圖象處理的算法實際上是非常多樣化的,圖象處理除了人臉識別以外,還有車輛分析、結構化分析、行為分析等等,比如智能安防領域裡基本上已經很難有一個場景說只需要一種算法,絕大部分都是要多種算法融合。所以,異構計算應該是一個趨勢。

作為英特爾的合作伙伴代表,宇視研發副總裁兼AI產品線總監湯立波表示:“OpenVINO有幾個非常重要的價值,第一個就是可以通過一次訓練來滿足不同的硬件平臺。在我們這個行業,所有的產品在不同位置、不同場景的產品,對芯片的要求是不一樣的。比如它的功耗承受能力不一樣,性能要求也不一樣。所以我們在不同的產品上要用不同的芯片。以前是怎麼辦呢?是在不同的硬件平臺就芯片上面落地的時候,研究開發人員是要多次的開發,產生了大量的人力的浪費,而且大家知道現在人工智能這麼火,人力的成本是非常高昂的,通過OpenVINO這樣一個方式,我們可以大量的節省成本,這也是一個好處。”

英特爾推出全新AI工具包:CPU/GPU/FPGA/VPU能力全面提升

在本次發佈會上,國內知名的人工智能廠商雲從科技還率先在國內發佈了首款基於OpenVINO工具包開發的產品,並已開始進行大規模量產。

“2017年,我們自己開始準備推出我們自己基於英特爾平臺的產品,隨後就做了一款產品,外觀上一般,但是產品很不錯,因為有英特爾X86裡面的並行計算的模塊,更主要的是有OpenVINO的核心模塊在裡面。基於這個,我們在人工智能以及各行業的廣泛應用上,得到了很好的開發。現在這款產品,我們已經在幾十家行業客戶,以及幾百個行業網點做推廣,也是有賴於英特爾成熟的生態體系。一款產品同時支持幾十家不同客戶需求的時候,無論是算法還是應用不同的需求都能夠得心應手,當然這裡面有很多英特爾同事的支持,因為我們選擇了一個合適的平臺。”雲從科技項目總監李軍這樣總結到。


分享到:


相關文章: