英特爾宋繼強:未來顛覆性創新要靠計算、存儲和通信“並駕齊驅”

昨天,英特爾年度戰略“紛享會”在線上舉辦,在會上英特爾中國研究院院長宋繼強發表主題演講《凌雲之智:驅動智能時代的技術創新》,英特爾近期的關鍵進展,以及在計算方式、連接方式以及存儲方式三個領域的全面佈局。

過去二十年到未來的五年,數據從規模、形態到處理需求都在發生巨大的變革。第一,數據量呈指數級爆發。第二,數據形態日趨多樣化。第三,數據實時處理的需求也在不斷增長。人工智能的原數據及其產生的模型並不是給人看的,是給機器使用的,這個數據量是非常巨大的。萬物互聯之後,機器產生的數據也在大幅度上升。這些數據遠遠超出網絡和雲端處理的能力,不可能都送到數據中心雲端處理。數據在哪裡產生就要靠近數據源進行處理。因此,邊緣計算和實時處理的需求也是快速增長的。

在數據的變革驅動之下,計算的發展呈現出三個顯著的趨勢。第一,數據量呈爆發式增長,這使得對於智能化的需求激增;第二,多元化的數據形態和工作負載,許多是非結構化的數據,一種架構無法滿足所有需求,計算必須更加多元化;第三,未來大量設備是在物理世界中捕捉數據進行實時處理的,數據從雲端到邊緣到設備都有處理和存儲的需求。因此,邊緣的智能化正在全面展開。

宋繼強表示,英特爾對於未來計算的研究和佈局,將緊密圍繞數據展開。我們認為,未來計算的顛覆性效應將會在三個維度發生,即計算方式、通信方式以及存儲方式。面向智能時代,英特爾的指數級創新將在三個層面發生,分別是通過智能連接讓數據傳輸得更快,通過智能存儲去存儲更多數據,通過智能計算去處理各種各樣的數據。”

從新型計算的角度來看,量子計算、神經擬態計算將是兩種重要的新型計算方式;從數據通信的方式來看,硅光子將是一種新的互聯方式;從存儲或者內存技術來看,英特爾認為讓數據儘可能地靠近計算,是未來數據處理最迫切的需求,讓內存和計算資源更緊密地結合在一起,將讓大規模數據處理的效率大幅攀升。

英特尔宋继强:未来颠覆性创新要靠计算、存储和通信“并驾齐驱”

Loihi新型計算架構:讓擬態神經成為可能

從新型計算的角度來看,量子計算、神經擬態計算將是兩種重要的新型計算方式。針對神經擬態計算,英特發佈了 Loihi 新型計算架構,傳統的 CPU、GPU 擅長處理人難以處理的大規模、大數據量的併發計算。但是,隨著技術的發展和應用領域逐漸擴展,人們逐漸要求計算機的處理模式趨向於像人類一樣,不需要大量數據,也不需要預先標註好的數據訓練它。為了應對這種挑戰,我們需要全新的架構,同時還需要大幅度提高能效比。

Loihi 支持模擬人腦的神經元連接構建的單元,將計算和存儲完全融合在了一起。一個芯片中包含了 128 個核,每個裡面又包含了 1000 個小的神經元,這就構成了一個大規模的片上計算網絡。同時,它可以支持多種學習模式,可以同時將深度學習、關聯學習、強化學習使用的網絡放在一個芯片架構中,讓它去學習和自我擴展,這是領先的軟硬件協同設計的模式。

英特爾基於 Loihi 芯片可以設計出更大規模的系統,讓它具備更強的學習能力和處理更復雜的學習應用。早期,英特爾把 4 塊 Loihi 主板聯結在一起,然後進展到可以用 32 塊、64 塊,最新已經把 768 塊 Loihi 芯片集成在一起,做成一個大規模的神經擬態計算系統,這個系統可以在 5 個機箱大小的空間中集成 768 塊芯片,以 500W 的功耗執行大規模的深度學習、神經擬態學習的應用。

目前,已經有 90 家組織加入到英特爾神經擬態計算研究社區中。這個系統已經可以給很多合作伙伴提供雲上的服務,可以在上面試驗大規模的工業系統中如何使用神經擬態的新架構,在更復雜的工作負載和高性能計算中實時動態處理數據。在算法方面,英特爾和美國康奈爾大學進行合作,探索讓計算機擁有嗅覺。它使用一套模擬人的嗅覺系統的模型架構,將它實施在一塊 Loihi 芯片上,功耗非常低。而且只用一個樣本就可以讓這個系統的識別率達到 92%。如果用傳統的深度學習方法,需要 3000 個樣本訓練才可以達到這樣的識別率,同時功耗是千倍以上。可見,Loihi 的神經擬態架構,加上專門設計好的算法,可以讓機器學會一些原本人才能學會的事情,並且降低功耗。

量子計算:從概念走向實用

英特尔宋继强:未来颠覆性创新要靠计算、存储和通信“并驾齐驱”

量子計算是一種全新的計算模式,它的底層基礎已經不是經典計算中使用的具有確定性的二進制比特,而是利用量子態系統為基礎,通過量子位的相干,在多個量子位上實現超大規模的並行計算。2015 年,英特爾宣佈與荷蘭科研機構 QuTech 開展為期十年的合作計劃。之後,兩個研究方向同步在進行:第一,是超導量子位和超導量子測試芯片,英特爾發佈了 49 量子位的測試芯片“Tangle Lake”。第二,是英特爾做硅電子自旋的“自旋量子芯片”。現在已經有了兩個自旋量子位的測試芯片,並且在英特爾自己的 300mm 的晶圓生產線上製作。現在量子計算系統面臨的一個挑戰是,如何在低溫下測試晶圓上或者是量子系統中的量子位到底好不好?英特爾與合作伙伴一起設計並試驗了量子的低溫晶圓的測試系統。

宋繼強表示,英特爾持續推動量子計算,實現規模化的商業部署。如果將量子計算商業化比作“極限攀巖”,那麼現在才剛剛啟程。我們在關注如何構建能夠用於解決棘手挑戰的系統,即“量子實用性”。只有在成千上萬個量子位可靠運行的情況下,量子計算機才能比超級計算機更快地解決實際問題。換句話說,業界要開發出這種規模的功能性量子處理器還需要數年時間。

圍繞量子計算領域,英特爾也正持續探索。一是要創造更好、更穩定的量子位,還要提升多個量子位同時連接和測試,英特爾需要和摩爾定律的同步推動並開發出一套可擴展的 I/O 系統。宋繼強強調,“英特爾的前沿探索,不會與目前的架構創新產生衝突,而是一個互補的探索。”

為了實現在低溫下控制多個量子位,英特爾研究院剛發佈了代號為“Horse Ridge”低溫控制芯片,它可以同時控制 50 個左右的量子位,而且是在 -270℃左右的低溫下去控制。這是一個里程碑,這樣可以讓量子位的控制更加集成化,為我們控制成千上萬個量子位打下基礎。

存儲和存儲模式的革新

英特尔宋继强:未来颠覆性创新要靠计算、存储和通信“并驾齐驱”

當我們的計算需要很多數據時,就必須要通過內存總線訪問數據,這會造成用戶要去遠一點的內存找數據,因此造成大量的計算等待。如果能將數據和計算緊密地放在一起,就可以大大減少對內存通道的衝突。現在計算靠近內存核心是非常核心的方向。從上圖中的一個非常小的近內存計算單元來看,裡面有 16 個乘加器組成的計算單元,同時有它自己的靜態內存的存儲。所以,這部分的計算可以直接拿到數據,不需要再佔用內存總線。同時,這是個非常小的計算單位,也可以更大量地集成在一起。在 FPGA 應用案例中,它將大量的計算單元和內存模塊放在一起構成了更大規模的計算系統,同時保證內存功耗很低。

未來通信:硅光通信

英特尔宋继强:未来颠覆性创新要靠计算、存储和通信“并驾齐驱”

未來的通信即硅光通信,現在在內存之間傳輸數據要求大帶寬、低功耗。光通信是現在採用較多,但是光通信和電子器件結合的時候,通常還需要一些分立器件連接起來進行轉換,這個器件會比較耗體積,也會損失一些傳輸效率。如何將電和光的轉換封在一個芯片封裝中,這非常重要。今年 3 月,英特爾向業界展示了業界首個一體封裝光學以太網交換機,它成功將 1.6 Tbps 的硅光引擎與 12.8 Tbps 的可編程以太網交換機進行了集成。

宋繼強指出,“我們認為一體封裝光學器件對於 25 Tbps 及更高速率的交換機具備功率和密度優勢,是非常必要的技術。我們目前已經可以為客戶提供支持。”


分享到:


相關文章: