首顆可重構多模態智能芯片發佈清微首席科學家尹首一記者採訪實錄

擁有完全中國自主知識產權,清微智能打造的全球首款可重構多模態智能計算芯片——TX510在阿里雲棲大會上發佈。關於這顆芯片,發佈人清微智能首席科學家尹首一教授在現場接受了多家媒體的採訪,本文對其中的重要觀點進行了整理,關於芯片技術發展、行業趨勢,關於這顆芯片,聽聽尹教授怎麼講?


首顆可重構多模態智能芯片發佈清微首席科學家尹首一記者採訪實錄

記者:什麼是多模態智能?

尹教授:多模態智能即能夠同時處理圖像加語音、甚至更多形態、更多維度的數據。舉一個簡單的例子,在比較嘈雜的環境下做語音識別時,為了取得更好的效果,可以同時配上口型、表情,這樣的一些信息,幫助提升語音識別的準確率。如果只是獨立處理語音或者圖像這樣的單一的數據,這個就是比較基本的一種操作。

記者:目前市面上能夠看到的都單一處理的芯片,為什麼我們可以可以做到,是採用了多核的,或者說是這種異構融合的處理模式嗎?

尹教授:不是,這個就需要講到我們核心的這個可重構技術,可重構技術和異構架構兩者從邏輯上是有很大差別的。異構是在同一個芯片上放不同類別的IP核,例如CPU、GPU,有些還有放DSP,甚至FPGA這些,在處理不同算法時,它用不同的部分去計算。可重構計算它在整個芯片上,是同一個運算單元,可以在運行的過程中做動態的硬件架構的變換。架構採用陣列式的結構,在空間上可以分成兩個或者多個子陣列,動態的做自然分配,互聯,按需適配不同算法,動態的實現不同的功能。

記者:那這種重構與我們知道的FPGA有什麼區別?

尹教授:FPGA是一種靜態重構,配置出一種應用之後,在數據的運行過程中,就不可再變化了。所以,FPGA會有一種容量的單元,假設我們購買了4000單元的FPGA,如果我們寫進去一些應用,它是不能超過4000單元的。

可重構計算架構是動態的,當一些應用比較大的時候,在運行的過程中,可以被切分成小塊兒,在時間上混合計算。

可重構計算架構具有很好的可擴展性,按照需求擴大計算資源,所以以此架構為基礎的芯片,除了公司目前在智能終端上的產品落地,它也可以做網絡邊緣端的服務器,並切入到雲端市場。

記者:清微是唯一一家應用可重構技術的公司嗎?跟國外的技術對比呢?

尹教授:從技術上來說,可重構技術在國內,我們從清華微電子所到現在,已經有了十幾年的積累,是唯一的一家。近幾年,我們也看到國外也開始有一些同行,例如美國硅谷那邊有些公司也在做。美國國防部高級研究計劃局從2017年開始,投入巨大精力支持“運行時快速重構”的硬件架構研究,裡面有一些老牌的公司,例如高通,英偉達,還有一些新興的創業公司,他們也在沿著這條技術路線做探索。但我們其實是領先的,不光是在時間上,在一些重要的技術指標上也是,而且這個技術是我們中國首先原創的。

記者:我們的芯片可以在硬件層面進行重構,這對於開發者來說意味著什麼?

尹教授:其實對於開發者來說,跟之前的其它芯片沒有太大差別,仍然是寫軟件集成代碼,我們提供工具鏈,編譯成芯片硬件能夠識別的信息,對於開發者來說,應該基本上是完全無感的。開發者不用在意底層到底是如何實現的。

記者:我們的這個技術如何一代一代演進?

尹教授:我們認為應該從兩個維度來看這個事情。第一個維度就是繼續提升它的能效比,我們會繼續應用一些新的技術在裡面,包括近似計算、存內計算等。第二個維度就是要讓可重構計算更加靈活,讓它能夠支持更容易的編程,讓它對用戶更友好。

記者:因為是可重構架構,我設想一下,那是否可以重構為CPU、GPU這樣的芯片,來處理所有的程序?

尹教授:理論上來說,這個是完全可行的,而且我們其實已經嘗試過用可重構這種方式去做一個通用的處理器,這在科研裡面已經是實現過的。但是從產品的角度來說,其實還是要考慮很多落地的問題,現在是否合適推出這樣的芯片,都是需要考慮的問題。

記者:我知道,其實清微在今年6月底是推出了一塊語音芯片,在市場上也有不錯的表現,那麼這兩代產品有什麼不同,在性能上有些什麼提升呢?

尹教授:兩顆芯片在內部的計算架構上其實本質上是一樣的,開發工具鏈也是一樣的,其實這也是我們的一個優勢,可以節省前期的開發成本。產品的差別主要是在接口上,因為兩顆芯片其實都是SOC芯片,與他們配套的一些模塊有些不一樣。語音芯片更多的是對接一些語音應用的接口,例如配模擬麥克風、數據麥克的接口。第二款芯片為了配合多模態的一些應用,要配一些視覺應用場景,攝像頭接口等,還有裡面的一個3D深度視覺引擎。3D的識別可以提高識別的準確率,防偽和這種防攻擊性都有很好的提高。3D本身不是一個新的技術,應該說早在十年前就有了,但現在是一個小型化的過程,同時需要跟我們自己的產品有這種深度的融合。

舉一個場景來說,例如金融場景下的人臉支付,支付其實是對安全性要求極高的,單純的圖像識別安全性可能不夠,需要配合這種聲音的採集,那我們說一種極端的情況,如果有人制造了你人臉的3D模型,同時錄了你的聲音,它是不是就可以攻破了?這就是還要說到它的這種多模態處理,如果人真的去說話,同時是要配合你的口型,那麼這種安全性就會非常高了。

記者:那麼產品的落地情況呢?

尹教授:語音的芯片目前在深圳這些地方已經有很多終端產品在出貨了。這顆多模態的芯片一直跟阿里平頭哥有這種深度的合作,跟阿里支付也在磨合,目前是少量量產,大量量產後首先會跟阿里的這個生態圈的夥伴有合作。智能門鎖也是一個重要的應用場景,還有工業裡面智能製造的空間建模這些,我們其實覺得將來,所有用到視覺的地方,可能都會對這種3D的視覺有要求,因為我們人本身看東西本身就是立體的,立體的視覺背後還隱藏這很多語音的信息,這是未來的一個必然趨勢,都很適合這顆芯片,它還是一顆比較通用的AI芯片。

記者:在談到芯片時,我們總會說,某一方面做到優秀了,另一方面可能就會比較弱,特別是做到這種通用的芯片,那麼我們總是要犧牲一些什麼吧?

尹教授:你這個問題很有代表性,因為在跟很多人談到這個問題時,大家總會問,那我們到底犧牲了什麼?其實未必,我們可以看,每一代的CPU都在進步,性能都在提升,其實除了研發人員的時間,腦細胞外,你說它犧牲了什麼?我們的這個可重構技術,它改變的是芯片的底層架構,這就是一種創新,如果一定要犧牲什麼,才能換了什麼,這其實是說明你的技術沒有真正的進步,如果技術真的進步,它就是能力得到了提升,這種才算是真正的進步。

記者:關於芯片行業的競爭,如何看待系統集成廠商或者這種做算法的公司,都來做芯片的這個現象?

尹教授:我們可以看到,在芯片行業,其實是沒有藍海可言的,只要是一個真正能夠存在的芯片應用領域或者說叫場景,肯定存在大量的競爭。從終端來講,要用起來,看重的一個就是能效比,一個就是它的可編程能力,就是它的適用性。從這兩點來說,可重構技術是由它的獨特優勢的,競爭其實是好事兒。

我們從歷史上來看,為什麼有獨立的芯片設計公司存在?這是因為電子信息這個行業就是這樣的一種形態,需要有分工,才能提高效率,提高了效率才會有更高的利潤,這個商業模式才是成立的。我們今天來看,全球能夠做芯片的系統廠商,其實屈指可數,像華為,無疑它在全球現在也是領先的系統廠商,它有自己的系統定義能力,有自己的芯片設計能力。但是絕大部分的整機廠商,還是需要通過採購這種方式來完成。其實原因很簡單,像華為、三星這樣的公司,它單一產品的出貨量就會很大,來支撐它前期的芯片研發成本,一般的系統廠商,拋開技術積累不說,面對市場時,特別是面對目前這種碎片化的市場,還是比較難以支撐芯片的持續研發的。

記者:我們跟阿里平頭哥是如何合作的,如何看待這種合作呢?

尹教授:跟平頭哥的淵源很深,大概有十多年了,還在學校做科研的時候,就跟中天微有這種合作,現在的合作是水到渠成的一個事情。在這顆芯片開始做的時候,因為對中天微,對平頭哥的這種彼此瞭解,對他們的處理器是很放心的。平頭哥的無劍平臺提供了一種基礎的設施,各個芯片設計公司可以更專注到自己特別擅長、有優勢的領域,而在這些通用性方面就可以少花精力,公司就可以更加的專業。芯片設計還是具有比較高的門檻,有平頭哥的存在,就可以讓專業的公司更加專注創新,從底層架構上開始創新,這是對於整個行業來說,是很好的事情。


分享到:


相關文章: