中國4大AI語音公司掀起“造芯”,中芯國際入場,行業洗牌在即

進入 2019 年, AI 技術的場景落地和商用化會成為一個更迫切的議題,但語音識別已是所有 AI 技術中最成功的領域,眼前有四大AI語音公司思必馳、雲知聲、Rokid 、出門問問不約而同投入“造芯”運動,開始押寶自制 AI 語音芯片,開啟第二戰場!

中國4大AI語音公司掀起“造芯”,中芯國際入場,行業洗牌在即

“融資”與“造芯”成為 AI 創業公司兩大主軸議題,思必馳在 2018 年完成 D 輪融資後,即透露與某芯片巨頭進行 AI 芯片的研發,如今答案揭曉,思必馳旗下的芯片設計公司“深聰”獲得“國家隊”中芯國際旗下的股權管理公司中芯聚源投資,同時中芯國際也為深聰打造第一顆 AI 語音芯片。

“百箱大戰”時代開啟 ,AI 語音芯片熱度火到“互撕”?

基於深度學習( Deep Learning )的語音辨識技術很快成為 AI 創業界的流量擔當,尤其 2017 年 Amazon 一口氣推出多款Echo系列產品,開始了國內“百箱大戰”的年代,更讓相關 AI 語音企業迎來一陣小高潮,不少同性質公司更是明爭暗鬥陷入“互撕”局面,反應該市場的火熱程度。

根據 Canalys 估計, 2017 年全球智能音箱出貨量突破 3000 萬臺, 2018 年出貨量預計是超過 5600 萬臺,全球前四大品牌廠為Google、Amazon、天貓、小米。再者, 2017 年全球智能音箱用戶量排名前五名是美國、英國、德國、中國、加拿大,但2018年中國可望躍居第二名。

除了音箱之外,智能家居、汽車市場很多應用場景的硬件也會陸續加入語音智能化的功能,都讓 AI 語音技術的應用場景增添無限想像空間。

中國4大AI語音公司掀起“造芯”,中芯國際入場,行業洗牌在即

光是 2018 年就有三家 AI 語音創業公司發表相關芯片,包括雲知聲發表面向 AIoT 市場的 UniOne 芯片、出門問問的 AI 語音芯片模組“問芯”Mobvoi A1、 Rokid 的 AI 語音芯片 KAMINO 18 ,思必馳透露要進入自制芯片領域已有一段時間,4日才正式對外揭露具體戰略細節。

中芯國際助陣,思必馳“造芯”如虎添翼

不同於雲知聲、Rokid進入芯片自制領域,都是在公司內部成立獨立部門進行研發,思必馳2018年初成立子公司“深聰”,2019年初推出的第一顆產品是AI語音芯片深聰TAIHANG芯片。

思必馳扶植的深聰之所以引起業界注意,是因為思必馳的“造芯”之路,找來國內半導體巨頭中芯國際助力,旗下的投資公司中芯聚源加入成為創始股東之一。再者,思必馳對深聰的持股比重超過50%。

思必馳自制的首顆AI語音芯片,就是由中芯國際操刀,以40納米工藝打造,約莫是2017年中啟動該芯片項目後,在2018年8月進行流片,11月芯片出來後,現在處於採集樣本階段,預計2019年中將進入風險試產,該顆芯片拔劍出鞘的速度十分快,幾乎把需要6 個季度的工作,縮短為3個季度完成。

深聰TAIHANG芯片面向智能家居、智能終端、車載、手機、可穿戴設備等各類終端設備,基於雙DSP架構,內部集成codec編解碼器,以及大容量的內置存儲單元,再者,該芯片也採用了指令集擴展和算法硬件加速的手段,相較於傳統通用芯片具有10X以上的效率提升。

深聰聯合創始人吳耿源表示,在芯片戰略上是兩步走,因為背後強大的需求力道驅動,第一顆芯片不單是求快,講求time-to-market,也專注低功耗、單向反饋、實現算法加硬件融合優化的想法。

中國4大AI語音公司掀起“造芯”,中芯國際入場,行業洗牌在即

圖 | 深聰聯合創始人吳耿源(來源:思必馳)

同時,深聰內部已經開始第二顆芯片的規劃,是專用芯片加特定架購,雙向溝通更能達到軟硬件融合、深度優化的功效提升,以軟件需求來定義芯片架構,再用架構去反饋算法,同時,算法也會優化硬體架構,等於是彼此做到雙向溝通,預計該顆芯片將在2019年下半年流片,2020年量產。

從“通用”到“專用”,這是一條怎麼樣的心路歷程?

從通用芯片到量身打造專用芯片的過程,想必有一番思考、摸索與探尋,吳耿源接受DT君專訪時娓娓道來。

吳耿源分析,思必馳是一家滿十歲的企業,這幾年趕上AI崛起的浪潮,過去多年的技術積累獲得發力的機會,目標戰場是物聯網,第一個應用場景是智能音箱,一切有了很美好的揭幕,但坦白說,智能音箱終究“ me too ”產品,Amazon 已經在前開路。

思必馳的智能音箱初期用過很多家芯片大廠的通用芯片,但隨著產品線逐漸成長茁壯後,許多問題逐一浮現。因為,通用芯片功能再怎麼強大,落地到AI場景上會有削足適履之感,加上很多目標市場越來越明確、消費者群聚效應展現後,特製化芯片的需求因此誕生。

AI 芯片在市場上有兩路的提供者,早幾年都是通用芯片的天下,像是高通、聯發科等,這些巨頭在芯片戰略上,較為著眼於商業利益價值,但是,很多AI應用場景都屬於細分賽道,要通用芯片巨頭“削足適履”,會比較不切實際。

這些芯片巨頭當然也會想要“染指”AI市場,但這個市場和他們過去擅長的遊戲規則有落差,以前是巨頭們設計出什麼樣的芯片,客戶就要乖乖接受,但AI市場是反其道而行,要透過使用者來定義產品,再由把需求反饋給算法,靠算法實現。

但是,傳統芯片巨頭無法緊密地直接觸碰市場需求,或是內部沒有強大的算法團隊或數據(Data)做後援,在AI領域要成功,算法、數據、正確地定義市場都是關鍵。

因此,近幾年起算法公司開始切入“造芯”運動,也提供給算法公司實現垂直整合佈局的機會,更重要的是,藉由“造芯”來確保產品的差異化和核心價值凸顯出來。

吳耿源表示,思必馳從算法公司跨入產品,再垂直整合成一個平臺,上下串連繫統,在雲端(Cloud)、邊緣(Edge)兩端都有佈局,關鍵就是欠缺一個硬件芯片去擔任執行的角色,而AI領域是軟件定義芯片,初期用市面上通用芯片時,也發現算法與芯片對接的過程,有很多文化融合的問題。

舉個例子,當算法遇到芯片,發生的第一個衝突是算法的改朝換代速度遠快於芯片的工藝技術。

一般而言,從定義產品到芯片誕生於世,大概要“懷胎”兩年(24個月),中間經歷設計、流片、試產、改版、升級、量產,每一個階段慢慢磨練,中間經歷的循環以“季度”為單位來計算。

反觀在算法的世界裡,每一個禮拜都在改,循環可能是以“禮拜”作為單位,若將算法與芯片擺在同一家企業中,彼此步伐不一致的問題,會產生明顯的內部矛盾與衝突。

思必馳從算法、產品、平臺、系統整合佈局到整個生態系統,現在加入深聰自制AI語音芯片,佈局齊全後,將跨出智能音箱這個“me too”市場,進入AIoT領域,包括TV盒子、白色家電、智慧家庭、故事機等,當物聯網遇上AI,商機是無可限量。

多模式人機交互是理想桃花源

吳耿源進一步指出,光是語音AI技術就還有很大的精進空間,現在的智能音箱的溝通仍需經過“喚醒”的程序,其實是“人工弱智”,要做到自然人機交互,當中的技術突破就需要算法的大幅增進,其中一個關鍵的元素是聲紋。

市面上的智能音箱只能辨識出說話的內容,再針對問題給出反饋信息,這樣的交互方式是智能化的,但交流方式卻不夠聰明,因為必須要在明確對象的情況下進行,唯有做到“聞聲即可識人”,不需要“喚醒”這個多餘的動作,這才是真正的“SMART”。

吳耿源進一步解釋,AI語音芯片在應用場景的廣度上,絕對不單是音箱領域,還包括物聯網、智慧家庭、車載市場等,更進一步場景是多模生態,當下AI是最好的時代,天時、地利、人和,AI時代正在騰飛、國家關注造芯、加上軟件、硬件、人和的融合。

現在的AI技術場景分別在語音、視覺兩大領域有不錯的起步和成功的場景落地,但卻都是各自表現,所謂的多模生態是指聲覺、視覺、五官、手勢、觸摸等獨立的功能融合在一起,實現自然的多模式人機交互。

AI技術領域的前方是無人區,只能摸著石頭過河,每一步都是挑戰,但也處處是驚喜。

更重要的是,這是一個國內最有機會與美國科技先驅並行的領域,AI技術的“造芯”運動是日正當中,想想海思追趕高通也花了超過十年,才造就今日的江湖地位,國內發展AI技術有應用場景做後盾,要打造出一家巨星級的企業,這一劍肯定不用磨到十年!


分享到:


相關文章: