如今各路语音助手如小爱音箱啊,腾讯听听啊,天猫精灵等,他们的技术都是自己的吗?

方寸指尖

现在AI智能音箱都是集成了语音增强版芯片和增强版的MIC系统,从本质而言和普通的手机、平板等智能设备并没有太大差别。从核心技术而言,在底层主要是由芯片厂商来提供,而在具体的产品生产和配套软件、AI智能服务等技术都是音箱厂商自己来做。科大讯飞主要是提供语音识别技术软件,并不是所有AI智能音箱厂商会采用讯飞的方案,毕竟能够做语音识别技术的公司还有很多。

一、AI智能音箱核心的智能芯片和底层软件都是由芯片厂商提供的。现在主流AI音箱芯片主要有:

1、联发科MT8516

联发科手机芯片在高通的打压之下处境艰难,但在AI音箱芯片市场,联发科却扬眉吐气了一番,据悉2016年AI音箱市场近80%的芯片都是由他们供应的。联发科是亚马逊AI音箱Echo的主力芯片商之一,占据了过半的份额。另外,联发科还是Essential Hom(Android之父Andy Rubin新公司推出的“智能助手”)、阿里的天猫精灵X1的芯片供应商。

MT8516支持四核心64位ARM Cortex-A35,主频达1.3GHz。该芯片还内建WiFi 802.11 b/g/n 和蓝牙 4.0,不仅确保芯片更小的占板面积,更有助于终端厂商简化设计、加快上市时间,并为开发更多的创意性产品提供了更多可能。MT8516支持高达8通道的TDM麦克风阵列接口和2通道的PDM数字麦克风接口,非常适用于远场(Far-field)麦克风语音控制和智能音响设备。

2、高通Smart Audio Platform

高通在智能音箱芯片领域不甘示弱,推出旗下的“智能音效平台Smart Audio Platform”。在这个平台上,高通提供了两款新的系统级芯片(SoC),基于骁龙 425(APQ8017)芯片和骁龙 212 芯片(APQ8009)做的,针对音频处理优化过。。两款新芯片将提供对两个语音助理的支持,Google 助理和亚马逊的 Alexa;也能支持语音识别、网络电话(VoIP)。

3、英特尔Smart Home Hub

在亚马逊开发者大会上,英特尔表示将会开发基于亚马逊Alexa的“Smart Home Hub”(中文意思为“智能家庭中枢”)的智能音箱。英特尔推出的原型参考设计将会帮助外部的硬件厂商加速开发各种基于Alexa的语音设备,并且采用英特尔的芯片平台。据介绍,这款智能音箱将会支持丰富的网络连接方式,包括Wi-Fi、Z-Wave、Zigbee、蓝牙等。

4、全志科技R16芯片

早在2015年,京东推出的集成科大讯飞的语音助手的智能音箱叮咚就采用的是国产芯片厂商全志科技的R16芯片(Cortex-A7四核架构)。科大讯飞推出了4+1环形五麦克风阵列,也是采用的全志R16平台。

全志R16采用了四核ARM Cortex-A7架构处理器,具有强大的运算性能和丰富的接口;支持基于Linux的开源系统Tina,(Tina是全志科技全力打造的专门用于全志智能硬件平台的系统软件品牌);支持AirPlay、DLNA、Qplay、Airkiss、Smart Link等多种网络应用协议;提供独特的算法、IP包,使开发者可以专注于其自有应用和产品市场运营,降低产品开发成本,并缩短开发周期。


5、瑞芯微RK3036、RK3229

2017年4月,瑞芯微电子在香港电子展上公布了旗下两款“AI语音助手”芯片级解决方案:RK3036与RK3229两颗芯片,分别针对入门级与中高端产品的语音智能音箱方案。并且在今年一季度已经开始出货。5月17日,谷歌I/O开发者大会上,瑞芯微电子(Rockchip)率先向全球发布基于Android 系统平台的RK3229谷歌语音助手(Google Assistant)解决方案。

RK3036基于Cortex-A7双核,支持1/2/4Mic; RK3229基于Cortex-A7四核,支持4-8Mic。在语音算法上,支持声源定位、声源增强、回声消除、噪音抑制技术。RK3229还是率先支持8路数字I2S数字硅麦直连的芯片方案,不仅大大节约成本,而且兼容不同麦克风阵列算法及平台。

6、紫光展锐——RDA5981

紫光展锐的市场脚步也很快,目前搭载该公司芯片的智能音箱产品已经大规模出货,开始大力收割300元以下的低端智能音箱市场。在媒体的一次报道中,展锐的发言人表示:“目前我们的音箱客户大概有几十家,主要是300元以内的智能和蓝牙音箱,芯片价格成本很有竞争力。

锐迪科的RDA 5981,采用40奈米制程、内建ARM Cortex-M4处理器,是一款为智能家居、智慧家庭、智能语音交互等物联网打造的全集成低功耗的WiFi芯片。.

7、苹果A8

苹果发布了集成Siri的智能音箱HomePod,它将作为一个中心串联起整个苹果智能家居。苹果的产品就是任性,HomePod内置强大的A8处理器,它的运算速度实际上就和iPhone 6一样,因而能够出色地完成声场设置、降噪和语音识别工作。HomePod的底部配置了7个阵列式精密波束音腔,并采用SIRI进行语音交互。

从性能而言苹果的AI音箱芯片是最强大的,但只是提供苹果自己使用。

从AI智能音箱的芯片来看,很多芯片厂商提供了完整的软、硬件技术平台,一般即使是比较小的音箱厂商都可以快速生产出AI智能音箱产品,大大降低了智能AI音箱的进入门槛。

二、AI智能音箱厂商主要负责产品的制造和技术支持

从智能AI音箱的供应链可以看出,语音服务、芯片、麦克风阵列方案等底层技术全面有专业公司在做,技术实力较弱的厂商可以直接采用芯片厂商提供的完整的软硬件解决方案进行生产,而技术实力较强的厂商,在内容和智能AI服务方面都加入了自己的核心技术。现在的AI音箱市场鱼龙混杂,即使现在主流的产品都难言是真正的AI音箱,更像是语音助手。随着技术的进步,未来AI音箱也将迎来更迅猛的发展。


智慧新视界

1、首先纠正一下:你说所的不叫语音助手,而是叫做“智能音箱”。

2、问题的答案是:是的。

3、智能音箱由 作为硬件的音箱本身+作为软件的智能语音助手(时刻保持在联网状态下) 构成。

硬件部分就如同一部手机,有各类配件组成,可能会在设计方案上有所区别,但基本上这个不是太有必要去做比较,因为所有的重点和难点其实都在软件的智能语音助手上面。

4、智能语音助手(软件)=大数据+算法+运算力/资金实力

这个公式决定了智能语音助手只是小部分公司能玩的游戏。

其次算法(含自然语义)是第二大门槛:智能语音助手需要识别的是国内几十个不同民族的语言中所有可能的场景下的所有语言中含有的信息,方言的识别、自然语义的分析是最难的部分,因此没有大数据提供的关于人的生活、使用手机、语音或文字聊天的行为等所有的充分数据的支持,自然语义的算法开发是做不到的。(我在2014年和北京的一位提出“国家智能”的学者请教和探讨过这个问题)

综合以上:别看这智能音箱小小的,而且价格高低都有,它背后代表着的说白了是一家互联网公司的“实力”,同时也意味着智能生活的时代的到来。


分享到:


相關文章: