SpeakIN凭什么拿到上亿融资?——声纹识别做到了国际领先

近亿元的融资额!这是创投圈今天传来的一个大新闻。SpeakIN(势必可赢科技)以及全资子公司国音科技完成了有IDG资本领投的融资。一半网民们似乎都被这“亿元”金额所震惊,却发现这则新闻的主角“势必可赢科技”实在是让人陌生的很。这家公司是做什么的?凭什么就能获得如此巨额的融资?

SpeakIN凭什么拿到上亿融资?——声纹识别做到了国际领先

SpeakIN是一家创立于2015年的人工智能AI创业公司,其专注的领域是“声纹识别技术”。他们能拿到上亿元的融资,是因为真的做到了在该领域里“重新定义”。

“重新定义”这个词汇,近来被某手机企业弄得有点不伦不类。不过这词儿对于SpeakIN来说却是实实在在的正面褒义词。他们的声纹识别技术,让人与设备之间的交互变得更加便捷、更加安全、更加舒适。与某手机企业不同的是,他们的声音交互技术并非应用在那些有着超大屏幕的设备上,而是用于屏幕很小、甚至没有屏幕的各种电子装置。

那些场合需要声纹识别?

所谓声纹识别,就是人通过自己的声音来实现设备登录。适用于这种登录方式的设备包括各种屏幕很小、甚至没有屏幕的智能手表、播放器、穿戴式设备、以及像汽车中控台这样的装置。

这些设备要么是屏幕很小、缺乏便利的输入手段,要么是根本没有屏幕。传统的密码登陆显然并不适合。指纹、人脸识别等手段在这些场合同样也很难使用。这就需要采用声纹来实现登录了。

SpeakIN凭什么拿到上亿融资?——声纹识别做到了国际领先

除此以外,声纹识别在智慧零售、智能家居、以及公安部门的社会治安管理方面都有大量的应用场景。

声纹识别技术的门槛在哪里?SpeakIN又有何高明之处?

这种技术的工作原理听起来很简单,但要实际应用起来却面临很多障碍,只要克服了这些障碍以后才能让实现声纹识别技术的广泛应用。

1. 防伪

我们在不少谍战题材的影视剧里都见识过伪造声纹的伎俩。比如在《谍影重重》里,身手不凡的主角伯恩就通过复制特工头子的声音,来盗取其私藏的机密文件。

这个情节其实反映了声纹识别的一个重大缺陷:很容易被人用录音、以及其他模拟声音的手段来破解。

SpeakIN开发的技术就避免了声音复制带来的隐患。他们的系统在允许用户登录之前,首先会验证其声纹的真实性,杜绝一切伪造、复制的可能性。

2. 情绪和性别检测

随着人们对定制化、个性化的使用体验要求越来越高,各种可穿戴设备、车载设备都争相提供能根据用户情绪和性别的不同,而呈现出差异化、定制化的功能和服务。要充分体现出这种定制化、差异化,就要求设备在登录时,能够判断出使用者的情绪状况和性别。从而把功能、服务调整到让用户最舒适的状态。

SpeakIN的系统完美实现了这个检测。

3. 人声分离与噪音隔离

最近网上流行着一个跟声音识别有关的段子----发现同事在使用声控电脑,我走上去大喊一声“全选、删除、保存!”,喊完就跑。。。

这个段子其实也反映了声纹识别领域内的一个重要问题:如何才能让设备越过噪音背景,精准地识别特定用户的声音?

SpeakIN开发的技术,其优越之处就在于能够很好地破解这个难题。不但能从噪音中精准区分人声,而且还能将多个人的声音单独抽取出来。

关键在于人工智能,SpeakIN是一个AI技术公司

实现上述的这些重要功能,关键还是要靠人工智能技术。

无论是判断用户的声音是否伪造、复制,还是判断用户的情绪,抑或是从庞杂的背景噪音里精准识别出用户的声音,都需要系统具备高度的智能。

SpeakIN公司的关键技术,建基于深度学习的iVector技术。他们已经实现了大规模工业级的声纹识别系统,并且实现了高识别率和高抗干扰性,其声纹提取、验证的速度和准确率在行业中遥遥领先。

被谷歌眼镜启发的创始人

陈昊亮,SpeakIN的创始人兼CEO,曾经在谷歌眼镜的人机互动项目组里工作过。那段经历让他对可穿戴式设备有了极深的体会。他敏锐地察觉到可穿戴式设备将来必大行于世,而与其相匹配的声纹识别技术也必然拥有庞大的市场。

SpeakIN凭什么拿到上亿融资?——声纹识别做到了国际领先

2015年创业后,SpeakIN已经云集了大批顶尖的人工智能、声纹识别算法和机器学习领域内的专家学者。今后他们将针对更多的行业进行应用场景的定制开发,促进声纹识别技术的进一步发展。

本次融资领投方IDG资本方面则认为,SpeakIN专注的声纹识别技术是人工智能时代的重要组成部分。而这种技术在中国的应用场景将会越来越丰富,发展前途令人乐观。


分享到:


相關文章: