百度Duer OS 3.0 是“新一代”的操作系统?还差点儿

一年后,同样的地点,李彦宏重新回到台前,大声宣告“Everyone Can AI”,并展示了各个业务线上的成果。

相较于上面的种种成果,去年重磅发布的Duer OS今年显得存在感稀薄,因为除了“打通商业模式闭环”启动商业分成这一点外,并没有吸引到媒体的关注。

但实际上,Duer OS 3.0不仅带来了核心技术方面升级,还提供超过20多个跨场景、跨设备的解决方案,同时为合作伙伴打造平等赋能的生态环境并努力构建商业模式的闭环。就如同官方所说,Duer OS 3.0是“新一代的操作系统”。

百度Duer OS 3.0 是“新一代”的操作系统?还差点儿

渡鸦输掉了战役,但Duer OS没有输掉战争

渡鸦音响彻底凉了,而无论是天猫精灵、小米小爱还是腾讯听听,都在用的是思必驰的解决方案。渡鸦输掉了战役,但是Duer OS并没有输掉战争。因为除了智能音箱外,Duer OS还和美的、海尔、联想、VIVO、TCL等众多领域的知名企业达成合作,将DuerOS的对话能力应用到了多场景。

截止 2018 年 6 月,Duer OS智能设备激活量已经超过 9000 万,月活跃设备超过 2500 万。Duer OS平台生态持续扩大,合作伙伴数量已经超过 200 家,搭载 Duer OS落地的主控设备超过 110 多款,在 DuerOS 平台上的开发者群体已经超过 16000 人,这三个数据均为国内第一。

划时代的自然对话交互

划时代的自然对话交互是两方面的,一个是核心技术的提升,另一个是跨场景跨设备的解决方案。

在核心能力的部分,Duer OS 3.0带来了情感语音播报、声纹识别、智能引导与纠错、视觉搜索能力、视频理解能力等自然语言交互技术的全面升级。

WaveNet+拼接让小度播报的流畅度和自然大幅度提升,声纹识别为用户提供个性化的交互体验,系统增加了为孩子设计的儿童模式以及支持连续对话无需重复唤醒的极客模式,另外增添了视觉搜索能力与视频理解能力。

最让现场观众惊叹的是儿童模式与视频理解能力。在主办方的演示中,儿童模式不光声音、内容与交流方式不同,而且在播放视频的时候还能智能跳过不适合少儿观看的镜头。而视频理解能力支持实体识别、场景识别、动作识别与视频生成,在演示中,可以实现视频中的台词甚至剧情的搜索跳转。

在场景与解决方案的部分,Duer OS 3.0提供包括有屏设备解决方案、蓝牙设备解决方案和行业解决方案等在内超过20个跨场景、跨设备的解决方案。 有屏设备解决方案不只是增加了一块屏幕,实际上很多机器对人的输出最高效的实现形式其实是图文视频,比如导航线路的规划,如果语音播报,可能需要花费一分钟以上。

Duer OS的有屏设备解决方案,是一个以语音交互为中心、软硬一体化的全链条解决方案。通过一块只有名片大小的模组方案,合作伙伴的屏幕设备就可以被打造成一个可以对话的有屏设备。同时,DuerOS还联合洛可可,为合作伙伴提供不同场景、完整的有屏设备参考设计。

百度Duer OS 3.0 是“新一代”的操作系统?还差点儿

Duer OS行业解决方案,已逐步覆盖酒店和养老场所等场景。以洲际酒店为例,宾客可以通过语音控制客房智能家居控制、设闹钟、查信息、获取酒店应用服务等。

此外,Duer OS还提供安卓APP的语音交互解决方案,通过音语义一体化、场景注册等技术,实现场景自适应,降低安卓开发者进入AI行业的准入门槛。如在麻将类游戏中,通过吃、碰等语音进行操作。

对话式内容服务生态

AI时代,用户获取内容与服务的门槛越来越低,Duer OS技能开放平台支持以自然交互为主、多设备、多形态的技能开发,以需求为中心,打造直达用户、张口即得的用户体验,并为开发者打造健康、开放、共赢的生态。

Duer OS 3.0提供包含基础工具、有屏技能工具和付费技能开发等全面的技能开发工具;推广方面,以技能商店、小度在家home card与query推广作为分发入口,精准推广来自开发者的优质技能。

作为国内首个支持带屏技能开发的开放平台,Duer OS技能开放平台/小度技能开放平台已汇集超过16000名开发者,上线技能超过500个,技能类型数量超过15种,成为国内最具活力的技能开放平台。

用户只需说出“我想唱歌”,搭载Duer OS的设备就可以打开“唱吧”, 用户说一句“我想学英语”,在线少儿英语平台VIPKID就会打开。随时随地,不需要像在其他设备上打开特定的APP。

百度Duer OS 3.0 是“新一代”的操作系统?还差点儿

打通商业闭环

Duer OS 3.0有两种变现形式,一种是技能内付费,另一种是付费技能,相当于内购制与买断制。开发者可以自行选择。会上Duer也宣布了与凯叔讲故事和Discovery的合作。

为了更好的鼓励开发,Duer OS还提供了对话技能大赛以及亿元开发者支持计划,提供开发资金传播资源,云服务器教育成长以及流量支持孵化基金等形式的支持。

观察:商业闭环与屏幕共享仍需努力

未来图灵认为Duer OS 3.0的确可以称得上是新一代操作系统,但是在两个方面仍然需要努力。 第一个方面是商业闭环的部分,用户付费的实现的形式是扫描屏幕的二维码支付,而不是声纹支付。官方解释说,这是为了避免操作失误。但这个理由的确很牵强,因为如果声纹技术足够好的话,这个问题是不存在的。更何况,官方也承认,想利用户的“冲动消费”,明明可以“一句话的事”,却要让用户拿起手机扫二维码,那种冲动又不知道要冷却多少。

商业闭环的第二点,就是是否有足够的动力让用户内购。官方的宣传片中,用户在一个听歌曲猜歌名的游戏中购买了道具。手机上的游戏、小程序的内购,有一个重要的因素就是社交分享系统,可以购买道具刷分然后炫耀。但是智能音箱却不存在社交的要素。如果是一般用户的话,在听歌曲猜歌名的时候遇到问题,拿起手机后,想到的应该是用手机上的听音识曲软件去识别,而不是去付钱。缺少了社交的要素,很多的内购其实是不存在的。

商业闭环的第三点,就是场景不佳的问题,在官方的宣传片中,家长和孩子要看Discovery,告诉带屏幕的智能音箱,购买后两个人围着智能音箱去看,这其实是很魔幻的一件场景。如果能够实现屏幕共享,完全可以在手机上或是OTT大屏上去看,毕竟靠在沙发上看大屏,比弯腰盯着智能音箱的小且分辨率不高的屏幕要舒服的多。

第二个方面就是刚才提到的屏幕共享。实际上屏幕共享是去年谷歌就提到的一项技术。用户可以将Google Home的任何信息投射到自家电视上或者手机上以及一切和谷歌相连接的智能终端上面。

优质的内容可以投屏到电视或使用手机获取,另外一些日常的工具,屏幕共享也有很大的用处,以导航为例,当我们对智能音箱说导航时,我们的确想知道具体的路线,但是如果这条信息显示在手机上,或者是智能汽车上,会更加的方便。


分享到:


相關文章: