赶在农历年前,在西溪湿地北大门正对面的西溪壹号,开张了一个面积不大的「若琪科技馆」——不需要专人讲解员,佩戴好最新发布的 Rokid Glass 2 参观,可以了解所有「馆藏」背后的故事。
故事本身并不重要,更重要的,这个馆是作为 AR 眼镜的典型应用场景,让来访者对于 AR 技术的落地,能有更为生动的认识。
在展馆的门前,悬挂着两面旗帜,分别打着两个主题词——AI 和 AR。而在这两个主题词的下方,则是 Rokid 的两款「尖刀」产品:Rokid Alien & Rokid Glass,音箱和眼镜。
能为自己同时打上 AI 和 AR 的标签,同时拥有在语音和视觉的核心技术,并有能力推出一系列的软硬件产品,这对于 Rokid 这家成立仅有 5 年的创业公司来说,并不容易。
为什么 AI 之后是 AR?
早在 2015 年底 2016 年初,伴随着 Rokid Alien 的惊艳亮相,与众不同的外观设计、两个字的唤醒词、出色的人声,Rokid 颠覆了当年流行的家庭陪伴机器人的形象,甚至引领了次年才开始流行的智能音箱的设计。
随后,顺应了智能音箱的大潮,Rokid 还陆续推出了 Rokid Pebble 和 Rokid Me 等多款设计独特的智能音箱,并以语音 AI 开发板和 AI 芯片为载体,逐步开放了其全栈语音解决方案。
而正当人们在期盼其下一代「语音」产品的形态和能力时,Rokid 已经跳出了这个圈子,开始大秀其「视觉」能力:从 CES 2018 后,Rokid 陆续亮相了 Rokid Glass、Rokid Vision 两款智能眼镜。
我们可能不止一次的和 Misa 聊过,为什么在 Rokid Me 之后,没有其他音箱产品的规划?Misa 很肯定的回答:
相比智能音箱,AR 想象空间更大。
AR 将成为手机之后新一代交互平台,而 AR 眼镜则是继 PC 和智能手机之后的下一个可以承载人机交互的最佳产品形态。
在众多的 AI 公司里,Rokid 是为数不多的从语音直接转向做 AR 的公司。没有去做诸如时下大热的 TWS 耳机、或相对容易一些的音频眼镜的产品规划,而是直接切入 AR 眼镜,这可行吗?
对于 Rokid 而言,无论是技术储备还是产品规划,做挑战最大的,走在交互创新的最前面,才有机会。
AR 眼镜离消费市场还有多远?
很多人受到了科幻电影以及一些硅谷先行者的熏陶,对 AR 眼镜有很高的期待。尤其是在 Google Glass 过早在大众市场进行高调宣传后,人们对于 AR 眼镜的第一反应就是它应该是像手表、耳机、眼镜一样,是日常可穿戴的。
但现实是迄今为止仍没有一款 AR 眼镜真正量产走向消费者。即便是苹果公司的 AR 眼镜,也迟迟没有推出。AR 眼镜离消费市场还有多远?
消费者的期待很大,与硬件能够达到的能力,相差还是很远。toC 可能还有 3-5 年的时间,就算你拿 100 亿补贴砸进市场也是无济于事,消费者还是不会买单。
既然 AR 眼镜的现实情况是硬件和软件的挑战都很大,Rokid 会如何做?
AR 产业空间巨大,在爆发节奏上,toB 硬件将先于 toC 硬件,在 toC 硬件成熟之前,Rokid 将聚焦于商业领域的应用与落地。
Rokid 要做的,是在 AR 普及的早期,将产品进行沉淀,把软硬件和交互体验打磨到最好,即便是在行业应用领域,也要有消费级一样好用的体验。
那么 AR 眼镜真正普惠大众,需要多长时间呢?
今年是起点,我们还需要 5 年。
为行业设计的 AR 眼镜应该是什么样子?
对于进入行业市场,有一点很重要:
并不是产品有硬伤,就只能退居行业市场,而是行业市场的需求更大。
最新发布的 Rokid Glass 2 是一台面向行业市场的 AR 眼镜,采用分体式+可折叠设计,支持免唤醒语音,支持触控和头控多模态交互,并为行业用户提供了诸多扩展能力。
为什么 Rokid Glass 2 是「为行业而生」呢?
因为在产品设计之初,几乎所有对前代 Rokid Glass 的迭代更新和功能定义,需求都是来自行业客户。
这样一来,当我们拿起 Rokid Glass 2 和一代眼镜对比是,很多问题就有解了:
为什么将原来的「一体机」方案替换为不够炫酷的「分体式」?
每一个技术的每一个链条和分支,都蕴藏着许多有待挖掘的应用,而这些应用场景的想象空间也远比我们想象中的要大。客户需要长续航。增加了的 Dock 不仅内置了 10000mAh 大电池,延长续航时间长达 8 小时,还支持 4G、GPS 等扩展模块,以满足不同行业的特定需求。
为什么要有免唤醒的语音操作?是因为黑科技耍酷吗?
因为工厂需要。在安防、工业等场景,用户「只能动口,不能动手」的需求摆在那里。
为行业设计的 AR 眼镜体验如何?
在现场的工业场景演示中,我们看到「工人」可以通过语音命令「我的相机-拍照」操控 Rokid Glass 2 拍照;如果需要查看图片或者文件时,也可以直接使用语音调出文件;同时,语音命令词并辅之以头部姿态控制,实现图片的放大、缩小、翻页、锁定画面等操作。
这一系列的炫酷操作的同时,「工人」的双手都是解放出来的,并且基本能够实现话音一落功能便实现的效果。
甚至,在增加了工业场景的刺耳噪音后,Rokid Glass 2 仍能准确拾取佩戴者的指令声音。而在遇到故障的时候,语音连线中央控制室的「同事」进行云端远程协助,视频和声音画面的传输亦能做到实时。
这些,恰恰是头几年 Rokid 在语音离线识别、免唤醒、近场定向、降噪等技术积累的体现。
Rokid 的新品是否代表了目前行业的最高水平,你们体验后就知道了。
Misa 带着我们熟悉的骄傲,自信的说。
从行业中来,又如何落地到行业中去?
像开篇提到的科技馆,乃至展览馆、博物馆,就是 Rokid Glass 的典型应用场景。除此之外,安防、工业、教育等行业还有很多 AR 眼镜的用武之地。
作为经历过 PC 和手机产业革命的人,我认为 AR 产业的增长,将会首先从中国开始。
Misa 带着团队抓着这一波机会,一手打磨产品体验,一手推动产业落地。
从去年 Rokid Glass 小规模量产后,我们就陆续看到很多案例:成为乌镇互联网大会安保战略合作伙伴,宣布与菜鸟战略合作落地物流行业,亮相赛诺菲首届数字医疗创新峰会试水 AR+医疗,被司法部部长点名助力 AR+智慧戒毒......
就在春节期间,在举国上下都在抗击新型冠状病毒肺炎的疫情的时候,Rokid 向疫区一线执勤人员送出了 AR 眼镜设备及相应的配套应用软件。
△ 2020 年 1 月 30 日,衢州常山高速口防疫检查站,执勤人员利用 Rokid Glass 对来往车辆进行核查
在防疫检查站点,执勤人员佩戴 Rokid Glass,就能够在一米的距离外,避免跟车内人员的直接接触,而快速识别通行车辆和人员的信息——通常 1~2 秒就可以确定一个人的身份,特别是户籍身份,判断是否和疫情高发区存在联系,识别潜在风险。
△ 2020 年 1 月 30 日,杭州留下检查站,执勤人员利用 Rokid Glass 对来往车辆进行核查
Rokid Glass 针对暗光、动态环境进行了专门优化。即使天色变暗,依然能够保持 90% 以上的识别率。
△ 专为 Rokid Glass 2 配备的一套近视镜片
为了实现更好的用户体验,Misa 说:
产品场景还需要在一线继续打磨。
主笔:陳壹零 / 深圳湾
閱讀更多 深圳灣 的文章