用VSLAM技术让机器看懂世界

【文/虞超】SLAM(同步定位与地图构建),是运动物体根据传感器的信息,一边计算自身位置,一边构建环境地图的过程,解决机器人等在未知环境下运动时的定位与地图构建问题。主要应用于机器人、无人机、无人驾驶、AR、VR等领域。

按传感器来分,SLAM主要分为激光SLAM和VSLAM两大类。随着计算机视觉的迅速发展,视觉SLAM因为信息量大,适用范围广等优点受到广泛关注。

不久前,一款专为机器人应用领域开发的VSLAM整体解决方案——Project Explorer问世。该平台利用现有的、基于鱼眼双目摄像头的VSLAM追踪解决方案,将RGB摄像头、深度摄像头和其他机器人相关的感应单元集成在一起,通过诠视科技的SDK接口,用户可以快速构建自己的产品。而高工机器人网也有幸接触到这款产品的背后主导者——诠视科技CEO林瓊。

■追寻“看世界”的梦

林瓊毕业于清华大学及美国南加州大学,从事图像传感技术15年,曾效力于东芝,APTINA,安森美等著名图像传感器公司。在过去的15年中,他始终带着“把世界看美”的追求,用传感器看世界。近些年林瓊发现,图像传感器正在发生着转变,“把世界看美”已经不算是挑战了,怎样用视觉技术“把世界看懂”成为新的挑战。在这样一种大的行业转变过程中,林琼看到了行业发展的新方向,加之自己多年的资源储备与人脉积累,他决定在接下来的15年里,让图像传感器“把世界看懂。”

用VSLAM技术让机器看懂世界

诠视科技CEO林瓊

“通过摄像机看世界,理解世界,看懂世界,包括我们做的环境感知,就是通过看世界来获知你的位置和姿态。位置和姿态实际上在很多应用领域当中都是被关注的焦点。”林瓊说,“看懂世界”包括对物体的识别,以及对环境的认知,这两者都必须基于视觉技术来实现。“我的工作经历中包含了计算机视觉的技术背景,怎样让计算机视觉在今后的15年里为人类服务,是我和我的团队想要解决的问题。”

据林瓊介绍,他和他的同伴们都在计算机视觉领域深耕超过十余年。“大家有共同的梦想,这是一个追梦的过程,所以我们的团队叫‘梦之队’。”林瓊笑着说。在当前阶段,国内的市场环境也在发生改变,对智能制造、机器人、AR/VR/MR等技术的需求也越来越大,“而我们恰巧能够服务于这些需求,因此大家辞去了高管的职务,置身于创业大潮中。”

公司最初创立于美国硅谷,去年在风险投资机构的支持下落地上海“在全球,我们的团队共计27人,在美国、欧洲和国内均有研发团队与技术支持,而且在过去的半年当中我们也通过了在AR/VR以及机器人领域的市场验证,与多家知名企业进入design in阶段,赢得了客户的信任。”

■用VSLAM看懂世界

为了把世界看懂,就必须解析这个世界,而VSLAM恰巧是其中的一个核心技术。此前VSLAM始终没能迎来爆发,很重要的一个原因是这种技术需要庞大的算力来支撑,而将这项技术进行高性价比的产品化是一个极具挑战性的难题。“很幸运的是我们在一年多以前和Intel进行了合作,Intel的高速视觉处理器VPU能够承载我们所需要的高速算法,而且体积轻巧,性价比高。”

用VSLAM技术让机器看懂世界

“计算视觉是个快速成长的领域”林瓊说,在过去的15年他看到过很多视觉算法的应用,在视觉计算中,VSLAM难度高,挑战大,需要硬件与软件的紧密结合,同时这又是一项单元技术,可以直接适用于很多领域,例如AR、VR、机器人和智能物流仓储等。

“传统的SLAM主要借助激光来实现,而VSLAM技术在空间定位与姿态追踪上可以用十分之一甚至更低的成本来实现同样的效果。但VSLAM有特定的使用条件——自然光与特征点,因此在一些特定的环境下,我们需要引入主动光来配合解决一些特定环境下带来的识别问题。”林瓊表示,和传统的SLAM相比,VSLAM的优势在于使用了视觉算法,可以提取空间属性,而传统的激光雷达则不具备这种能力。“因此我们在定位的同时,还能将环境的感知和认知结合起来,对于空间尺度、障碍物的判断是非常准确的。”

诠视科技最新的针对机器人领域的整体解决方案Project Explorer,已能够准确探知自己所处的位置,同时清楚判断周围的环境。最独特的一点是,这些功能都可以在一个小小的模组内本地化解决。“本地化数据处理可以帮助机器人不再依赖于主机,小小的模组可以直接输出其在所处三维空间中的6DOF坐标数据,甚至识别周边物体的属性,而将这样一款产品小型化集成化,也是我们创始人团队多年的梦想。”据林瓊介绍,这款产品的整体功耗极低,不超过1.8瓦。

用VSLAM技术让机器看懂世界

ProjectExplore拥有小巧的体积

在确定了超高速、低功耗、高精度以及高性价比这一目标后,林瓊和他的团队用了一年时间,打造出了这款产品,目前除AR、VR外,已能应用于工业机器人、无人机、AGV、游戏、3D重建等领域。

■VSLAM处在应用爆发的前夜

“VSLAM是一个学术界研究了很久的领域,有很多开源的东西。开源的好处在于给研究者提供了基本的平台,但如果需要进行超小型产品化,那还是需要有核心的技术。而开源想要实现这些目标,则必须花大量的时间去移植平台。”林瓊表示,自己的团队在行业内的领先之处则在于,全部的核心算法和核心硬件、实施,核心的工艺制造流程都是自主研发,因此在产品的速度、精度、适应性以及鲁棒性都非常好。

用VSLAM技术让机器看懂世界

VSLAM应用处于爆发的前夜,未来在室内定位、追踪等场景均可以使用,由于体积小巧且具有很高的性价比,该技术可以解决很多传统激光传感器无法解决的问题。林琼强调,如果再将一些小概率场景问题解决好,VSLAM甚至有可能全面替代激光。特别是在机器人领域和AR设备中,基于双目的VSLAM设备将成为不可或缺的存在。

“机器视觉对计算的要求很高,特别是对计算平台的要求,因此我们选择与Intel进行合作。”林琼说:“我们已经看见黎明的曙光。如果接下来的几年中,半导体的成本,功耗还能进一步的下降,那么各种应用将会铺天盖地的出现。”

“VSLAM当前也面临着一些挑战,例如弱光环境,以及一些其他的小概率事件,虽然这些情况在激光传感器上也同样存在,但后者已经在产业中经历过验证,而VSLAM恰恰还处于验证的过程当中。”


分享到:


相關文章: