从双目视觉到三维目标的端到端重建，哈工大、商汤等顶尖研究员共同提出最先进的重建水平

2019-10-29 08:22:43 將門創投

From: arxiv 编译: T.R

近年来，基于单张RGB图像重建三维形状的任务在深度学习的帮助下取得了一系列突破性进展，但这种方法在很大程度上受限于训练数据集的种类，在针对未知物体的重建中模型的性能会发生大幅度退化。好在双目视觉天然包含了物体的深度信息，在双目信息的补充下将极大地提升三维重建的效果。当今多镜头智能手机的普及也让双目信息更容易获取。

为了探索基于双目视觉的三维重建方法，来自哈工大、商汤、厦门大学和鹏城实验室的研究人员们共同提出了一种直接从双目图像中重建目标三位结构的端到端方法，通过探索双边时差和两个视角下图像特征的对应关系来重建目标的三维点云/体素表示，在多个指标上达到了最为先进的的重建水平。

基于双目图像重建三维形状的端到端方法

虽然近年来单视图恢复三维形状的工作取得了一系列突破，但针对这一病态重建问题，具有视差信息的双目图像会更为可靠。在这一研究中，研究人员充分利用了双目图像间的双边视差信息及特征的对应关系，通过三个模块的学习重建出了目标的三维结构。

模型的结构如下图所示，根据最终输出三维形状的格式不同，分别得到了Stereo2Point 和Stereo2Voxel 两个子模型。

从双目视觉到三维目标的端到端重建，哈工大、商汤等顶尖研究员共同提出最先进的重建水平

模型一共由三个功能子模块构成，分别是从双目图像进行视差图重建的DispNet-B模块、进行特征编码的RecNet-Encoder和解码获取三维信息的Decoder，以及从图像特征中获取对应两个视角下对应关系的CorrNet。

下面就让我们来深入网络内部探索它是如何从双目图像重建高质量三维结构的。

整个模型的输入是两个视角下的双目RGB图像，而输出则是对应目标的三维结构，包括点云和体素两种形式对应着两种不同的解码器。首先，双目图像输入到了DispNet-B中得到各个视角对应的双边视差图。它由UNet结构构成，将输入的双目图像编码成1/8x1/8的尺寸，而后通过三个上采样输出两个视角对应的、与输入相同大小的视差图。与原始版本的DispNet不同，本方法中使用的视差网络DispNet-B可以在一个前传中计算出双边视差图。同时减少了每一层的通道数量，使得模型缩小为了原来的6%，大大提升了运算效率。

在得到视差图后，每个视角下对应的RGB图像和视差图像被分别送入到各自的编码器RecNet中，以便获取图像中特征的对应关系重建目标的三维模型。为了加速模型的收敛，这一模块使用了残差块作为基本的卷积模块。

在编码器部分，RecNet利用每个视角下各自的视差图和RGB图提取出8192维的特征向量。在解码器部分，两个视角下的特征向量与CorrNet生成的特征对应关系一起送入并重建出最后的三维表示。点云和体素两种形式对应着两种不同的解码器。

重建三维体素的情况下，解码器包含了9个上采样部分来从特征图生成32x32x32的体素空间，并在网络的最后添加sigmoid层来为每个三维栅格生成概率。在反卷积间添加了残差连接提高了训练的效率。

在重建点云的情况下，解码器包含了八个Fire模块和一个全联接层得到1024个点。其中Fire模块由序列1x1卷积和后续的1x1及3x3混合卷积构成，利用1x1代替了大量的3x3层。与PSGN模型相比，RecNet仅仅是前者的28%。

双视图间的对应关系是三维重建的关键所在。研究人员利用两个视角下RecNet的特征图构建了特征空间，并从中学习出了特征间的对应关系来获取立体视觉的几何信息。利用左右两个视图的平移堆叠使得网络可以在空间和视差维度对两个视角的特征进行充分的比较。在实现过程中，使用了3D-CNN结构通过九个三维卷积构成，并通过全联接输出4096维的关系特征向量。

在模型的训练过程中，使用了来自中间视差图的MSE作为视差损失，同时在三维重建阶段为体素和点云分别使用了体素的二进制交叉熵和点云的Chamfer距离来获得损失。

数据和实验结果

由于目前缺乏包含双边视差的双目三维数据集，研究人员基于ShapeNet数据集，通过开源软件Blender计算出了实验所需的双目图像、视差图和深度图，并为每个三维模型生成了32x32x32的体素和16,384个点，最终得到了1,052,976个数据样本。

在对模型进行充分训练后，可以看到在体素重建和点云恢复上都取得了十分优异的效果，对于细节表示地更为清晰，同时对于平面也不会出现异常的噪点。除了在性能上超过了先前的深度学习方法，与额外输入相机外参的多视角方法LSM相比也有着大幅度的提升。

最后研究人员还在真实数据Driving上进行了实验。通过bbox将图像中待重建目标区域剪切送入模型来进行重建。可以看到几个对比的模型算法重建的结果十分相似，无法区分出不同的形状，而本文的方法则有效重建出了三种不同类型的车辆。

如果想要详细了解模型的实现，可以参考论文：

https://arxiv.org/pdf/1910.08223.pdf

谢昊哲author：https://infinitescript.com

pix2vox：http://arxiv.org/abs/1901.11153

苏昊组 PSGN：https://github.com/fanhqme/PointSetGeneration

atlasnet：https://arxiv.org/pdf/1802.05384v1.pdf

Matryoshka Networks: https://arxiv.org/abs/1804.10975

三维体素化软件binvox：http://www.patrickmin.com/binvox/

在线数据集：http://www.hdrlabs.com/sibl/archive.html

LSM：https://www2.eecs.berkeley.edu/Pubs/TechRpts/2017/EECS-2017-199.pdf

点云方向博客：https://cloud.tencent.com/developer/user/5926470

-The End-

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构，旗下涵盖

将门创新服务、将门技术社群以及将门创投基金。将门成立于2015年底，创始团队由微软创投在中国的创始团队原班人马构建而成，曾为微软优选和深度孵化了126家创新的技术型创业
公司。

将门创新服务

专注于使创新的技术落地于真正的应用场景，激活和实现全新的商业价值，服务于行业领先企业和技术创新型创业公司。

将门技术社群

专注于帮助技术创新型的创业公司提供来自产、学、研、创领域的核心技术专家的技术分享和学习内容，使创新成为持续的核心竞争力。

将门创投基金

专注于投资通过技术创新激活商业场景，实现商业价值的初创企业，关注技术领域包括

机器智能、物联网、自然人机交互、企业计算。

在三年的时间里，将门创投基金已经投资了包括量化派、码隆科技、禾赛科技、宽拓科技、杉数科技、迪英加科技等数十家具有高成长潜力的技术型创业

公司。

如果您是技术领域的初创企业，不仅想获得投资，还希望获得一系列持续性、有价值的投后服务，欢迎发送或者推荐项目给我“门”: bp@thejiangmen.com 从双目视觉到三维目标的端到端重建，哈工大、商汤等顶尖研究员共同提出最先进的重建水平

将门创投

让创新获得认可！

bp@thejiangmen.com

分享到:

閱讀更多 將門創投 的文章

關鍵字: Blender 哈尔滨工业大学算法

榜单：人工智能榜，中美二分天下，百度、大疆、商汤、旷视上榜

商汤“AI智慧防疫解决方案”多场景落地，无感测温助力疫情防控

11.27 AI消费市场打开？WiMi微美全息、商汤、旷视等纷纷发布刷脸产品

阿里投资，商汤“撤退”，万亿场景电商的机会与壁垒

BAT高调ALL in AI背后，商汤、旷世等AI创企为何被集体唱衰？

苏宁与商汤科技战略合作，打造人工智能零售商业生态圈

艾瑞咨询：2018年中国人工智能手机行业研究报告

商汤科技：与山东省教育厅战略合作，促进人工智能在中小学全面推广普及

中国独霸全球人脸识别大赛依图科技包揽第一第二

官宣：介绍一下，这是我们浙江万维识别

09.18 商汤科技：智慧公共空间管理平台完成搭建

商汤科技创始人汤晓鸥：没有AI行业只有AI+

商汤 37 篇论文入选 ECCV 2018，开源 mm-detection 检测库

商汤科技获软银中国10亿美元投资，估值提升至60亿美元

08.27 商汤与中国电子技术标准化研究院达成战略合作推动AI标准制定

商汤与山西晋中市联手打造全国首个地市级人工智能高中教育基地

商汤科技携手瑞芯微打造AI人脸识别一站式解决方案

人脸识别需求激增，商汤、旷视等中国公司出海东南亚

商汤、旷视、云从、依图……谁能从AI国际队中突围而出

全球十大AI初创公司，今日头条、商汤、优必选、旷视、云从上榜

06.07 榜单：全球十大AI初创公司，头条、商汤、优必选、旷视、云从上榜

领跑AI行业商汤科技C+轮融资6.2亿美元

阿里巴巴领投商汤科技6亿美元，人工智能布局引出第三次世界大战

阿里领投商汤科技C轮6亿美元融资，加速AI布局

旷视收购艾瑞思商汤融资6亿美金谁能成为人脸识别领域的老大？

世界上最大的监控系统在中国：每天都在看着你

又融资6亿美元，商汤科技真的要成为独角兽了

商汤科技C轮战略融资6亿美元加速AI平台化战略进程

AI大牛汤晓鸥：AlphaGo之后大家还能做点什么？

ICDAR数据集刷榜捷报频频商汤团队多项任务世界第一

12月5号，这一天有几个人在密谋「克隆地球」

AI是人类的终结者吗？不，人类的终结者一定是人类！

AI驱动智慧城市新玩法？商汤西区交流会圆满落幕

商汤科技与上海签署协议进行全方位战略合作

商汤称IPO无时间表，这将掀起AI创业公司IPO潮

商汤科技「面部解锁」OPPO R11s 助力提升中国手机品牌竞争力

商汤科技与Qualcomm将展开合作共同推动终端侧人工智能发展

商汤科技林倞：持续创新深度赋能多方共赢助力中国AI崛起

手机上实现3D实时动画？3DV 2017三维视觉领域商汤有哪些黑科技？

商汤科技携手苏宁未来店 “AI之眼”打造智慧零售新体验

GTC CHINA 2017｜商汤科技AI解决方案助力智慧城市发展

商汤科技亮相GTC CHINA 携手英伟达共建智慧城市大脑

新加坡总理一行访问商汤科技商汤「刷脸」技术又俘获大牌粉丝

刷脸解锁很神奇？商汤早已破解了AI+智能手机的新玩法……

大咖AI聊｜商汤科技钱晨：人工智能需要真正落到实处

大咖AI聊｜商汤科技刘文志：你知道E=mc^2的奥义么？

小米太无耻了。

小米高管不只口嗨了，在国内拳打友商，在国外却开始下跪了。下一步，我猜小米会喊，高通爸爸，人家爱死你了，人家已经五体投地了哟。

蹭热点！说说我理解的手机包装盒事件。

今早醒来刷头条，发现大批米系自媒体铺天盖地发文嘲讽华为系自媒体，忍不住好奇了解了一下情况，原来是刚发布的一加8 海外版手机的手机包装盒上面印了一句话:with easy access to the Google apps you use most.而这句话也印在前段时间发布的小

苹果公司正式发布iPhone SE二代手机

新品名为“iPhoneSE”，拥有跟iPhone 8相似的外观，搭载了苹果当前最新的A13仿生芯片，具备IP67级别防水防尘能力，配备4.7英寸LCD材质屏幕，支持原彩显示，配备了Touch ID指纹识别。

华为河图、麒麟芯片和鸿蒙OS三驾马车并行？华为生态建设布局深远

至于受很多人关注的华为河图全面落地问题，官方有消息称，2020年第二季度会提供100个华为河图测试点，测试点到第四季度会增加至1000个，测试覆盖空间包括智慧园区、旅游景点、高铁站和机场等。

小米高管表示，四千毫安时 5G 手机，和三千多毫安时 4G 手机一样

小米科技高管卢伟冰在近日表示，5G旗舰手机如果5G网络全开，功耗会比4G手机高20%，4000mAh的5G手机大约等于4G手机的3200mAH；今年Redmi坚持把5G手机的容量控制在4500mAh以上，也是考虑到5G网络耗电大的原因，今年很多5G智能手机均采用大电池的设计。

5G画风变了：麒麟985落地首跑，荣耀坐上开往高端的「地铁」

荣耀30Pro/30 Pro+同时搭载麒麟990 5G SoC，相应的其它配置更高：Wi-Fi6+，支持红外遥控，USB 3.0 Type-C接口。

旗舰手机标配Wifi 6 换Wifi 6路由器的时机到了吗？

现在，家庭宽带都在500M左右，大部分手机也不支持Wifi6标准，换Wifi 6无线路由器有点早，因为换了Wifi 6无线路由器网速也不会变快。

2020年5G手机卖不动？继苹果砍单25%之后，华为小米纷纷跟砍？

都说苹果手机卖不动了，可我看想买iPhone手机的人还是那么多，不然之前苹果公司怎么会限购？数据显示，3月份在国内的 iPhone 销量比 2 月份激增 416%，达到约 250 万部。

干翻华为P40系列荣耀30也玩中

而今天的华为发布会上，荣耀30、30 Pro、30 Pro +3个版本中、大、特大杯齐亮相，又一片全新5G SOC，麒麟985也要登场。

程序员辞互联网工作，跨行传统上市公司，上班第1天就蒙了

原来男子是从事互联网工作，后面觉得是互联网寒冬来了，就坚决辞去互联网工作，跨行选择了一个教育传统上市公司，可是第1天上班就蒙了，公司让做的活儿太死板了，没有发挥空间，同事一点都不友善，领导不放权，而且管理线超级单一，氛围一点都不一样，所以想离职。

苹果发布新款iPhoneSE，3299元起售

北京时间4月15日晚，苹果正式发布了新款iPhone SE，搭载了A13仿生芯片，支持最新的iOS 13系统，支持 18W快充，也支持Qi无线充电。SE机型苹果到目前为止只发布了两款，这是iPhone产品体系里小屏和低价的典型机器。

我很纠结：我究竟适不适合做亚马逊电商？看了这三条你就知道了

请仔细阅读，关于跨境电商你想知道的都在这儿

政府对于跨境电商行业的大力支持给咱们广大跨境电商卖家吃了一颗“定心丸”。我们所做的跨境电商事业在一定程度上不再是为个人谋利益，而是成为了中国产品走向世界，为国家赚取外汇的主力军。

骗子手段太“精明”：商家赔了货物又赔款，亚马逊平台骗术大揭秘

在开始文章的干货分享之前，先给大家讲一个商家被用户勒索的案例。有一位朋友刚刚加入亚马逊跨境电商平台两个多月，在这期间有位美国用户在他店铺里面购买了一个毛巾架。

做跨境电商这么多年，今天才知道给国外客户发文件原来这么简单

做过跨境电商朋友肯定知道，很多国外客户对于有些商品看不懂说明书，想索要商品使用视频教程，毕竟视频信息量大，容易理解和快速上手。

值得收藏！三类卖家三种选品方案，总有适合你的一个……

网上很多所谓的“大佬”喜欢吹嘘用某某工具就可以迅速选品效率，迅速取得很高效率等等，其实这类人就是在卖软件，收培训费用…

万万没想到！亚马逊平台上面卖床单竟营收一个亿！你还在等什么？

做店铺这么多年，今天才知道我的listing突然被封，竟是因为……

亚马逊小白看过来！请采纳这些：亚马逊选品和运营的小建议

亚马逊卖家如何爆单？跨境精细化运营攻略必看

不收保证金、入住费、年费，还免三个月佣金，我也想入驻这个平台

咱们今天不说主打欧美市场的亚马逊，只谈一下以东南亚市场为主的Shopee。好多人都听说过，但是没有真正了解过，好多人想加入Shopee但是顾虑重重，今天我来给大家普及一下关于Shopee小秘密。

马云终于要辞职了，留下的话句句触动人心

去年，在教师节这天，阿里巴巴集团创始人马云今天公开信宣布：一年后的阿里巴巴20周年之际，即2019年9月10日，也就是今天，他将不再担任集团董事局主席，却留下句句触动心灵的话！！

等等，明年5G手机将迎来大降价

11月26日下午，联发科技（MediaTek）在深圳举办“联发科技 5G方案发布暨全球合作伙伴大会”，正式发布了全新的5G新芯片品牌——“天玑”，同时带来了首款集成式旗舰级5G移动平台——天玑1000。

微信公开课PRO版2019正在进行时，往届各自都有什么黑科技

微信公开课pro版2019，为期两天微信大会正在广州火热进行中，本次会议主题为：同行WITHUS。微信这一款超级应用，已经深入到我们生活的方方面面，所以这48小时的未来盛宴必将吸引无数眼球。

推出「信任分」升级「闪购」，美团本地生活这盘棋有多大？

小海按：美团的超级App梦想更近了？Tech星球文 | 马微冰陈桥辉头图 | IC Photo王兴曾说，“太多人关注边界，而不关注核心。”

5G我们超越了6G我们也将领先! 美国为什么会害怕失去5G领导地位呢

而且在我们国内和美企中，有相当一部分觉得我们研发不了5G，更特说超越他们了。由于，我们在科技领域一直是，装备一代，研发一代，探索一代。

界读｜华为：帮助英国共渡疫情难关，无端批评令英国蒙受损失

前段时间，英国首相呼吁员工在家办公的第二天，英国网络就出现大面积崩溃现象，不仅无法正常上网，而且电话也不能打、短信也不能发，给用户造成了很大的困扰。

为什么华为今天可以傲视群雄，在世界上立于不败之地？

为什么华为今天可以傲视群雄，在世界上立于不败之地？因为五年内没有人能超过整个5G领域，所以美国人无法超越，为什么？

血战「在线办公」，阿里、腾讯、字节、华为的底牌与大杀器

小海按：前端杀手级应用，后端云服务，在线办公「四小龙」之战开启。本来，在线办公更多的是阿里巴巴的主场。

2020年最强拍照旗舰来了华为P40系列多项业界首创香！

原来华为P40Pro+在上一代P30 Pro潜望式镜头横置长焦镜头模组和感光器件基础之上，进一步采用全新的多反射潜望式光路折叠技术，实现5次反射光路，光程比上一代潜望式长焦提升178%。

今天聊一聊直播

今天聊一聊直播突然谈到这个话题，是因为后知后觉的我，突然发现几乎所有大互联网公司都进军了网络直播行业，或者正在准备进军直播领域。

通过直播赚钱不容易，既要豁得出去，又要端得起来

今天咱们继续聊一聊直播吧当下，像头条、网易、百度等公司，看上去和直播八竿子打不着的公司，也开始涉足直播了。

AI和自动化技术联手，最终会让60%的工人失去现有的饭碗。

并非危言耸听，AI和自动化结合，势必会把数十亿人类踢出劳动力市场，数量巨大的失业工人，将会构成一个规模庞大的新阶级。AI最终会让60%的工人失去现有的饭碗。

这个网还能不能好好上了？今日全球IPv4地址正式耗尽

长期以来，一直令人担心的IPv4地址耗尽的问题，今天这一刻终于发生——所有43亿个IPv4地址已分配完毕，这意味着没有更多的IPv4地址可以分配给ISP和其他大型网络基础设施提供商。

12306系统不行？内行人告诉你它有多牛，阿里腾讯高手去了也膜拜

很多人认为12306系统很不好，之前我也是这么认为的，因为我觉得像双十一这么大流量，阿里都能承受住，为什么12306不行，这其实是误解，12306拥有着神一般的架构设计，平时的压力比淘宝大的多。

有内幕？美国防部授与微软百亿云合同，亚马逊不满发起诉讼

据路透社消息，10月25日，美国防部将高达100亿美元的十年期战略合同授予微软公司，这一举动引起亚马逊的不满。

未来之芯--RISC-V总部从美国迁往瑞士，华为、阿里是其成员

北京时间26日消息，国际开源芯片技术组织RISC-V基金会周一宣布，由于担心美国的贸易限制，计划将总部从美国特拉华州迁往瑞士。该基金会首席执行官卡利丝塔-雷蒙德（Calista Redmond）表示，希望确保美国以外的大学、政府和企业能够帮助开发其开源技术。

神话还能继续吗？几度过山车，比特币半年来首次跌破7000美元

比特币价格今年如同坐上过山车，年初的3000美元到最高13861.9美元，今天跌破7000美元，算是这半年来的最低点了。说起比特币，给人印象最深刻的，莫过于2017年末到2018年初的暴涨了吧。

刘强东卸任后，突然宣布一个“好消息”，让马云措手不及！

苹果的疯狂其实从未停止，AirPower或将重新启航

可是，苹果事实上一直都在推动终端产品进入全面无线时代，所以他们是不太可能在真正意义上放弃这款产品。有外媒称，苹果目前正准备重新启动AirPower项目。

曾保护近4亿中国人的电脑，却因得罪阿里、腾讯，惨遭市场淘汰

曾保护近4亿中国人的电脑，却因得罪阿里、腾讯，惨遭市场淘汰随着网络的不断发展，如何确保网络信息安全成为人们十分重视的问题。

互联网流量需求增大希腊民众“宅生活”考验网速

英国咨询公司Tech4i2报告指出，在疫情期间，希腊的互联网流量需求至少增长50%，但网速仅下降1.2%，而在大多数欧洲国家，网速平均下降了5%-7%。

互联网科技企业，传统办公模式该走向何处?

　　纽约，处于美国疫情震中的城市，工作模式大多是使用公司发放的电脑进行远程办公，而在这之前，部分互联网企业本来默认每周三为在家办公日，所以大家对在线办公可以说驾轻就熟。

微信又悄悄上线一新功能～网友却开始担心

备注后的群聊名称仅自己可见往后再也不用为分清乱糟糟的微信群聊而困扰不过从目前来看只有iOS端上线了这一新功能安卓用户还需要再等等并且此次更新为后台更新无需到AppStore更新即可看到这个新功能该功能上线后网友们纷纷站队但也有网友视野开阔担心起另一件事对于微信新功能群备注你觉得实

正式确认！孙正义退出市值5959亿阿里，20年与马云成就彼此

文：小娜说到孙正义这个名字，我们很多人都知道他是日本软银集团的创始人兼总裁，但他除此之外也有另外的身份，那就是阿里巴巴最大的董事之一。阿里之所以成为今天的阿里，与孙正义的投资是分不开的。当时，马云和孙正义仅仅交谈了五分钟，孙正义当即就决定投资阿里，而且一下就投资2000万美元。

科技添柴“非接触经济”升温

新华社记者王全超摄中国同拉美和加勒比国家举行视频工作会议，就新冠肺炎疫情防控开展交流。亚历山大·培尼亚摄在中国科学技术大学附属第一医院，乘客用“无接触电梯按钮”操作电梯。

好像在哪见过？华为nova7官宣余承东:何必只有一点点

全新iPhoneSE根据此前爆料，此次华为nova7系列将有nova7 SE、nova7和nova7 Pro三个版本，可能会采用“麒麟985+麒麟990”或“麒麟820+麒麟985+麒麟990”两种芯片组合。

行业红利、资本涌入，疫情后的在线教育聚师网如何“涅槃”

2018年，线下培训机构受到了相关部门政策的影响，整体发展势头趋降，然而市场上对于教育的需求却在不断增加，于是，大量学员开始把需求放到了线上，其中，职业教育在这方面的变化尤其明显。

数字货币真的来了？首吃螃蟹者传出，碰一碰功能露脸

苏州相城区政府相关人士对此未予置评，区金融局人士表示“不便答复”，其他多个当地机关单位称尚不知情，央行苏州市中心支行表示“以总行口径为准”，央行总行方面未予确认。新京报记者程维妙陈鹏编辑岳彩周校对薛京宁

实例 | 200 SMART运动控制基本指令详解

C_Dir:表示电机的当前方向信号状态，0 = 正向 1 = 反向。 START:触发开始发脉冲信号，必须要在运动轴空闲时发送一次信号，必须用边沿触发。