MIT PixelPlayer可以“看到”声音来自哪里_科技 _ 頭條網

“鸡尾酒会效应”描述了人类在嘈杂的环境中进行交谈的能力，通过倾听交谈对象所说的内容，同时过滤掉其他的噪音、音乐、环境噪音等。我们可以自然地做到这一点，但是这个问题已经在机器学习领域得到了广泛的研究。

麻省理工学院 CSAIL 的研究人员最近介绍了他们的 PixelPlayer 系统，该系统已经学会识别在视频中产生声音的物体。该系统使用深度学习，并通过连续观看60小时的音乐表演进行训练，以识别视觉和听觉信息的自然同步。

研究小组训练了深层神经网络，使其专注于图像和音频，并识别视频中声源的像素级图像位置。

Pixelplayer 架构包括一个视频分析网络，负责将视觉特征与视频帧分离，一个音频分析网络，对音频输入进行编码，以及一个音频合成器网络，该网络通过结合像素级视觉和音频特征来预测声音。

Pixelplayer 的自监督混合和分离训练也使它能够不用人工干预就注释仪器特性。研究小组成员、前 NVIDIA 研究实习生 Hang Zhao 说，深度学习系统“能够知道哪些物体发出什么样的声音。”

研究人员使用了从 YouTube 视频中建立的 MUSIC (多模式乐器组合源)数据集来训练这个模型。 Music 有714个音乐独奏和二重奏的非后处理视频，以及11个乐器类别。 Nvidia Titan v GPU 芯片的处理能力允许 CNN 以非常高的速度分析视频。 “大约一天就学会了，”赵说。现在可以识别超过20种乐器。

可以提取单个乐器的音轨，使工程师能够分离和调整每个乐器的不同音高。赵补充说，“这个系统也可以被机器人用来理解环境声音。”

其他研究小组正在使用各种方法来解决鸡尾酒会的问题，包括开发助听器的深度学习技术。

麻省理工学院的 CSAIL 论文《像素的声音》发表在 Arxiv 上，该团队将在9月份的欧洲计算机视觉会议上展示他们的工作。更多的可以在 http://sound-of-pixels.csail.mit.edu/ 找到。

【翻译自https://www.hindustantimes.com/】

相關文章:

MIT、哈佛、伯克利等宣布停课，全球超3亿学生受疫情影响

02.27 入选《MIT 科技评论》十大突破性技术，“AI 药物分子设计”有望三五年内成熟

MIT：区块链投票系统Voatz存在一系列漏洞 极易受到攻击

MIT 的 RFocus「智能表面」可以将 WiFi 信号强化十倍

01.15 MIT:如何验证量子芯片是否做正确计算

12.22 文档分类太繁杂？MIT 和 IBM 联手，解决了这一难题

MIT 80万亿次平方运算加密难题，被小哥用家用台式机自学破解

折个纸惊动了军方！MIT“食人花”能抓起超100倍自重物体！

告别规范化！MIT 谷歌等提出全新残差学习方法，效果惊艳

超越波士顿动力，世界首个实现四足后空翻的机器人：MIT猎豹

MIT“重塑”计算与人工智能学院，迎来成立70年最大架构变化

70 年来最大变革，MIT 斥资 10 亿美金建设 AI 学院

美帝放大招，MIT+纯种美企，重写全球半导体产业

创维入场厨电行业，主打 AI 牌；MIT 宣布研发出识别人类情绪 AI，准确度达60%丨AI掘金晚报

MIT：我们用深度学习开发了一个个性化的自闭症治疗机器人

MIT 做了只 “盲豹” 机器人，爬楼梯腾空跳全无难度

MIT 机器人：不用视觉，通过触感也能爬楼梯

麻省理工学院(MIT)的猎豹机器人，沿着布满垃圾的楼梯走上去

MIT TR 2018全球35岁以下科技创新35人，旷视科技CEO印奇入榜

06.29 燃！没上过大学，支付宝工程师入选全球科技青年英雄榜

06.28 祝贺｜蚂蚁金服技术人许寄入选2018 MIT TR 35全球榜单

祝贺｜蚂蚁金服技术人许寄入选2018 MIT TR 35全球榜单

MIT 开发廉价闪存设备，处理图数据性能堪比服务器

山西财经信息网-山西新闻网财经频道-晋商唯一的官方新闻门户

小米太无耻了。

蹭热点！说说我理解的手机包装盒事件。

苹果公司正式发布iPhone SE二代手机

华为河图、麒麟芯片和鸿蒙OS三驾马车并行？华为生态建设布局深远

小米高管表示，四千毫安时 5G 手机，和三千多毫安时 4G 手机一样

5G画风变了：麒麟985落地首跑，荣耀坐上开往高端的「地铁」

旗舰手机标配Wifi 6 换Wifi 6路由器的时机到了吗？

2020年5G手机卖不动？继苹果砍单25%之后，华为小米纷纷跟砍？

干翻华为P40系列 荣耀30也玩中

程序员辞互联网工作，跨行传统上市公司，上班第1天就蒙了

苹果发布新款iPhoneSE，3299元起售

我很纠结：我究竟适不适合做亚马逊电商？看了这三条你就知道了

请仔细阅读，关于跨境电商你想知道的都在这儿

骗子手段太“精明”：商家赔了货物又赔款，亚马逊平台骗术大揭秘

做跨境电商这么多年，今天才知道给国外客户发文件原来这么简单

值得收藏！三类卖家三种选品方案，总有适合你的一个……

万万没想到！亚马逊平台上面卖床单竟营收一个亿！你还在等什么？

做店铺这么多年，今天才知道我的listing突然被封，竟是因为……

亚马逊小白看过来！请采纳这些：亚马逊选品和运营的小建议

亚马逊卖家如何爆单？跨境精细化运营攻略必看

不收保证金、入住费、年费，还免三个月佣金，我也想入驻这个平台

马云终于要辞职了，留下的话句句触动人心

等等，明年5G手机将迎来大降价

微信公开课PRO版2019正在进行时，往届各自都有什么黑科技

推出「信任分」升级「闪购」，美团本地生活这盘棋有多大？

5G我们超越了6G我们也将领先! 美国为什么会害怕失去5G领导地位呢

界读｜华为：帮助英国共渡疫情难关，无端批评令英国蒙受损失

为什么华为今天可以傲视群雄，在世界上立于不败之地？

血战「在线办公」，阿里、腾讯、字节、华为的底牌与大杀器

2020年最强拍照旗舰来了 华为P40系列多项业界首创 香！

今天聊一聊直播

通过直播赚钱不容易，既要豁得出去，又要端得起来

AI和自动化技术联手，最终会让60%的工人失去现有的饭碗。

这个网还能不能好好上了？今日全球IPv4地址正式耗尽

12306系统不行？内行人告诉你它有多牛，阿里腾讯高手去了也膜拜

有内幕？美国防部授与微软百亿云合同，亚马逊不满发起诉讼

未来之芯--RISC-V总部从美国迁往瑞士，华为、阿里是其成员

神话还能继续吗？几度过山车，比特币半年来首次跌破7000美元

刘强东卸任后，突然宣布一个“好消息”，让马云措手不及！

苹果的疯狂其实从未停止，AirPower或将重新启航

MIT：区块链投票系统Voatz存在一系列漏洞极易受到攻击

干翻华为P40系列荣耀30也玩中

2020年最强拍照旗舰来了华为P40系列多项业界首创香！