京东重点发展AI技术 前微软研究院DLTC负责人何晓冬加盟

京东重点发展AI技术 前微软研究院DLTC负责人何晓冬加盟

京东集团AI平台与研究部AI研究院常务副院长

在传统零售转向无界零售进程中,具备天然优势的互联网新兴企业之一京东,打了许多胜仗。面对人工智能强劲来袭,京东开始布局AI技术转型,刘强东在公开场合上强调过,人工智能既是一种技术,也是一种思考方式,京东的下一个12年只有技术。人工智能更是未来几年发展的关键技术之一。2018年初,京东笼聚一大批人工智能、大数据、云计算领域重量级国际顶尖专家,何晓冬就是其中一位。

今年3月,前美国微软雷德蒙德研究院主任研究员及深度学习中心(DLTC)负责人何晓冬博士加盟京东,担任AI研究院常务副院长。4月12日,何晓冬接受「科创者说」采访,这是他履新京东后,首次接受媒体专访。

据「科创者说」了解到,在来京东之前,原IBM Watson (沃森)首席科学家周伯文博士对他的影响非常大,两人沟通过很多次。在他看来,一方面周伯文博士作为学术界知名研究者加盟京东,是一位很好的榜样,另一方面,人工智能在国内发展迅速,这离不开政府的支持和推动,京东现在的发展非常迅猛,企业日常积累大量发展人工智能技术所需的数据,通过人工智能技术结合无界零售的场景及数据将会有非常大的发挥潜能。“以前的学术圈以算法研究为主,现在AI的研究是三位一体,算法牵头驱动场景落地,产生的数据会反哺算法,这本身有很大的价值。”何晓冬说。于是他决定离职微软,回国工作。加入京东后,主要负责深度学习和语音语言实验室。

何晓冬从AI技术、实验室未来规划等层面回答了记者提问。

问:您在微软雷德蒙德研究院任主任研究员,还担任深度学习技术中心负责人?您觉得到京东几个月以来和以前的职责方面有什么变化?

何晓冬:职责范围扩大了,不管是组织还是业务比原来大了不少。但不变的是,专注于基础研究,以及基础研究的创新应用。这两方面是我一直很关心的。在京东以后我还会对研究和产品应用都有很多关注。

研究方面我们会推进最先进的基础研究,包括语言智能和深度学习,如如何从专有的学习方式变成通用的学习方式。如自动化建模,不光专家设计模型的结构,而是整个模型设计,或者模块化组合模型都能自动化,这也是很前沿深度学习方面的研究。

NLP(自然语言处理)方面我们想怎么用深度学习推动NLP很多问题的解决,包括长文本的创作,语意分析,自动问答等很基础的问题,希望用好的技术,在一些基础性问题上能够推进,能够解决。

工程方面,包括人机对话服务机器人、客服机器人,希望机器人能够提升跟人交流的智能。希望有情感的交互体验。其他的应用正在探索,比如智能硬件如音箱。

整体来看,希望“无界零售”不是只做一个交易的体验,而是不让消费者感觉到边界和限制,从而感受到消费过程的完美和舒适。

Q:整个京东在AI实验室发展规划和策略有哪些?

何晓冬:就实验室来说的话,我们就专注于深度学习和语言、语音,包括知识表达,信息检索,多模态(如文字与图像交互)等领域的一些重要的研究,希望能有引领性的突破和进展。同时我们也希望技术创新能赋能零售,物流,金融,智能云等产业,从而让技术落地。我们希望通过基础研究创造全新的技术能力,这是从0到1,我们也要持续打磨迭代提升技术,这是从1到N,我们还要把通用的人工智能技术赋能到广泛的产业场景,就像是从N扩展到无穷大。要做到这些我们需要很强的研究和工程队伍。而在京东除了负责实验室的基础研究,我还会负责一个工程团队。我们的团队还在迅速扩大,也希望志同道合的朋友加盟。

同时,我们也需要海外合作,不仅仅在北京,在硅谷我们也有分部。一个方面能够扩大接触范围,了解技术最新进展,另外也可以吸引当地人才,人才在哪里实验室就开在哪里。

此外,研究和产业我们都要突破,我们希望研究上能引领最新的基础的研究。包括人机对话,如何让交互更有温度,在研究上其实有很多的问题要解决。还有情绪方面,为什么人会产生情绪,情绪怎么解释,怎么结构化。

另外,环境计算,多模态智能,和基础算法上我们也会有很多事情想发力,比如对抗性训练,这也是一个比较重要的课题,我们也会有很多基础研究,这个课题其实可能会有很深远的影响,比如金融的欺诈和反欺诈、征信,再或者是物流领域和商业交流,如何评估信用度等问题。

其他的研究方向,比如机器学习自动化。现在机器学习的模型包括模型结构、参数、权重。现在的机器学习往往是让专家来设定模型结构,但实际上结构本身也是可以学习的,这样的话会极大的促进机器学习的效率,促进如何找到最好的模型结构效率。所以说,机器学习智能化本身是非常重要的研究方向。

Q:大公司有AI的实验室团队,现在创业公司像旷视、商汤做的也是迅猛发展,您怎么看待这样的创业公司在技术上跟大公司?

何晓冬:他们其实做的也很好很深,其实像旷视,孙剑博士我们以前很好的朋友,在微软都是同事也合作过很多项目,我也很钦佩他。对于创业公司来讲,资源比较紧张,为什么还要做研究?因为研究对于他们来说是公司生存的一部分,所以必须要做这一件事情。旷视商汤他们有很大的实验室,对于他们来说技术的进步就是他们的生命线。

另外,现在大概从深度学习起来以后,从研究到落地的过程极大的加快,特别中国更能感觉到,这个循环,从算法到场景和数据,已经被极大加快了。现在企业里,不光京东,或者旷视,研究到落地往往就是几个月的时间甚至更快,产品的正确率、速度、模型大小和计算量这些方面,所有的产业非常关心的问题,也是学术界非常关心的问题。换一句话说,学术界这些方面的进步往往可以很快的应用到产业上去。而这个过程中研究院是重要的一环,对于京东来说也一样,京东很多重要的产业问题就是研究问题,我们研究问题很多时候是产业上需要解决的问题。

像以前我和同事在微软做的深度结构语义模型(DSSM),做完之后很快用在各种微软产品上去,去年到北京访问的时候有几个朋友告诉我很多大公司也在大量使用。基础研究是普惠的。基础研究的进步对整个产业都会有帮助。 而最新的研究确实能够对场景有很大的促进,同时产生的数据直接促进研究员想更多更好的算法。

Q:面对其他企业竞争,您以什么样的目标或者心态加入到京东?京东AI研究院其他平台有何区别?

何晓冬:从建立研究院的角度来说,很多著名的企业像微软、IBM、谷歌建立研究院。我认为做基础研究不是锦上添花,而是成为高科技公司必需要的战略布局,必须有很深的研究,才能够保持高科技公司能够长远发展。AI成为一种思维方式,不光是听起来很酷,而是也意识到AI的基础研究对公司是基础性的,是支撑公司长远发展下去的。

具体到公司,每个公司的布局其实不太一样的,微软的布局和谷歌不太一样,比如微软基础研究部门基本独立于其他的产业部门,从而更加能够专注于基础研究,而最近一些年又有些调整,让基础研究落地更加有效。而谷歌研究和业务部门一直比较不分家,也做出了很好的研究及应用。

回到京东来说,京东看到了AI在战略上的重要性。京东发力稍晚,但是发力很快,研究院和AI平台部很快建立起来,人员也是到位的比较快,所以这个方面是京东的优势,弯道超车,可以省去一些以前的弯路AI做的更快,另外也看到怎样在京东做研究和工程结合的更紧密,AI平台研究部里面既需要基础研究也需要做AI平台,AI平台可以对公司内外进行各种平台赋能,这也是京东和其他公司做AI不太一样,或者有特点的地方。

Q:机器人这一块,您认为人工智能未来共情还有哪些突破?

何晓冬:情感和共情,还有同理心,这是非常重要进展很快的方面。最近很多的研究在于怎么检测人的情绪,高兴、悲伤还是愤怒。我们更进一步,在研究机器人能不能表达情绪,不但能够接受你的情绪也能相应表达情绪,对话和交互变的更加友好和温柔,或者更加有温度。

Q:如何看待腾讯翻译君在博鳌的翻译效果,语意理解这一方面需要有哪些技术突破?

何晓冬:语意理解是很难的事情,一直是NLP(自然语言处理)里面最难的问题。语言本身其实只是符号,必须后面有很多知识,包括常识和具体的物理世界的知识、数字世界的知识,包括很多别的方面的知识才使得语言变的丰富,有足够的意义。我们人在交流的时候不光只是交流语言,其实也交流很多知识,这一整块都是非常重要的方向。不能孤立光做语言理解。要对其他常识能够联系起来做理解分析,这是一个很难的问题。另外我对腾讯很敬佩,他们很有勇气。每次AI展示都是一次挑战,面临着风险,某种角度来说,整个AI界是一起的,我们希望把整个AI往前推进。

Q:语音和图像识别这个技术应用在京东上的话,会有哪些方面的应用?

何晓冬:在语言上,其实整个京东的场景跟语音,包括语言理解,跟京东结合的非常紧密,不管搜索、推荐或者是内容生成。比如新商品上架,需要生成一些商品宣传,需要做说明,生成一些简介。还有理解用户的评价,我们需要理解用户对这个东西喜欢还是不喜欢,喜欢哪一方面,用户有什么新的需求需要反馈。客服也是京东很重要的方向,包括智能客户服务。除了帮助消费者,用技术也能帮助自己的员工。比如智能客服希望能够帮助这些客服人员能够从比较繁重,甚至有时候比较有压力的工作强度解放出来,提供最合适的信息,帮助他们判断一下怎么样最有效的完成任务,能够让客户满意,同时还能减轻客服工作人员的工作量。

在加入京东前何晓冬是微软的深度学习中心(DLTC)负责人,他过往的经历较为丰富。

1996年何晓冬本科毕业于清华大学,随后进入中科院读研,主攻计算机领域,毕业后顺利进入美国密苏里大学哥伦比亚分校读博, 从研究生开始一直致力于语音识别方面的研究。

2003年他加入微软总部,工作主要涉及AI领域多种方向。

2008年他的团队参加了DARPA委托NIST举办的世界机器翻译比赛,在谷歌、BBN等强敌激烈竞争中,他们获得了第一名。

2011 年 IWSLT 国际口语翻译比赛、2015 年 COCO 图像描述挑战赛,以及 2017 年 VQA 视觉问答大赛上,何晓冬团队均获得第一名。

2014年,何晓冬开始了新的研究方向——图像描述,让机器来描述图像的内容。基于此研究,随后 他的团队于2016年创建了世界第一个自动图片描述的智能云服务,并推出了图像描述机器人CaptionBot。

在微软供职期间他的团队发明的算法被应用于语音识别,翻译,搜索,广告,MSN新闻推介、小冰,微软认知服务(cognitive service)和Office PPT里的图像描述等产品和服务。

文 | 杜阳

来源 | 科创者说


分享到:


相關文章: