参加人工智能大赛,什么奖品最有吸引力?

AI小师弟


笔者认为, 对于本科生来讲,获得一二三等奖者,奖品没干么吸引力,获得保研资格应该最有吸引力。


LaoHuang188



唠悟聊斋


2018数博会组委会消息,2018中国国际大数据融合创新·人工智能全球大赛总决赛暨颁奖礼,将于5月25日在贵阳举行,10支进入总决赛的团队,将在9位评委的评判下,为这场为期4个月的大赛划下句点,一等奖将获得100万奖金。


纵横交错兮天下之局


看完这篇文章你就知道价值何在。

我们来分析一下要较好的完成一个赛题,需要经过哪些关键环节,如果参赛者的能力水平已经足够支撑其完成这些环节,那么就基本具备参赛的能力要求。一般而言,参与一场AI竞赛主要的动作包括:

第一, 对赛题进行理解,尤其是大致了解企业提供的数据,包括数据特征变量、目标变量的分布,并分析变量之间的相关度,发现一些高相关或共线性的特征。

第二, 数据处理和清洗,数据特征值缺失的处理,如果数据中包含文本则需要进行数据清洗。

第三, 特征工程,包括特征变换和特征编码。针对一些长尾分布的特征,需要进行幂变换或者对数变换,使得模型能更好的优化。对于离散的类别特征,往往需要进行必要的特征转换/编码才能将其作为特征输入到模型中。

第四, 算法模型的选择、融合和验证,对于某类AI问题比如计算机视觉、语音识别、自然语言理解等,有大量开源算法模型,每个模型都有其优势和局限,要解决特定的问题往往需要多个算法模型进行融合,而不同算法模型的选择和融合对结果的影响很大,这也是一个解决方案的关键。当然,比较厉害的团队可以根据问题开发一些新的算法模型。

第五, 参数设置。选好了算法模型后,最重要的工作就是参数设置,不同的参数往往导致结果差异巨大,也是区分不同参赛团队实力的重要因素。

在上面的几个步奏中,前面两个步奏属于准备工作,关键的是后面三步。区分不同方案优劣的关键,是特征工程、算法模型的选择和融合、参数设置,这也是不同团队实力的主要体现。回到开始那个问题,要参加这样一个AI竞赛,或者说要用AI技术解决企业的业务问题,需要具备哪些知识和能力,学生群体具备这样的知识和能力吗?

大体上来看,一个合格的AI开发者需要具备的能力包括:计算机科学基础和编程能力,这需要学习一些计算机的基础课程并学习一些编程语言;数理基础,主要是概率论和数理统计,大学在本科一二年级时一般会开设相关的课程;数据处理、数据建模的基本能力,这个学习一些相关课程也能基本具备,关键的是培养对数据的敏感度和分析能力;一些通用算法的学习和理解,尤其是机器学习、深度学习方面的算法,大部分算法都可以通过开源渠道获得,入门门槛不高,学习的时间和本身天赋导致最终能力的差异;软件工程能力,要解决一个业务问题,需要具备一定的软件工程能力,这个门槛也不高,并且随着经验的积累能力也逐步提高。事实上,企业内部要用AI技术来解决其业务问题、开发新的应用程序,对开发人员也基本是这些要求,只是他们具有更多的业务知识并且技术更熟练而已。

通过与参赛团队与企业的沟通,改变了我对开发AI技术方案的看法。在我原来的认知中,觉得AI技术方案的开发是一个进入门槛很高的事情,即使不是某个大企业的技术大牛,也得是某个名校的博士。其实,AI开发这件事情,进入门槛并不是那么高,具备基本的编程能力、数据处理分析能力,并能应用机器学习算法,原则上就可以进行类似的开发。当然,进入门槛不高并不代表谁都可以做,更不代表谁都能做的好。

不是“过家家”,而是真实AI应用场景解决方案

通过这次赛事,我获得的另一个感受就是,比赛不是“过家家”,大部分的赛题都有真实的业务内涵。多数企业都是带着问题来的,想借助优秀的方案解决自己的困惑,至少能得到一些解决问题的思路。

以蚂蚁金服出的赛题“商场中精确定位用户所在店铺”为例,目前手机端的定位主要是GPS,但是GPS定位偏差达到10米以上,并且室内的GPS定位能力不好,目前室内精准的用户定位还没有成熟的解决方案。但是,室内精准用户定位本身是具有很大应用价值的,基于此可以衍生出广泛的商业应用前景。比如当用户走入商场的某家餐厅时,手机会自动弹出该餐厅的优惠券;走入商场服装店时,手机可以自动推荐这家店里用户喜欢的衣服;路过商场一家珠宝店时,手机可以自动提示用户想买的一款钻戒已经有货了;离开商场停车场时,手机在用户的许可下可以自动交停车费总。总之,在正确的时间、正确的地点给用户最有效的服务,是各大互联网公司智能化拓展的新战场,而室内精准的用户位置定位则是关键。

把视角放大一点看, 应用场景已经成为AI企业商业落地的关键。

相对于企业独立研发,AI竞赛是一种高性价比的互补方案

依据一定的技术基础和业务场景需求,企业大多通过独立组织相关人才与资源,进行技术研发并给出解决方案。AI竞赛给企业提供了另一种选择——将自身的问题、数据打包成赛题,通过竞赛来收集大量的解决方案,从中筛选合适的方案和团队。诚然,很多时候通过竞赛得到的答案并不能全部解决企业的业务需求,但收集的解决方案依然是有价值的,至少能给企业提供最终解决问题的思路。那么,AI竞赛作为一种替代方案,对企业而言其性价比如何?在此我们还是以蚂蚁金服为例进行分析,要获得室内精准定位方案,蚂蚁金服可以独立研发,即使采取腾讯的套路,多个团队分别研发进行竞赛,由于人才和资源的限制团队数量不会超过5个。另一方面,通过这次CCF“大数据与计算智能大赛(Big Data & Computing Intelligence Contest, BDCI)”,有1545支队伍为其提供解决方案,这在企业内部是不可想象的。

赛题、历练和友谊,是比奖金更有吸引力的东西

上面从企业角度,分析了AI竞赛的价值,下面我将从参赛选手角度,来看看这类竞赛的价值。为什么要参加竞赛,这是参赛者关心的问题,也是主办方需要回答的问题,因为这直接决定了AI竞赛对优秀人才的吸引力,而参赛者的质量直接决定了整个竞赛的质量。

在一般的认知中,吸引参赛者的因素首先是奖金,其次是进入理想企业的机会。通过与这次BDCI大赛选手的广泛交流,我对这个问题也有了一些全新的认识。其实,相比于奖金和职业机会,参赛者更关注赛题本身的质量、整个竞赛过程给自己的历练,以及收获的来自队友和对手的友谊。

对于AI竞赛,不只是企业和赛事举办方筛选参赛者,参赛者本身也会对赛事和赛题进行选择。对于一个AI竞赛,参赛者首先关注的就是赛题本身:这个赛题是不是有实际的业务价值,赛题难度如何,与自己的专业、研究领域或者目前工作是否相关,出题的企业背景如何,该赛题给出的数据质量如何等,这些是参赛者最关心的问题。那些互联网巨头发布的本身具有一定业务内涵且富有挑战、企业能给出大量高质量数据的赛题,往往更能获得参赛者的亲睐。

这里,我重点分析一下出题方给出的数据对于参赛者的价值。在AI领域,数据与算法是科学研究与产品技术研发的核心。高质量训练数据对机器学习模型的建立和优化有关键性的作用。大规模、高水准且具有真实场景内涵的标注数据集,是推动AI科研和技术前进的关键驱动力。对于有志于投身AI相关领域的人员,这些高质量的数据是珍贵的,尤其是在校学生,很难接触到这些来自真实商业世界的高质量数据。以语音识别为例,对于学校这类学术单位来说,最大的问题是没有足够的资源收集、清洗、标注大量的语料;而对小公司和创业团队来说,语料和计算力都是问题。

通过参加BDCI这类AI竞赛,出题企业会提供大量相关数据,供参赛选手分析使用。以室内商家精准定位赛题为例,蚂蚁金服提供在2017年8月份大概100家商场的详细数据,包括用户定位行为和商场内店铺等数据(已脱敏),参赛队伍可以对其进行数据挖掘和必要的机器学习训练。另外,蚂蚁金服还提供2017年9月份的商场内用户数据来做评测,检测参赛者的算法是否能准确的识别出当时用户所在的店铺。对于在校学生、科研人员以及其他企业的研发人员而言,这些数据是非常难得的。

在采访的参赛队伍中,大部分都是由学生或在职人员独立参赛、独立组队,有一个参赛团队比较独特,他们是由一个辅导老师带领团队,团队内部既有研究生也有本科生。其辅导老师认为,参与这类AI竞赛并不是对学生学业的耽搁,相反是一个很好的学习机会。他坦言,队伍中一些低年级学生还不具备独立参与这类竞赛的能力。但是,他认为不是因为有足够的能力才来参赛,而是通过参赛来快速培养相应的能力。


小小赵汤圆


不论你面向的参赛选手是社会人还是学生,有吸引力的奖品一定是能够满足对方物质需求和精神需求双重层面的。有钱出钱,有资源谈资源。

【物质层面】:

1.现金

2.针对参赛选手的大致取向可以选择人工智能大厂的实习/工作推荐名额

3.预算充足的情况下可以是高端电子产品。比如适合工作学习的MacBook、iPad、iPhone;

4.或是各种机器人产品比如优必选家的机器人系列

【精神层面】

可以让选手有充分的分享欲去凸显自己的价值。比如:

1.设计高端的奖杯和证书,这个是必备选项。

2.某知名人工智能行业的一对一对话(这个就像有一个有着丰富的同行业前辈为你领路一样,这种经验也不是钱能买来的)

3.获奖选手一般都是这一领域的佼佼者,还可以为Ta颁发聘书,组建一个相关领域的专家和获奖选手的社群,日后一可以作为前辈返场分享经验;二可以作为积累人脉、树立个人品牌的途径。对于比赛主办商来说也是一件两全其美的好事。

以上两个层面缺一不可,可以根据自己的预算和资源自由组合。这种奖品搭配方式除了可以吸引更多的参赛选手,让参赛选手爽到之外,长期进行下去还有助于主办商提高自己的品牌,建立行业公信力,积累更多行业资源。


分享到:


相關文章: