超强干货!​Netflix数据科学家面试细节

全文共3113字,预计学习时长

9分钟


超强干货!​Netflix数据科学家面试细节


Netflix是一家总部位于加利福尼亚州洛斯加托斯的流媒体公司。作为一家最受科技影响的内容媒体公司,科技已经渗透到了文化领域。


Netflix成立于1997年,最初是一家DVD租赁服务公司,后来扩展到流媒体业务。现在,Netflix在全球拥有超过1.5亿的付费订阅量,其中包括6000万美国用户。在流媒体支持超千种设备,观看时长每月约三十亿小时的环境中,Netflix每天从超过一千亿个活动中收集数据。


数据科学是Netflix的DNA,Netflix利用数据科学改善用户体验的方方面面。多年来,Netflix一直利用数据科学作为其内容推荐引擎,以决定制作哪些电影和电视节目来改善用户体验。


超强干货!​Netflix数据科学家面试细节

Netflix的数据科学角色


Netflix的数据科学家的角色在很大程度上取决于团队。然而,Netflix的一般数据科学家角色贯穿业务分析、统计建模、机器学习和深度学习的实现等领域。Netflix是一家大型公司,数据科学家在个性化和算法、营销分析、产品研究和工具等30多个不同的团队中工作,拥有从基本分析到复杂的机器学习算法的各种技能。


所需技能


Netflix只聘用具有至少五年相关经验的有资质的数据科学家。其要求非常具体,招聘人员热衷于对每个工作岗位进行专门招聘。这有助于拥有特定行业经验的人能针对特定的团队角色。


其他相关资质包括:


· 统计学、计量经济学、计算机科学、物理学或相关定量领域的高等学位(硕士或博士)。

· 五年以上的相关经验,并且在利用大量数据推动产品创新方面有着可靠的工作业绩。

· 具有分布式分析处理技术(Spark、SQL、Pig、Presto或Hive)的经验,并具有Python、R、Java或Scala方面的强大编程技能。

· 有实际的建立机器学习模型的经验,并且具有良好的影响力。

· 具有在A/B测试、分析观测数据和建模中使用的深层统计技能

· 有在Tableau、R Shiny或D3中创建数据产品和仪表板的经验


Netflix的数据科学团队是什么?


Netflix的数据科学一词涵盖了与数据科学相关的广泛领域和角色。数据科学家这一头衔是角色和功能的结合,范围从专注于产品分析的数据科学家扩展至数据工程和机器学习功能。


· 个性化算法:与产品和工程团队合作,评估性能,优化个性化算法,用于向Netflix用户推荐电影、电视节目、艺术品和预告片。

· 用户界面数据科学与工程:利用自定义机器学习模型为所有订阅者优化产品的用户体验。

· 产品研究和工具:开发和实施方法,以推进Netflix的大规模实验。这包括开发数据可视化框架、工具和分析应用程序,为其他的团队提供对用户行为和产品性能的洞察。

· 增长数据科学与工程:注重于扩大用户群,围绕关键业务指标,构建和设计高度可伸缩的数据管道以及干净的数据集。

· 营销数据科学工程:创建可靠的分布式数据管道,构建直觉型数据产品,为利益相关者提供跨越行业的数据利用方法,为所有非技术团队提供自助服务。


超强干货!​Netflix数据科学家面试细节

面试过程


超强干货!​Netflix数据科学家面试细节

图源:Netflix数据科学博客


Netflix的数据科学招聘流程与其他大型科技公司类似。招聘过程从初筛开始,然后在进行技术筛选之前,再经过一次招聘经理的电话筛选。通过技术筛选后,将会安排现场面试。面试分为两部分,分别有六七人参与。


超强干货!​Netflix数据科学家面试细节

初筛


Netflix的初筛是一个30分钟的电话面试。Netflix的招聘人员有很强的专业性和技术性,他们的工作是了解应聘者的简历,查看应聘者经历、项目和技能是否与这个职位相匹配。这部分面试的第二点是测试应聘者整体沟通技能,并向应聘者解释应聘角色及其背景。


接下来就是招聘经理筛选。这一部分将更注重应聘者过去的经验,深入了解应聘者在数据科学和机器学习方面的技术能力。当招聘人员确认应聘者的项目与团队高度契合时,招聘经理会进行更深入的提问,比如对某一项目使用某一算法的原因,或构建不同的机器学习或分析系统的方法。


招聘经理也会告知更多关于团队的角色和职责。请注意,Netflix很注重文化和价值观,可能会要求应聘者选择某一价值观并解释原因。


技术筛选


通过初筛后,面试的下一步是技术筛选。这个过程通常长达45分钟,涉及的技术问题包括SQL、实验和A/B测试,以及机器学习技术问题。


问题示例:


· 你对于流媒体环境下的A/B测试了解多少?

· L1和L2正则化有什么区别,为什么不在实例中使用L0.5正则化?

· 在线梯度下降和批量梯度下降有什么区别?

· 向利益相关者传达机器学习结果的最佳方式是什么?


超强干货!​Netflix数据科学家面试细节

现场面试


超强干货!​Netflix数据科学家面试细节


现场面试是招聘过程的最后一个阶段,分为两部分,中间有午休时间。如果应聘者是从外地来的,Netflix会带其飞到洛斯阿尔托或洛杉矶进行现场面试,并且会预先和招聘人员见面,然后再进行面试。


面试包括面对六到七个人的一对一面试,其中包括数据科学家团队成员、团队经理和产品经理。Netflix的现场面试是产品、机器学习和各种分析概念的结合。面试问题包括产品感、A/B测试(假设测试)的统计信息、SQL和Python编码、实验和度量设计以及文化匹配。如果这个该岗位更加注重工程,那么面试问题就更可能涉及机器学习和深度学习。


注意事项和提示


· 请记住,面试的目的是评估如何运用分析概念和机器学习算法以及模型来预测用户和内容的价值。可以复习一下统计学和概率学、A/B测试和实验设计、回归和和分类建模概念等知识。

· 再三提醒,要记得阅读Netflix文化展示文稿。文化是Netflix的一切。他们创造了一种独特而著名的工作文化,并将其转录到了一个100多页的在线幻灯片上。

· Netflix的核心文化是建立一支高绩效团队,并将其置于一个能够让成员表现优异的环境中。这体现在极大程度的自由和责任上,在受限的自上而下的管理下由管理者提供的强大环境上,以及奖励优秀员工的薪酬奖励和晋升制度上。

· 在薪酬谈判中,请注意,Netflix的薪酬非常高。他们雇佣的技术人员的平均工资超过了三十万美元,并且很多时候几乎都是现金形式,也可以选择将其中一些转换为限制性股票(RSUs)。这就是Netflix面试很难,招聘基准线非常高的原因。


超强干货!​Netflix数据科学家面试细节

Netflix数据科学面试问题


超强干货!​Netflix数据科学家面试细节


· 使用逻辑回归写出建立分类器的方程式

· 在握有account_id、 device_id和有关支付的元数据等Netflix一个月登陆数据的情况下,如何检测支付欺诈?

· 如何为公司正在考虑推出的新内容推荐模型设计一个实验?什么指标会影响结果?

· 编写SQL查询以查找两个活动之间的时差。

· 如何构建和测试一个指标,以比较两个用户之间对于电影/电视节目偏好的排名?

· 如何从500万个搜索查询中选择一个具有代表性的样本?

· 为什么线性整流函数是一个很好的激活函数?

· 如果Netflix希望扩大在亚洲的业务,可以利用哪些因素来评估亚洲市场的规模,以及可以采取哪些措施来占领这个市场?

· 如何利用归因建模来衡量营销效果?

· 如何确定Netflix订阅的价格是否真正是消费者进行订阅的决定因素?


超强干货!​Netflix数据科学家面试细节

我们一起分享AI学习与发展的干货


分享到:


相關文章: