05.15 新浪,机器学习工程师岗的面试实录,全部是精华!

技术1面

1 Java水平怎么样?

2 问Python给自己打多少分?Python多线程怎么实现?

3 线程和进程的区别?

4 不同进程之间数据能共享吗?

5 Numpy和pandas做了什么?他们有什么优缺点?

6 五行五列二维数组,手写代码输出每行每列的最大值、最小值、平均值、方差

7 问Redis数据库知道多少?

Redis数据类型有几种?

MySQL和Redis有什么区别?

8 怎么设置缓存实现时间(怎么清缓存?)

9 Hadoop,spark用过吗?

10 举了一个高维数据,怎么找出异常值?

技术2面

二面面试官来了。是个算法大佬。是个专门做算法的。直接手出题,他说时间不多,就让我说思路。

1.先是一个m*n矩阵图走迷宫共有多少条路径?

需要用到动态规划,还有排列组合。

2. 2-sum问题。这个答出来了,中间有用了一种方法,自己想的,虽然没有降低时间复杂度,但挺新颖的。

3.问了最熟悉哪个机器学习算法。说逻辑回归,谈了下逻辑回归原理。问了为什么总Sigmod函数,而不是其他双曲函数或Rule函数。

4.然后他说对Xgboost这个感兴趣,Xgboost比GBDT做了什么优化,他说了一点,问还有一点是在数据集遍历上的优化?

5.问了随机森林,随机森林与决策树相比,有哪些更多的优化?

6.问了信息熵,和信息增益,和信息增益率,现实中代表什么?

信息增益率比信息增益解决了哪些问题?

总结

感受到大公司氛围就是挺好的。不管结果如何。都有所收获,至少知道了自己的优点和不足。

1. 缺乏常规算法训练

2. 没有很深究到机器学习原理的细节和底层具体推导。

想进大厂,必须得加强算法训练(多刷题),机器学习算法掌握来龙去脉,熟知重要原理和应用及优化。

以上面试问题,大家有自己的答案了吗?对自己拿不准的问题,欢迎大家留言,一起讨论。