两位数据科学家跟你聊聊AI那点事儿(附学习资料)

时长12:16,请在wifi环境下观看

当当当当~

TalkingData的视频访谈栏目开播啦

它有一个非常响亮的名字:《数中生智》

顾名思义,就是从数据中产生智慧

在这个栏目当中

我们将探讨大数据能产生怎样的智慧

以及怎么从大数据中生产这些智慧

大数据以及AI相关的

趋势、科学、技术、实践以及从业者

都将是这个栏目所关注的焦点

本期嘉宾

陈日涵

才貌兼具的TalkingData数据科学家

毕业于明尼苏达大学统计专业,目前就职于TalkingData从事数据科学工作。主要关注的方向为机器学习、计算机视觉及贝叶斯优化。

话题1:如何看待大数据和人工智能?

统计学或人工智能是比较大的概念,而机器学习只是其中的交叉部分,它属于学习(Learning)的分支。统计可能更为严谨,关注于数据建模(Data Modeling),机器学习则是更贴近应用测的学科,关注预测,对于假设或模型检校(Mode Checking)的要求并不严格。

话题2:在校生怎样才能进入AI领域?

对于那些在校生来说,基础是更为重要,需要去上基础的数学课以及去修一些机器学习的课程。

现在有很多像Cousera这样的网站,提供免费的在线课程,都可以作为很好的入门材料,而Youtube上也有一些大神,比如Andrew Ng(吴恩达)、Stephen Boyd主讲的公开课。很多名校如斯坦福大学也有免费在线的公开课,这些公开课实际上与其在校生所学的课程同步,会比开源网站上的课程更有深度,若想提高自己在AI领域的知识积累,公开课是一个不错的途径,此外,GitHub上也有很多机器学习或深度学习相关的学习资源。

话题3:神秘的数据科学家平时都在忙什么?

除了做算法、数据建模(Data Modeling)、预测(Prediction)等这些基本的工作以外,数据科学家还需要去了解数据本身和业务场景,这是衡量一个数据科学家合格与否的重要标准。

数据科学家要成为数据工程师与业务之间的桥梁,一方面与数据工程师对接,需要对技术框架和代码有一定理解;一方面,将数据算法和模型做成一个合格的产品,指导实际业务。

话题4:如何增加自身筹码找到称心如意的工作?

大体上有两种方法,首先是开源竞赛,不仅能在论坛上和其他人交流提升自身的知识水平,也能刷一些排名(Rank)去提升用人单位发现自己的几率;第二是对一些开源项目做贡献,因为做贡献的这个行为也能从侧面反映出自身是一个合格的数据科学家。

TalkingData曾在Kaggle上发布过性别识别的竞赛,参与人数刷新了Kaggle当时的历史记录。最近,TalkingData在Kaggle上发布了另外一个关于广告反欺诈的竞赛,欢迎大家参加。

AI入门进阶神功宝典

友情提示:部分网站需要科学上网

好玩的AI入门教程AI Education:https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A

MIT课程-深度学习导论 by Alexander Amini, Ava Soleimany, Harini Suresh, Lex Fridman:https://www.bilibili.com/video/av19113488/

Hugo Larochelle教授的神经网络课程:https://www.bilibili.com/video/av3278931/

Linear Algebra for Deep Learning:https://machinelearning-blog.com/2018/03/18/linear-algebra-for-deep-learning/

An Intuitive Guide to Linear Algebra:https://betterexplained.com/articles/linear-algebra-guide/

吴恩达Deep Learning课程:https://www.coursera.org/specializations/deep-learning

吴恩达深度学习网易翻译版:https://mooc.study.163.com/smartSpec/detail/1001319001.htm

吴恩达机器学习课程:https://www.coursera.org/learn/machine-learning

吴恩达机器学习短视频课程:https://www.youtube.com/playlist?list=PLLssT5z_DsK-h9vYZkQkYNWcItqhlRJLN

Stephen Boyd与Lieven Vandenberghe的凸优化教程:http://web.stanford.edu/~boyd/cvxbook/

Tensorflow官方教程: https://www.tensorflow.org/tutorials/

Scikit-learn官方教程:http://scikit-learn.org/stable/tutorial/index.html

Lightgbm官方文档:https://lightgbm.readthedocs.io/en/latest/