年薪30w!一文教你从零成为有竞争力的机器学习工程师

本文长度1709字

预计阅读时间4分钟

让我们认清一个现实:机器学习的时代已经到来了!

对机器学习感兴趣吗?你不是一个人!机器学习已经超越金融业成为最多金的领域之一:在最近一份Kaggle对机器学习及数据科学领域的全行业深度调查中发现,从全球来看,数据科学人员的年薪中位数为已达到33.2w人民币!单单中国也已经超过20w人民币

在这样的大背景下,每天都有更多的人开始对机器学习这个新兴领域产生兴趣。这篇文章便是要教你如何从零成为有竞争力的机器学习工程师。不必紧张,这只需要简单的四个步骤:

年薪30w!一文教你从零成为有竞争力的机器学习工程师

一、掌握计算机基础知识

计算机科学的基础知识对成为一个机器学习工程师是关键的。这其中就包括:

  • 数据结构(比如堆、队列、多维向量、树、图)
  • 算法(比如搜索、排序、优化、动态规划)
  • 可计算性和时间/空间复杂度
  • 计算机的构成
年薪30w!一文教你从零成为有竞争力的机器学习工程师

这些知识是机器学习工程师在日常的编程中必须能够信手拈来的基础。建议大家从推荐书目开始阅读,并多参加编程竞赛,多在LeetCode上刷题。

推荐书目:

  • 《算法》Robert Sedgewick , Kevin Wayne
  • 《计算机程序设计艺术》Donald E.Knuth
  • 《数据结构与算法》 Aho,Hopcroft,Ullman

二、学习概率与统计知识

机器学习的半壁江山是建立在概率学上的,这其中就包括:

  • 条件概率、贝叶斯法则、可能性、独立事件等

以及由这些基础知识推广而来的:

  • 贝叶斯网络、马尔可夫决策过程、隐马尔可夫模型
年薪30w!一文教你从零成为有竞争力的机器学习工程师

这些工具是机器学习算法的核心,而与之相辅相成的是各种统计方法与技巧:

  • 平均数、中位数、方差等
  • 一致分布、正态分布、二项分布、泊松分布
  • 假设检验、方差分析等这些统计方法对于建立和验证模型是至关重要的,事实上,大多数机器学习算法都是这些统计过程的衍生。可以说,
    学好了概率与统计,便已掌握了机器学习的半壁江山。

推荐书目:

  • 《统计学》贾俊平
  • 《统计学的世界(第5版)》David S. Moore
  • 《概率论与数理统计》浙江大学

三、掌握数据建模和评估方法

数据建模是估计给定数据集的基础结构的过程,目标是找到有用的模式,比如:

  • 相关性,聚类,特征向量等

或发现一些表象之下的规律,比如:

  • 分类,回归,异常检测等

这个过程的关键是不断评估给定模型的好坏程度,这就需要我们选择适当的误差函数,比如:

  • 针对分类问题的对数误差函数
  • 针对回归问题的平方误差函数

除此之外,还需要用到一些评估策略,比如:

  • 拆分训练集、校验集
  • 随机交叉验证
年薪30w!一文教你从零成为有竞争力的机器学习工程师

上述工具能够帮助机器算法利用每次运行产生的错误来调整模型(例如神经网络的反向传播),因此理解这些工具非常重要。

推荐书目:

  • 《模式分类》Richard O. Duda ,Peter E. Hart , David G. Stork
  • 《人工智能:一种现代方法》Stuart J.Russell,Peter Norvig

四、学会使用机器学习算法库

目前已经有多款机器学习算法库可以让我们的想法轻而易举的实现,比如:

  • scikit-learn、Spark MLlib(Python下经典的机器学习库)
  • Pytorch(由Facebook推出)
  • TensorFlow (由Google推出,当前最火热的机器学习库)

这里插入一则预告

,当下最火热的机器学习库TensorFlow从零开始一步到位的简明安装与配置教程将在近期发布,敬请关注本头条号|机器学习干货君

年薪30w!一文教你从零成为有竞争力的机器学习工程师

机器学习算法库在业界被广泛使用,但是要根据自己需要的机器学习模型来选择对应的库。比如常见的算法有:

  • 决策树算法,最近邻算法
  • 神经网络算法,支持向量机
  • 线性回归,梯度下降,遗传算法

值得注意的是,我们不仅要了解不同方法的优势和劣势,同时还要提防在机器学习的过程中会出现的种种难题:

  • 偏差和方差
  • 过度拟合和欠拟合
  • 缺失数据,数据泄漏等

建议大家一边阅读推荐书目进行学习,一边在Kaggle等网站上参与小型竞赛磨练自己的技艺!

年薪30w!一文教你从零成为有竞争力的机器学习工程师

推荐书目:

  • 《TensorFlow:实战Google深度学习框架》郑泽宇,梁博文,顾思宇
  • 《深度学习框架PyTorch:入门与实践》陈云

结语

机器学习入门并不难,对于正常人而言,只需要几个月的学习就足够了(途径可以是网络课程或者读书)。重要的是在各种环境中(比如LeetCode、Kaggle)磨练、做题。希望以上四点可以帮助你快速入门机器学习领域,并能为你指明一个深造的路线!


机器学习干货君致力于原创易于理解的技术原理与细节文章

I Studied Hard,

So YOU Don't Have To !

欢迎大家关注: )


相关阅读:


分享到:


相關文章: