机器学习：概述_技术 _ 頭條網

机器学习是人工智能的一个分支，讨论的是如何通过模型提取数据中的知识。通常这些知识是非确定性的知识，需要从数据出发挖掘潜在的知识，构建的模型也是统计意义上的模型，是对真实情况的一个拟合，所以也叫统计知识学习。从这里我们就可以看出来这里有一个隐含的假设，就是假设数据潜在一个统计学规律，而学习的过程中只是将其找出来。

机器学习总的来讲可以分为两大类，一种是监督学习，一种是非监督学习。所谓监督学习就是用于训练的数据集有确定的结果即同时给出数据和结果；另一种是非监督学习，就是丢给你一堆数据，让你从中发现规律。当然还有一种是强化学习，强化学习讨论的是一种不需要预先给定任何数据，而是通过接收环境对动作的奖励（反馈）获得学习信息并更新模型参数，实际上是建立了一个输入和反馈的闭环系统。

常见的监督模型包括：感知机、k近邻、朴素贝叶斯、决策树、Logistic回归和最大熵、支持向量机、Boosting方法、EM算法、隐马尔可夫模型、条件随机场；非监督模型：聚类、奇异值分解、主成分分析、潜在语义分析、马尔可夫链蒙特卡洛方法等等。

理解上述模型需要有以一个统一框架：模型、策略和算法；模型就是如何用一个数学模型对问题建立适合的描述，策略就是要选择对方法（蛮力、分治、贪心等）、算法就是选择一种实际的步骤来实现策略。比如感知机：模型就是通过一个符号函数来表示一个分类问题要么是要么不是，策略就是通过一个损失函数来寻找最优参数，算法就是用梯度下降算法来逼近解。

机器学习中模型的评价通过模型的训练误差和测试误差来评估，通常要求两个误差都小是最好的，但是往往很难做到，模型常常出现在训练集中拟合的很好而测试集中表现不佳的情况，这就我们说的过拟合。过拟合产生的原因往往是生成的模型过于复杂而导致的，就是把简单的问题搞复杂了，通常的解决方式是在模型中加入正则项，也可以理解为复杂度的控制项目，这个项一般与问题的结构有关常常是问题结构的函数。

在监督学习中建立的模型又分为生成模型和判别模型。生成模型就是已知了联合概率分布，求出条件概率分布，也就是知道P(X,Y),求P(Y|X)，而判别方法则是直接从数据中学习P(Y|X)即条件概率分布。上述的监督学习也可以大致规到这两种依据模型的分类了。

相關文章:

机器学习——Linear Regression 线性回归

机器学习：降维技术完整指南

机器学习——详解KD-Tree来龙去脉

机器学习-数据降维

机器学习—CER字错率计算

机器学习——详解经典聚类算法Kmeans

机器学习：潜在语义分析

机器学习：主成分分析

机器学习 KNN 算法之手写数字识别

机器学习：隐马尔可夫模型（HMM）

机器学习：支持向量机

机器学习：初始点对优化的影响

03.06 机器学习：初始点对优化的影响

机器学习-SVM实例

03.04 机器学习—主成分分析（PCA）实战演练

机器学习、深度学习入门教材课程

03.01 机器学习：概述

机器学习-聚类分析代码解析

机器学习：如何在Kafka应用程序中部署一个分析模型进行实时预测

机器学习-浅谈神经网络和Keras的应用

12.13 机器学习：AutoGluon介绍及示例

机器学习——正则化

机器学习&深度学习基础（tensorflow版本实现的算法概述0）

机器学习-Faster RCNN中的RPN网络

机器学习-目标检测(Object Detection)的评估指标mAP

机器学习-Faster RCNN的损失函数(Loss Function)

机器学习：感知机学习算法

机器学习-逻辑回归

机器学习-广义线性模型

机器学习 — 最大似然估计的应用

机器学习：什么是预测模型性能评估

机器学习：处理不平衡数据的5个重要技术

AI 机器学习、深度学习模型调优方法及方向

npj：机器学习—神经网络方法计算多组分晶体的形成能

机器学习：Logistic回归背后的数学

机器学习：带你了解决策树

机器学习：梯度下降和正规方程

机器学习：Word嵌入和Word2Vec简介

机器学习：使用TensorFlow构建LSTM模型详细教程

机器学习：葡萄酒质量预测模型教程

「机器学习」权重初始化的几个方法

前辈说先学会了这些Python知识点，再谈学习人工智能、机器学习

机器学习：TensorFlow中的L1正则化

机器学习：使用时间序列预测的Bitcoin Price预测模型

机器学习：如何计算CNN中的参数数量？

机器学习-模型的评估和选择

05.15 机器学习-我妈妈也能看懂的入门篇

数据科学家基础能力——机器学习

第二章 IoC容器和Bean配置

运算里不得不说的python模块—math

Devops度量--DevOps 现状快速检查表

SOP是什么（解读）

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

DNS侦查工具

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

（必收藏系列）Linux面试题——命令集

五分钟学会如何在 IPFS 上部署网站

「正点原子NANO STM32F103开发板资料连载」第29章 内存管理实验

小白怎么学Web前端开发 如何成为技术达人

如何开发一个web静态服务器

学Java编程还有前景吗 如何才能拿到高薪

Python网络爬虫之配置篇（一）

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

Python的运行效率太低？几行代码快速提升！

python的优点是什么？最新Python400集视频（附教程）

MySQL中OOM故障应如何下手-爱可生

像专家一样使用 panic

30种不同的编程语言怎么写“Hello, World”

percona QAN 介绍

面试官：你可以用纯CSS判断鼠标进入的方向吗？

网络工程师职业生涯中，哪两点是最重要的？

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

小白怎么学Web前端开发如何成为技术达人

学Java编程还有前景吗如何才能拿到高薪