机器学习数学–线性代数

如果您最终决定深入研究机器学习模型的实现,那么您会迷失在正确的位置。所有人工智能专家都建议您通过建立基础知识来开始这一领域。在使用框架和编程模型之前,必须掌握一些数学概念。为了帮助您,我们开始撰写一系列有关机器学习数学的文章。

机器学习数学的目的是使您熟悉算法的基础工作,现在您可以仅通过某些库轻松构建这些算法。但是了解基础将帮助您了解问题出在哪里以及如何避免。

第一部分由线性代数组成。我们将介绍您在处理数据时以及在尝试从中找出一些东西时经常遇到的一些基本概念。

为什么选择线性代数:

首先,让我们看看使用线性代数的动机是什么。在使机器学习时,我们要解决的许多任务将使用线性代数概念。一个常见的例子是价格发现。假设一次去商店,您花8元买了2条面包和3个鸡蛋。

2b + 3e = 8

在下一次旅行中,您以13元购买了1面包和10鸡蛋。

1b + 10e = 13

两次总输出不同。一个面包的价格是多少?还是鸡蛋?现在,解决方案似乎很简单。解联立方程。但是,当数据数量增加时,解决方案变得有些棘手。在这种情况下,每次去杂货店的行程都会增加。最好将这项任务交给机器!

现在,我们知道可以使用不同的数学对象表示数据。在上面的示例中,我们有一些系数,例如2、3、1和10。输出值为8和13。我们可以将它们写为:

机器学习数学–线性代数

以矩阵和向量的形式。因此,进一步,我们将看到如何使用这些数学模型。

我们尝试使用机器学习算法完成的另一个非常重要的任务是在数据中拟合方程。我们尝试找出最适合数据的方法。因此,需要研究的另一点是如何选择和调整参数以最适合机器学习模型。

我们现在有两个问题。通过考虑拟合参数的某些方程,求解联立方程以进行数据发现和拟合数据的优化。

向量:

现在让我们看看线性代数中的向量是什么。假设我们有一个人口高度,我们想在此数据中拟合一个方程。现在,拟合一个方程将为我们提供一个通用的解决方案,我们将使我们摆脱携带原始数据的负担。

我们绘制人口曲线。最低值为1.5米,最高值为2米。我们在这里考虑的两个拟合参数分别是由µ给出的平均值和由σ给出的标准偏差。平均值描述分布的中心,标准偏差描述曲线的宽度。

机器学习数学–线性代数

我们可以形成正态分布和高斯分布形式的方程。

机器学习数学–线性代数

我们如何处理均值和标准差的拟合参数?假设我们有一个比以前宽的图。所以平均值是一样的,但是图看起来像这样。

机器学习数学–线性代数

现在,我们可以将所有实际值和估计值的平方差相加。低估和高估并获得有关拟合优缺点的想法。

善度如何随着拟合参数的变化而变化。我们选择不同的µ和σ值,看看是否有更好的拟合度。假设我们从大µ和小σ开始。现在我们可能意识到我们已经考虑了比实际高的人口。现在,我们要移动µ和σ,看它如何影响结果。

如果结果良好,则继续沿该方向移动。µ和σ的变化可以由µ'和σ'给出。向着中心​​的最小点移动将使我们最适合。

要注意的一件事是,我们可以用向量的形式描述这些参数。

机器学习数学–线性代数

此外,我们看到这些矢量对象在空间中移动。趋于平息或远离平息,这给了我们最佳的契合度。爱因斯坦用向量提出了相对论。他说,空间具有三个维度:x,y,z和时间。

机器学习数学–线性代数

我们可以说,向量只是在空间中移动的参数的列表。

向量运算:

因此,我们了解了向量是什么以及它如何在空间系统中移动时如何拟合参数。现在让我们看看可以对向量执行的操作。

在数据科学中,我们将向量视为对象属性的列表。因此,假设有一所房子。描述其属性的向量将是

机器学习数学–线性代数

向量上的运算实际上只是标量的加法和乘法。

机器学习数学–线性代数

假设我们有一个向量r和一个向量s。将它们相加得出另一个向量r + s。

同样,r + s = s + r。不管我们如何添加它们。

机器学习数学–线性代数

接下来是标量乘法。所以2r就像

机器学习数学–线性代数

看起来像什么?可能会朝相反的方向前进。

机器学习数学–线性代数

现在,让我们开始在坐标空间中表示向量。

考虑坐标轴i和j。同样,向量r移至3 i和2 j。

机器学习数学–线性代数

因此,s + r意味着简单地添加坐标。这使

机器学习数学–线性代数

在上面我们看到,r + s与s + r相同。如果我们有第三个向量t。将(r + s)+ t之类的三个向量相加就等于r +(s + t)。此属性是关联性

现在,让我们详细看一下将向量乘以标量值的含义。从坐标系和向量r开始。

机器学习数学–线性代数

2r将r的分量与2相乘得到6和4。

机器学习数学–线性代数

同样,我们可以对向量执行sr操作。它是向量r和向量s的负数的简单加法。

机器学习数学–线性代数

现在,这些矢量加,减和乘标量值的操作可以应用于实际数据。像房屋矢量一样,我们在上面定义。

机器学习数学–线性代数

向量的属性:

接下来,让我们看一下向量的一些属性。

我们要考虑的两件事是向量的大小(也称为向量的长度)和向量的点积(也称为投影乘积)。向量的点积或内标量积在线性代数中具有大量应用。

如果不考虑坐标系,我们可以说向量是两件事。它的长度和方向。

现在考虑两个坐标空间中的向量。

机器学习数学–线性代数

现在我们可以说r = ai + bj,其中a和单位长度为1。这样的单位长度坐标也称为î和ĵ。î帽子和帽子。

根据毕达哥拉斯定理,我们知道斜边给出了r的长度。

让我们来看看。

机器学习数学–线性代数

r的大小可以表示为

机器学习数学–线性代数

无论矢量定义了什么。价格,高度等。长度始终是其组成部分的平方和。

接下来是向量的点积。

机器学习数学–线性代数

rs = ri.si + rj.sj = 3。(-1)+ 2.2 = -3 +4 = 1

点积的一些属性

可交换的:rs = sr

分配式加法:r。(s + t)= rs + rt

标量乘法的关联:r。(as)= a。(rs)

点积与向量的模数或长度之间有什么关系?让我们来看看。

rr = r 1 r 1 + r 2 r 2 .. = r 1 2 r 2 2

这意味着点积是向量大小的两倍

机器学习数学–线性代数

因此,要找到向量的大小,我们可以将向量与其自身的点积取平方根。

向量投影:

现在转到矢量投影。考虑下图。

机器学习数学–线性代数

现在,如果这些角度构成一个假想的直角。我们可以得到cos角为

机器学习数学–线性代数

因此,相邻实际上是

机器学习数学–线性代数

向量r上的投影或阴影的排序。

改变s的方向会在r上给出不同的投影。假设s垂直于r。这样在r上将没有阴影。将为90度,cos 90为0。

如果将点积除以mod r,则继续上述方程式,我们将得到标量投影。

机器学习数学–线性代数

我们在这里采用了标量投影。方向r的向量s。然后将此投影乘以矢量除以其长度。那就是向量r方向上的向量。

总结:

在机器学习数学的第一部分中,让我们一直保持到这里为止。我们从线性代数开始。我们了解了在机器学习中使用线性代数的动机。我们详细看到了什么是向量?我们可以对其执行的操作以及向量的属性。我们可以得出结论,向量只是为了更好地拟合数据而在空间中移动的参数列表。向量的大小和投影是向量的重要属性。


分享到:


相關文章: