什么是非线性降维?

硅发布

高维数据,即需要超过二维或三维数据表示的数据,可能难以解释。一种简化的方法是假定感兴趣的数据位于高维空间内的嵌入非线性流形上。如果歧管的尺寸足够小,则数据可以在低维空间中可视化。

考虑一个表示为矩阵(或数据库表)的数据集,以便每行代表描述特定事例的一组属性(或特征或维度)。如果属性的数量很大,那么唯一可能的行的空间是指数级大的。因此,维数越大,采样空间越困难。这导致许多问题。对高维数据进行操作的算法往往具有非常高的时间复杂度。例如,许多机器学习算法都与高维数据相矛盾。这已成为维度的诅咒。将数据减少到更少的维度通常会使分析算法更高效,并且可以帮助机器学习算法做出更准确的预测。

人类在很多方面往往难以理解数据。因此,将数据减少到少量维度对于可视化目的非常有用。

NLDR在计算机视觉领域有几个应用。例如,考虑使用相机在闭合的静态环境中导航的机器人。由相机获得的图像可以被认为是高维空间中流形上的样本,该流形的内在变量将代表机器人的位置和方向。该实用程序不限于机器人。动态系统是包括机器人在内的更一般的系统类别,它是根据多方面来定义的。NLDR的积极研究试图展开与动力系统相关的观测流形,开发模拟这些系统的技术并使其能够自主操作。

Sammon的映射是第一个也是最受欢迎的NLDR技术之一。



分享到:


相關文章: