为什么要将数据降维?
实际APP应用程序的数据一般是高维的,例如手写数字,如果缩放到2828的图像大小,则该维为2828=784维。
举个简单的例子:
下图是手写1及其对应图像的二维矩阵,数据已经归一化在[ 0,1 ]的范围内。
降维的目的有很多,但我个人认为最主要的目的有两个:
1 .为了将数据可视化,进行数据的观察和探索。
2 .另一个目的是简化机器学习模式的训练和预测。
虽然高维数据难以直观地识别,但是只要将数据的维度降低到二维或三维,且维持数据点的关系,与原始高维空间中的关系保持不变或近似,就能够可视化,用肉眼观察数据。
数据降维后,如果保留原始数据的主要信息,就可以使用降维的数据进行机器学习模型的训练和预测,大大减少了数据量,大大提高了训练和预测的时间效率。
降维实例:
以下python代码对digits数据集进行tsne维化和显示。 读者可以将代码复制到Jupyter notebook中并执行。
程序的执行结果如下。
有关详细分析和数据检索,请参阅:
3358 cloud.yisurvey.com :9081/html/529942 A8-212 c-4c 85-9c 92-9c 56 beb4a 299.html? ly=csdn
本文转载自网络,仅用于学习交流。 内容的版权归原作者所有。 例如,有关相关作品、版权和其他问题,请与删除处理联系。
特别说明:本文以技术交流为目的,请勿将相关技术用于非法用途。 否则,一切后果都会自负。 如果你觉得我们侵犯了你的合法权益,请联系我们处理。