1、为什么要进行数据样本归一化?
在对数据集进行处理和分析时,不同数据的比较需要进行包括维和维度在内的各项目的数据统一标准化处理,以建立各类数据的可比性。 维度:物理量的基本属性。
2、数据归一化处理方法有哪些?
最小-最大标准化、z-score标准化、log函数标准化、atan函数标准化等。
3、数据归一化处理方法
最小-最大标准化方法是原始数据的线性变换。 将minA和maxA分别作为属性a的最小值和最大值,用min-max将属性a的原始值v之一标准化,映射到区间[new_minA,new_maxA]内的v’。 转换公式如下。
和是数据集中的最小值和最大值。
z-score标准化方法需要数据集合的平均值、数据集合的标准差、以及个体的观测值x,其变换公式如下
4、数据处理结果
各位朋友,文章若有任何问题,不吝赐教!