首页 > 编程知识 正文

数据的归一化与标准化,归一化和标准化的联系与区别

时间:2023-05-03 18:10:47 阅读:50299 作者:482

1 .在大型项目的数据分析中,由于数据源的不同,数据的维度、数据的尺度通常会产生差异,因此介绍为了使这些数据能够比较,需要采用标准化方法消除这些差异。 3358 www.Sina.com/(normalization )是指对原始各项指标数据进行定标,去除数据单位限制,将其转换为无量纲纯数值。数据的标准化)。 数据标准化最典型的是数据规范化处理,即数据统一映射到[ 0,1 ]区间。

目前,数据标准化方法有多种,可以归纳为直线型方法(极值法、标准差法等)、折线型方法)、曲线型方法)、半正态分布等)。 不同的标准化方法对系统的评价结果有不同的影响,但不幸的是,数据标准化方法的选择没有共同的规律。 常见方法包括:最小最大标准化(最小最大正规化)、日志函数转换、atan函数转换、z-score标准化(zero-mena normalization )、该方法常用)

便于不同单位或量级的指标能够进行比较和加权又称方差归一化,是对原始数据进行线性变换,使结果落入[ 0,1 ]区间。 变换函数为以下的:其中max是样本数据的最大值,min是样本数据的最小值。 这种方法的缺点是,当新数据进入时,max和min可能发生变化,需要重新定义。min-max标准化(min-max normalization)用基于10的log函数进行变换,其中:y=log10(x )/log 10 (max ) ),max是样本数据的最大值,所有数据都大于或等于1log函数转换用反正切函数归一化数据:尝试用此方法映射到[ 0,1 ]区间,所有数据必须大于或等于0,小于0的数据映射到[-1,0 ]区间当然,没有必要将所有数据标准化的结果映射到[ 0,1 ]区间。 在这种情况下,可以使用atan函数转换。 该方法也被称为标准差标准化,即SPSS中最常见的标准化方法:z-score标准化,其平均值为0,标准差为1,变换函数为: y=()

2.3种最常用的方法z-score标准化方法

下面介绍三种最常用的标准化方法:min-max法(规范化方法),z-score法(正规化方法),比例法。

最小-最大法也称为方差归一化,是对原始数据进行线性变换,并将结果映射到[ 0,1 ]区间的方法。

方法1:min-max法(规范化方法)

该方法对方法2:z-score法(正规化方法)数据进行标准化。 使用z-score将a的原始值x标准化为y。 z-score标准化方法3358www.Sina.com/或基于原始数据的均值(mean)和标准差(standard deviation)时。 SSS的默认标准化方法是z-score标准化。 z-score的简化模型: y=1/(1 x ),通过证明x越大y越小,可以将较大的数控制在[0-1]之间。适用于属性A的最大值和最小值未知的情况

1 .求各变量(指标)算术平均值(数学期望) xi和标准差si;

2 .进行标准化处理: zij=(xij-Xi )/si

其中zij是标准化变量值,xij是实际变量值。

3 .调换反向指标前的符号。

标准化变量的值以0为中心上下移动,大于0时高于平均,小于0时低于平均。

有超出取值范围的离群数据

注意:此方法适用于所有数据为在Excel中进行z-score标准化的步骤如下:的序列。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。