首页 > 编程知识 正文

r语言 决策树,归一化怎么算

时间:2023-05-05 10:15:07 阅读:173435 作者:625

规范化是指对需要处理的数据进行处理后,将其限制在所需范围内(通过某种算法)。 首先正规化是为了方便后面的数据处理,其次保正程序运行时的收敛会变快。

r语言中的正则化函数: scale

数据规范化包括数据中心化和数据标准化。

1 .数据中心化

数据中心化是指从数据集中的每个数据中减去数据集的平均值。

例如,如果存在数据集1、2、3、6、3,并且其平均值为3,则中心化的数据集可为1-3、2-3、3-3、6-3、3-3,也就是-2、-1、0、3、- 3

2 .数据标准化

数据标准化是指将中心化的数据除以数据集的标准偏差,然后从数据集中的每个数据中减去数据集的平均值,再除以数据集的标准偏差。

例如,假设存在平均值为3并且标准偏差为1.87的数据集1、2、3、6和3,则标准化的数据集为(1-3)/1.87,(2-3)/1.87,(3-3)/1.87

数据中心化和标准化的意义相同,是为了消除维度对数据结构的影响。 r语言可以使用scale方法来中心化和标准化数据。

scale函数处理组的数量。 默认情况下,组中的每个数减去组的平均值,然后除以组数的标准差。

有以下两个参数。

center=真。 默认情况下,从组中的每个数中减去平均值,如果为false,则不减去平均值。

比例=真。 默认情况下,组中的每个数除以标准偏差。

默认情况下,scale从组数的每个数中减去组数的平均值,然后除以组数的标准差。

是scale(ss )

[,1]

[1,] -1.3805850

[2,] -0.6371931

[3,] 0.1061988

[4,] 0.8495908

[5,] 1.5929827

[6,] 0.1061988

[7,] -0.6371931

attr (,' scaled:center ' )。

[1] 2.857143

attr (,' scaled:scale ' )。

[1] 1.345185

到目前为止,我们已经介绍了r语言规范化处理的实例,关于r语言规范化处理的内容,请检索脚本房屋的以前的文章,或者继续阅读下一篇相关文章。 我想今后继续支持脚本屋。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。