首页 > 编程知识 正文

用变异系数法确定权重的基本思想(求权重时系数会大于1吗)

时间:2023-05-03 12:53:49 阅读:68066 作者:1754

文章目录概念变异系数变异系数权重法最小-最大标准化Python编码可视化效果

概念变异系数Coefficient of Variation计算公式:变异系数数=标准偏差/平均值变动系数=标准偏差/平均值变动系数=标准偏差/平均值比较两组维度不同数据的离散度,不能使用标准偏差,可以考虑变动系数

不适用的场景:数据下限小于0 (平均值接近0 ) ) ) ) ) )。

变动系数越大,方差越大的变动系数权重法是根据变动系数进行加权的计算方法。 权重i=变动系数i /全部变动系数i /全部变动系数和权重_i=变动系数_i /全部变动系数的和权重i=变动系数i /全部变动系数的和方差大的列,随着数据的变化而得到高权重参数,该方法的应用场合少,为330

考虑在什么场景下使用? 无标签、缺乏工作经验时,最小-最大标准化计算方法:新数据=(原数据最小值(/最大值最小值)新数据=)原数据-最小值)/(新数据=)原数据最小值)/(最大值最小值)效果:

1、将数据映射到[ 0,1 ]

2、消除维度差异

3、扩大差距场景:

老师给学生评分(如文明分、道德分……),分数区间为[ 0,100 ],有些学生固执也不会低于80分。 结果所有学生分数为80~100,有优劣的学生之间相差不到20%。 使用最小最大标准化,也许可以恢复学生之间真正的差距,通过Python代码可视化效果

可以将原始数据(第一个表)的平均点理解为所有特征的权重相等

五名员工的平均分相差不大

员工1最弱,员工5最流弊,员工234相等

用最小-最大标准化平均分会放大员工1的弱点

技术能力变异系数最大、权重最高的MinMax标准化数据的平均分(第2表)员工432 )对最小-最大标准化数据进行变异系数法加权(第3表)员工1反而变得最流动,员工1 seriesfromsklearn.preprocessingimportminmax _ scalefromnumpyimportndarray #原始数据df :数据帧=数据帧({ (员工编号653360 ) 120、90、60、31]、“管理力”:[80、90、100、110、120]、“社区力”3360[70] }print(df ) #变异系数coefficient df.mean ) print ) coefficient _ of _ varies weight : series=coefficient _ of _ variation/sum(coefficient_of_variation ) print (weight ) )权重原始数据的最小-最大标准化mm 3360 nd array=minmax _ scale (df [ df.colulury ] 计算总分score3360series=mm.dot(weight ) print (score ),对总分进行MinMax标准化df('minmax标准化总分') 3360 series=minmax _ sccore

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。