首页 > 编程知识 正文

洛伦兹曲线的定义(ks值为1)

时间:2023-05-06 20:27:24 阅读:73080 作者:1669

Kolmogorov-Smirnov (ks )值越大,表示模型区分正、负客户的程度越大。 KS值的可取范围为[ 0,1 ]

一般来说,KS0.2表示模型的预测精度较高。

ks的求解方法:

ks需要两个值: TPR和FPR。 真等级率(true positive rate,TPR ),公式为TPR=TP/) TPfn ),表示分类器识别的正实例占所有正实例的百分比。 另一个是伪正等级率false positive rate,FPR,计算公式为FPR=FP/(FP TN ),计算分类器误认为正等级的负实例占所有负实例的比例。 ks=max(TPR-FPR )。 其中:

TP :真的是1,预测是1的数

(FN )真为1、预测为0的数

FP :真为0、预测为1的数

TN :真为0,预测为0的数

一言以蔽之:

KS曲线是两条线,其横轴为“阈值”(区间编号、概率顺序的等分),纵轴为TPR (上侧)和FPR (下侧) )的值,值的范围为[ 0,1 ]。 对应于两条曲线之间最远距离的阈值是最能分割模型的阈值。

计算步骤:

1 .可以按照分类模型返回概率的升序排列,也可以直接排列为数据,只要根据某个阈值判断为1或0即可

2.0-1之间进行n等分,将等分点作为阈值,计算TPR、FPR (可以分别作为阈值) ) ) )。

3 .将TPR、FPR绘制在纵轴上即可。 以10%*k(k=1、2、3、…、9 )为横轴,分别以TPR和FPR的值为纵轴,就可以画出两条曲线。 这就是中小学曲线。 )

KS值为max(TPR-FPR )

Python代码实现:

注意:以下代码只是采用非常简洁的实现方式,以帮助理解原理。 (横轴用概率等分时直接使用的阈值进行计算等分,实际上有更准确的方式。 (传输门:3359 blog.csdn.net/sscc _ learning/article/details/86777 UTM _ medium=distribute.PC _ relevant.)

#--编码: utf-8---- # 自行实现计算ks和froms klearn.metricsimportroc _ curveimportmatplotlib.pyplotaspltimportseabornaborn的% configinlinebackend.figind font.sans-serif']=['Simhei']# 中文字体设置-解决黑体PLT保存图像中减号“-”显示为方形的问题SNS.set(font='Simhei”) Seaborn解决中文显示问题classbinjianana 3360 def _ _ init _ (ssborn 预测计算TPR和FPR #lst1为真值,lst2为预测值TP=sum([1ifa==b==1else0fora,binzip(lst1,lst2) ] )正例为正例fn=st2 ) lst2) )正例为反例TPR=TP/) TPfn ) TN=sum([1ifa==b==0else0fora,binzip ) lst1,lst2] ) )反例预测为FP=sum () lst2) ] )反例为正例FPR=FP/(TNFP ) returnTPP和预测的real_data, data(:#real_data为真值,data为原始数据d=[ ] fori in data 3360 pre _ data=[1if line=I else0forlineindata ],实际上是pre_data ) )返回最大值(d ) d ), data[d.index(max ) d ) ]defgetks。输出对应于分割点和累计分布函数的图形输入值: y_pred_prob:一维数组或series,并计算模型分数(通常为正类thresholds=roc_curve(y_test,y_pred_prob ) ks=max (),表示一维数组或series,表示真标签({ 0,1 }或)-1,1 tpr ) PLT.xlabel(falsepositiverate ) (PLT.ylabel ) truepositiverate ) (plt.show ) #ks曲线PLT.plot (TPR ) )绘制PLT ksif _ name _==' _ _ main _ ' 3360 a=binjianana (data=[ 790,22,345 ] 178、198、567、222 ) #原始分数数据real _ 0.46、0.55、0.56、0.56、0.38、0.37、0.73、0.77和0.21]#以下只是演示如何调用方法,两个方法是独立计算的,且数据之间没有关联,因此得到的ks是PPP

#参考博客: http://www.Sohu.com/a/132667664 _ 278472

如果有错误的地方,请指出来。 谢谢~

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。