首页 > 编程知识 正文

IV计算公式,iv值含义

时间:2023-05-04 14:30:31 阅读:234224 作者:1056

       在建模的时候,我们对会单个变量的预测能力进行预测,主要使用IV值这个指标,IV值的预测能力如下:

           IV<=0.02 : 无预测能力;

          0.02 - 0.1 :弱预测能力;

          0.1 - 0.3 :中预测能力;

          0.3 - 0.5 :强预测能力;

          大于0.5的为超强预测能力;

       IV值的计算公式:

         

        Pgood_section_total:分箱好用户与整体好用户比值;

        Pbad_section_total:分箱坏用户与整体坏用户比值;

        Pgood_section:分箱好用户与该分箱整体比值;

        Pbad_section:分箱坏用户与该分箱整体比值;

        Pgood_total:好用户与整体占比;

        Pbad_total:好用户与整体占比;

Python实现逻辑:

d1=pd.DataFrame({'X':data['type'],'Y':data['SeriousDlqin2yrs']})d2 = d1.groupby(['X'],as_index=True)#单个特征个数good=data['SeriousDlqin2yrs'].sum()bad=data['SeriousDlqin2yrs'].count()-goodd3 = pd.DataFrame(d2.X.count(),columns=['good_count'])d3['good_count'] = d2.sum().Yd3['total_count'] = d2.count().Yd3['rate'] = d3['good_count']/d3['total_count']d3['goodall_rate'] = d3['good_count']/goodd3['jzdwdm_rate'] = (d3['total_count'] - d3['good_count'])/badd3['woe'] = np.log((d3['rate']/(1-d3['rate']))/((good/(bad+good))/(bad/(bad+good)))) d3['IV'] = (d3['goodall_rate'] - d3['jzdwdm_rate'])*d3['woe']IV = d3['IV'].sum()print (d3)print ('IV=',IV)

Excel实现逻辑:
     excel具体公式在资源中进行下载:

 

 

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。