ndcg是什么意思,评价指标概念

胡思乱想：

相比于推荐，搜索结果，更加关注排序的位置。所以评价指标中加入位置信息可以理解，但是有人说用该指标衡量推荐效果，茫茫然的感觉，总觉得不合适。个人觉得推荐是强推出一系列item，对item之间的相关性要求不高，并且item之间的相关性不能太高！！为什么？如果推荐的item都是一个类别，你还想继续看吗？纯属过推荐，让用户喷做的啥东东。。。推荐中需要考虑一些多样性，结合用户喜好，增加多样性，让用户有可选的item，俗称多一些备份，保不齐你想要什么。如果有很相似的item近邻，也要将其打散开来，不要挤在一起。

下面资料是网上找的汇总后形成的文档。

概念

　　NDCG，Normalized Discounted cumulative gain 直接翻译为归一化折损累计增益，可能有些晦涩，没关系下面重点来解释一下这个评价指标。这个指标通常是用来衡量和评价搜索结果算法（注意这里维基百科中提到了还有推荐算法，但是我个人觉得不太适合推荐算法，后面我会给我出我的解释）。DCG的两个思想：

　　1、高关联度的结果比一般关联度的结果更影响最终的指标得分；

　　2、有高关联度的结果出现在更靠前的位置的时候，指标会越高；

累计增益（CG）

　　CG，cumulative gain，是DCG的前身，只考虑到了相关性的关联程度，没有考虑到位置的因素。它是一个搜素结果相关性分数的总和。指定位置p上的CG为：

　　reli 代表i这个位置上的相关度。

　　举例：假设搜索“篮球”结果，最理想的结果是：B1、B2、 B3。而出现的结果是 B3、B1、B2的话，CG的值是没有变化的，因此需要下面的DCG。

折损累计增益（DCG）

　　DCG， Discounted 的CG，就是在每一个CG的结果上处以一个折损值，为什么要这么做呢？目的就是为了让排名越靠前的结果越能影响最后的结果。假设排序越往后，价值越低。到第i个位置的时候，它的价值是 1/log2(i+1)，那么第i个结果产生的效益就是 reli * 1/log2(i+1)，所以：

　　当然还有一种比较常用的公式，用来增加相关度影响比重的DCG计算方式是：

　　百科中写到后一种更多用于工业。当然相关性值为二进制时，即 reli在{0,1}，二者结果是一样的。当然CG相关性不止是两个，可以是实数的形式。

归一化折损累计增益（NDCG）

　　NDCG， Normalized 的DCG，由于搜索结果随着检索词的不同，返回的数量是不一致的，而DCG是一个累加的值，没法针对两个不同的搜索结果进行比较，因此需要归一化处理，这里是除以IDCG。

　　IDCG为理想情况下最大的DCG值。

　　其中 |REL| 表示，结果按照相关性从大到小的顺序排序，取前p个结果组成的集合。也就是按照最优的方式对结果进行排序。

实际的例子

　　假设搜索回来的5个结果，其相关性分数分别是 3、2、3、0、1、2

　　那么 CG = 3+2+3+0+1+2

　　可以看到只是对相关的分数进行了一个关联的打分，并没有对召回的所在位置对排序结果评分对影响。而我们看DCG：

reli

log2(i+1)

reli /log2(i+1)

1.58

1.26

1.5

2.32

2.58

0.38

2.8

0.71

　　所以 DCG = 3+1.26+1.5+0+0.38+0.71 = 6.86

　　接下来我们归一化，归一化需要先结算 IDCG，假如我们实际召回了8个物品，除了上面的6个，还有两个结果，假设第7个相关性为3，第8个相关性为0。那么在理想情况下的相关性分数排序应该是：3、3、3、2、2、1、0、0。（仔细看清楚，这里对相关性从低到高进行了排序，已经无关乎当时排序的位置。什么是理想情况，idea situation，那就是最相关的排在最前面。）计算IDCG@6:

reli

log2(i+1)

reli /log2(i+1)

1.58

1.89

1.5

2.32

0.86

2.58

0.77

2.8

0.35

　　所以IDCG = 3+1.89+1.5+0.86+0.77+0.35 = 8.37

　　so 最终 NDCG@6 = 6.86/8.37 = 81.96%

应用

主要是应用评价搜索引擎的排序是否合理。应用主要有三种不同的方案：

最精准的方案是，用人工标注的方案，如果doc的数据量较少的时候，可以采用这种方案，如果数据量较大，会花费很多人力物力。拉取竞品的排序数据，可以为一个排序打分参考，如果竞品做得比较好的，还是值得参考的。拉取用户点击行为进行评估。

有了排序的分值，即可实现NDCG的评估和计算。

代码

一个list的ndcg计算方式如下：

topK的dcg计算：

def dcg_at_k(list_data, k): list_float_data = np.asfarray(list_data)[:k] dcg = np.sum(list_float_data / np.log2(np.arange(2, list_float_data.size + 2))) return dcg

这里解释一下，在推荐场景中，根据列表进行计算dcg，没有对相关进行约束，默认相关度rel=1。

topk的ndcg计算：

def ndcg_at_k(list_data, k, label_index): list_label_data = [line[label_index] for line in list_data] ideal_dcg = dcg_at_k(sorted(list_label_data, reverse=True), k) if ideal_dcg <= 0.0: return 0.0 dcg = dcg_at_k(list_label_data, k) / ideal_dcg ndcg = dcg / ideal_dcg return ndcg

计算idcg时，加入了label，这个label就是输入样本的label，比如点击或者下单为1，曝光未点击为0；

参考https://www.cnblogs.com/by-dream/p/9403984.html

代码可参考https://blog.csdn.net/zhouwenyuan1015/article/details/68072431