各种baseline CNN + FC + softmax
FC的输出维度由数据集打分的范围决定,例如1-10分则为10个分类
文章的重点主要在于采用了这个EMD函数,之前没见过,需要理解一下
CDF是累计分布概率函数,所以能够体现出有序类别中的类间关系,[21]中已经证明对于这种从1-10打分的分类问题来说,EMD loss比CE loss的效果更好。
[21] L. Hou, C.-P. Yu, and D. Samaras, “Squared earth mover’s distancebased
loss for training deep neural networks,” arXiv preprint
arXiv:1611.05916, 2016. 2, 6