如果有以下培训数据:
(x1,明天)、(x2,后天)、(x3,后天)。
其中1项x表示一个事件,2项表示该事件发生的时间。
现在需要训练能够将事件x作为输入给出并输出发生的时间的模型。
乍一看是分类问题。
但是,在典型的分类方法中,上述标签是用one-hot编码的,因此如下所示。
(x1,)、0,0 )、)、x2,)、1,0 )、)、x3,)、0,1 ) )。
所以在分类时,当预测错误地分为类别时,损失是一样的。 因为在one-hot代码中,类别之间的距离相同。
也就是说,如果给出x,模型预测的结果是明天。 可见真正的标签在后天和后天都是同样的损失。 这是不合理的。 因为我们观察到这些标签有顺序关系。 预测结果应该在明天的时候,真实的标签会比后天带来更大的损失。 为什么这么说,是因为更远,更错。
解决方案:有序回归。
为了强调秩序,可以将上述数据编码为:
(x1,0 ),x2,1 ),x3,2 )。