regress回归分析,pooled regression

如果有以下培训数据：

(x1，明天)、(x2，后天)、(x3，后天)。

其中1项x表示一个事件，2项表示该事件发生的时间。

现在需要训练能够将事件x作为输入给出并输出发生的时间的模型。

乍一看是分类问题。

但是，在典型的分类方法中，上述标签是用one-hot编码的，因此如下所示。

(x1，)、0，0 )、)、x2，)、1，0 )、)、x3，)、0，1 ) )。

所以在分类时，当预测错误地分为类别时，损失是一样的。因为在one-hot代码中，类别之间的距离相同。

也就是说，如果给出x，模型预测的结果是明天。可见真正的标签在后天和后天都是同样的损失。这是不合理的。因为我们观察到这些标签有顺序关系。预测结果应该在明天的时候，真实的标签会比后天带来更大的损失。为什么这么说，是因为更远，更错。

解决方案：有序回归。

为了强调秩序，可以将上述数据编码为：

(x1，0 )，x2，1 )，x3，2 )。