首页 > 编程知识 正文

regress回归分析,pooled regression

时间:2023-05-05 11:40:57 阅读:116148 作者:4806

如果有以下培训数据:

(x1,明天)、(x2,后天)、(x3,后天)。

其中1项x表示一个事件,2项表示该事件发生的时间。

现在需要训练能够将事件x作为输入给出并输出发生的时间的模型。

乍一看是分类问题。

但是,在典型的分类方法中,上述标签是用one-hot编码的,因此如下所示。

(x1,)、0,0 )、)、x2,)、1,0 )、)、x3,)、0,1 ) )。

所以在分类时,当预测错误地分为类别时,损失是一样的。 因为在one-hot代码中,类别之间的距离相同。

也就是说,如果给出x,模型预测的结果是明天。 可见真正的标签在后天和后天都是同样的损失。 这是不合理的。 因为我们观察到这些标签有顺序关系。 预测结果应该在明天的时候,真实的标签会比后天带来更大的损失。 为什么这么说,是因为更远,更错。

解决方案:有序回归。

为了强调秩序,可以将上述数据编码为:

(x1,0 ),x2,1 ),x3,2 )。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。