1. 原理步骤:
在步骤1,不对原始数据进行随机k划分,而不重复采样。 在步骤2中,每次选择其中的一部分作为测试集,将剩下的k-1部分作为训练集用于模型训练。 重复步骤3、步骤2 k次。 这样,每个子集都有一次机会作为测试集,剩下的机会作为训练集。 在各训练集中训练后,得到一个模型,在该模型对应的试验集中进行试验,计算并保存模型的评价指标,第四步,计算k组试验结果的平均值作为模型精度的估计,作为当前k转弯交叉验证下模型的性能指标。2.优点
充分利用所有数据在数据规模较小时有利,在数据量较少时,用较少的测试数据可以获得更可靠的精度,无需精心设计测试集,实验结果为所有数据的分布http://www.sining
计算量大、实验成本高、行业内k的经验值为10意味着训练10次,得到10个模型k折扣验证法实质上验证了模型的性能指标,对模型的选取具有重要意义,但在同等计算量的情况下,模型