主要看模型是否有伸缩不变性。
在某些模型中,每个维不均匀拉伸后,最佳解可能不等效于原始解。 例如,SVM。 在这样的模型中,除了原本各维数据的分布范围比较近的情况以外,需要进行标准化以使模型参数不被分布范围宽的数据或小的数据所支配。
也有模型在各维不均匀伸缩后,最佳解与原等价。 例如,逻辑注册。 对于这种模型,是否标准化在理论上不会改变最优解。 但是,由于在实际求解中经常使用迭代算法,如果目标函数的形式太“平坦”,迭代算法可能不会很慢收敛。 因此,对于具有伸缩不变性的模型,也最好进行数据的标准化。
作者:王椋Maigo
链接: https://www.zhi Hu.com/question/30038463/answer/50491149
来源:知乎
版权归作者所有。 商业转载请联系作者取得许可。 非商业转载请注明出处。