独热编码与归一化的应用场景

基于树的方法是不需要独热编码和特征的归一化

基于参数的模型或基于距离的模型,都是要进行特征的归一化

将离散型特征进行one-hot编码的作用,是为了让距离计算更合理,但如果特征是离散的,并且不用one-hot编码就可以很合理的计算出距离,那么就没必要进行one-hot编码。

评论