独热编码与归一化的应用场景

基于树的方法是不需要独热编码和特征的归一化

基于参数的模型或基于距离的模型,都是要进行特征的归一化

将离散型特征进行one-hot编码的作用,是为了让距离计算更合理,但如果特征是离散的,并且不用one-hot编码就可以很合理的计算出距离,那么就没必要进行one-hot编码。

版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

评论