机器学习 第3页

独热编码与归一化的应用场景
机器学习

独热编码与归一化的应用场景

132 0

基于树的方法是不需要独热编码和特征的归一化基于参数的模型或基于距离的模型,都是要进行特征的归一化将离散型特征进行one-hot编码的作用,是为了让距离计算更合理,但如果特征是离散的,并且不用one-hot编码就可以很合理的计算出距离,那么就...

Data Leakage 详解
机器学习

Data Leakage 详解

384 0

原文链接:kaggle什么是Data Leakage?数据泄漏是一个数据科学家必须理解的重要概念。如果你不知道如何防止数据泄漏发生,那么它将会频繁发生,而且它将会以最隐秘,最危险的方式摧毁你的模型。具体而言,数据泄漏会导值你的模型看起来很精...

数据科学家需要知道的5个基本统计概念
机器学习

数据科学家需要知道的5个基本统计概念

105 0

原文链接:网页地址统计特征统计特征可能是数据科学中最常用的统计概念。 它通常是您在探索数据集时应用的第一种统计技术,包括偏差,方差,均值,中位数,百分位数等等。 在代码中理解和实现都非常容易! 请查看下面的箱型图来获取对各个概念的说明。中间...

为了性能,请停止使用pip安装tensorflow!
机器学习

为了性能,请停止使用pip安装tensorflow!

108 0

使用pip停止安装Tensorflow! 请改用conda。 如果您不知道conda是什么,它是一个跨平台运行的开源软件包和环境管理系统。 因此它适用于Mac,Windows和Linux。 如果你还没有使用conda,我建议你开始,因为它使...

梯度下降优化算法
机器学习

梯度下降优化算法

165 0

在前一篇介绍梯度下降的文章中,介绍了梯度下降的三种方法和实现。但是它们有一些挑战:选择合适的学习率可能很困难。学习率太小会导致收敛缓慢,而学习率过大会妨碍收敛并导致损失函数在最小值附近波动甚至发散。学习率表(Learning rate sc...

从零开始实现梯度下降算法
机器学习

从零开始实现梯度下降算法

187 0

机器学习最终归结为最优化问题,即最优化损失函数。而求解最优化问题最常用的方法就是梯度下降算法。梯度下降算法有三种:全批量梯度下降(Batch gradient decent)、随机梯度下降(SGD)、小批量梯度下降(mini-batch g...

为回归问题选择最佳的机器学习算法
机器学习

为回归问题选择最佳的机器学习算法

126 0

当接触任何类型的机器学习(ML)问题时,有许多不同的算法可供选择。 在机器学习中,有一种称为“天下无免费午餐”的定理,它表明基本上没有一种ML算法适合所有问题。 不同ML算法的性能很大程度上取决于数据的大小和结构。 因此,如何选择正确的算法...

机器学习完整解决流程演练 part2
机器学习

机器学习完整解决流程演练 part2

89 0

机器学习是一个强大的框架,从外部可能看起来复杂和令人生畏。然而,一旦我们将问题分解为其组件步骤,我们就会发现机器学习实际上只是一系列可理解的过程,每个过程都很简单。在本文中,我们将继续介绍哥斯达黎加预测贫困的方法,进行模型优化,解释模型,并...