2018年10月

模型调参工具
机器学习

模型调参工具

114 0

optimize tools:scikit-optimize(Sequential model-based optimization with a `scipy.optimize` interface ),hyperopt(Distribu...

独热编码与归一化的应用场景
机器学习

独热编码与归一化的应用场景

125 0

基于树的方法是不需要独热编码和特征的归一化基于参数的模型或基于距离的模型,都是要进行特征的归一化将离散型特征进行one-hot编码的作用,是为了让距离计算更合理,但如果特征是离散的,并且不用one-hot编码就可以很合理的计算出距离,那么就...

Data Leakage 详解
机器学习

Data Leakage 详解

334 0

原文链接:kaggle什么是Data Leakage?数据泄漏是一个数据科学家必须理解的重要概念。如果你不知道如何防止数据泄漏发生,那么它将会频繁发生,而且它将会以最隐秘,最危险的方式摧毁你的模型。具体而言,数据泄漏会导值你的模型看起来很精...

python的argparse模块
python

python的argparse模块

123 0

我们直接上代码:import argparse parser = argparse.ArgumentParser() parser.add_argument('integers', ...

数据科学家需要知道的5个基本统计概念
机器学习

数据科学家需要知道的5个基本统计概念

96 0

原文链接:网页地址统计特征统计特征可能是数据科学中最常用的统计概念。 它通常是您在探索数据集时应用的第一种统计技术,包括偏差,方差,均值,中位数,百分位数等等。 在代码中理解和实现都非常容易! 请查看下面的箱型图来获取对各个概念的说明。中间...

为了性能,请停止使用pip安装tensorflow!
机器学习

为了性能,请停止使用pip安装tensorflow!

96 0

使用pip停止安装Tensorflow! 请改用conda。 如果您不知道conda是什么,它是一个跨平台运行的开源软件包和环境管理系统。 因此它适用于Mac,Windows和Linux。 如果你还没有使用conda,我建议你开始,因为它使...

每日一条
每日一条

每日一条

85 0

用数据驱动决策,最主要的问题在于,可能看不到数据长远的变化。目前看似合理的指标,过两年可能就变成产品杀手。 就像是AI:数据提供了局部泛化,但长远考虑,还需要原则。 via:François Chollet...