赛博空间7号

The greatest enemy of knowledge is not ignorance, it is the illusion of knowledge.--Stephen William Hawking

随机森林衡量变量重要性的陷阱

随机森林中变量的重要性常见的计算方法有两种,一种是meandecreaseimpurity,即平均不纯度的减少,现在sklearn中用的就是这种方法;一种是meandecreaseaccuracy,即平均准确率的减少,常用袋外误差率去衡量。假设我们有两个变量,分别是A和B,A和B之间有较强的相关性,如果A对模型贡献度较大,由于B很像A,所以B也应该对模型贡献较大,但...
继续阅读

运筹学与机器学习的区别是什么?

1.先验知识层面,运筹学的先验知识更多,目标函数有各种约束条件;2.算法层面,两者都是在收敛能力和随机性trade-off;3.复杂度层面,机器学习的复杂度体现在庞大的数据,运筹学体现在目标的复杂,约束众多。4.模型方面,现实问题可分为离散优化和连续优化,运筹学两者都包含,以离散优化居多(组合优化);机器学习侧重连续优化,期望拟合一个分布。...
继续阅读

机器学习任务的一般步骤

数据采集和标记->特征选择->数据清洗->模型选择->模型训练->模型测试->模型保存...
继续阅读
© 版权所有:沈阳市和平区赛博空间咨询部|辽ICP备18005891号
Powered by Z-BlogPHP & Yiwuku.com