只需十四步:从零开始掌握Python机器学习(附资源)
2017-03-15 08:55:54   来源:   评论:0 点击:

选自kdnuggets作者:Matthew Mayo机器之心编译参与:黄小天、吴攀、晏奇、蒋思源Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教

第4步:更多的集成方法

 

上篇只涉及一个单一的集成方法:随机森林(RF)。RF 作为一个顶级的分类器,在过去几年中取得了巨大的成功,但它肯定不是唯一的集成分类器。我们将看看包装、提升和投票。

 

首先,阅读这些集成学习器的概述,第一个是通用性的;第二个是它们与 Scikit-learn 有关:

 

  • 集成学习器介绍,作者 Matthew Mayo。地址:http://suo.im/cLESw

  • Scikit-learn 中的集成方法,Scikit-learn 文档。地址:http://suo.im/yFuY9

 

然后,在继续使用新的集成方法之前,请通过一个新的教程快速学习随机森林:

 

  • Python 中的随机森林,来自 Yhat。地址:http://suo.im/2eujI

 

包装、提升和投票都是不同形式的集成分类器,全部涉及建构多个模型; 然而,这些模型由什么算法构建,模型使用的数据,以及结果如何最终组合起来,这些都会随着方案而变化。

 

  • 包装:从同一分类算法构建多个模型,同时使用来自训练集的不同(独立)数据样本——Scikit-learn 实现包装分类器

  • 提升:从同一分类算法构建多个模型,一个接一个地链接模型,以提高每个后续模型的学习——Scikit-learn 实现 AdaBoost

  • 投票:构建来自不同分类算法的多个模型,并且使用标准来确定模型如何最好地组合——Scikit-learn 实现投票分类器

 

那么,为什么要组合模型?为了从一个特定角度处理这个问题,这里是偏差-方差权衡的概述,具体涉及到提升,以下是 Scikit-learn 文档:

 

  • 单一评估器 vs 包装:偏差-方差分解,Scikit-learn 文档。地址:http://suo.im/3izlRB

 

现在你已经阅读了关于集成学习器的一些介绍性材料,并且对几个特定的集成分类器有了基本了解,下面介绍如何从 Machine Learning Mastery 中使用 Scikit-learn 在 Python 中实现集成分类器:

 

  • 使用 Scikit-learn 在 Python 中实现集成机器学习算法,作者 Jason Brownlee。地址:http://suo.im/9WEAr

相关热词搜索:只需 机器 资源

上一篇:微课:Flash引导动画的制作
下一篇:作业批改及时化、智能化的实现

分享到: 收藏