只需十四步:从零开始掌握Python机器学习(附资源)
2017-03-15 08:55:54   来源:   评论:0 点击:

选自kdnuggets作者:Matthew Mayo机器之心编译参与:黄小天、吴攀、晏奇、蒋思源Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教

第二步:机器学习基础技巧

 

KDnuggets 的 Zachary Lipton 已经指出:现在,人们评价一个「数据科学家」已经有很多不同标准了。这实际上是机器学习领域领域的一个写照,因为数据科学家大部分时间干的事情都牵涉到不同程度地使用机器学习算法。为了有效地创造和获得来自支持向量机的洞见,非常熟悉核方法(kernel methods)是否必要呢?当然不是。就像几乎生活中的所有事情一样,掌握理论的深度是与实践应用相关的。对机器学习算法的深度了解超过了本文探讨的范围,它通常需要你将非常大量的时间投入到更加学术的课程中去,或者至少是你自己要进行高强度的自学训练。

 

好消息是,对实践来说,你并不需要获得机器学习博士般的理论理解——就想要成为一个高效的程序员并不必要进行计算机科学理论的学习。

 

人们对吴恩达在 Coursera 上的机器学习课程内容往往好评如潮;然而,我的建议是浏览前一个学生在线记录的课堂笔记。跳过特定于 Octave(一个类似于 Matlab 的与你 Python 学习无关的语言)的笔记。一定要明白这些都不是官方笔记,但是可以从它们中把握到吴恩达课程材料中相关的内容。当然如果你有时间和兴趣,你现在就可以去 Coursera 上学习吴恩达的机器学习课程:http://suo.im/2o1uD

 

  • 吴恩达课程的非官方笔记:http://www.holehouse.org/mlclass/

 

除了上面提到的吴恩达课程,如果你还需要需要其它的,网上还有很多各类课程供你选择。比如我就很喜欢 Tom Mitchell,这里是他最近演讲的视频(一起的还有 Maria-Florina Balcan),非常平易近人。

 

  • Tom Mitchell 的机器学习课程:http://suo.im/497arw

 

目前你不需要所有的笔记和视频。一个有效地方法是当你觉得合适时,直接去看下面特定的练习题,参考上述备注和视频恰当的部分,

 

第三步:科学计算 Python 软件包概述

 

好了,我们已经掌握了 Python 编程并对机器学习有了一定的了解。而在 Python 之外,还有一些常用于执行实际机器学习的开源软件库。广义上讲,有很多所谓的科学 Python 库(scientific Python libraries)可用于执行基本的机器学习任务(这方面的判断肯定有些主观性):

 

  • numpy——主要对其 N 维数组对象有用 http://www.numpy.org/

  • pandas——Python 数据分析库,包括数据框架(dataframes)等结构 http://pandas.pydata.org/

  • matplotlib——一个 2D 绘图库,可产生出版物质量的图表 http://matplotlib.org/

  • scikit-learn——用于数据分析和数据挖掘人物的机器学习算法 http://scikit-learn.org/stable/

 

学习这些库的一个好方法是学习下面的材料:

 

  • Scipy Lecture Notes,来自 Gaël Varoquaux、Emmanuelle Gouillart 和 Olav Vahtras:http://www.scipy-lectures.org/

 

  • 这个 pandas 教程也很不错:10 Minutes to Pandas:http://suo.im/4an6gY

 

在本教程的后面你还会看到一些其它的软件包,比如基于 matplotlib 的数据可视化库 Seaborn。前面提到的软件包只是 Python 机器学习中常用的一些核心库的一部分,但是理解它们应该能让你在后面遇到其它软件包时不至于感到困惑。

 

下面就开始动手吧!

 

第四步:使用 Python 学习机器学习

 

首先检查一下准备情况

 

  • Python:就绪

  • 机器学习基本材料:就绪

  • Numpy:就绪

  • Pandas:就绪

  • Matplotlib:就绪

 

现在是时候使用 Python 机器学习标准库 scikit-learn 来实现机器学习算法了。


下面许多的教程和训练都是使用 iPython (Jupyter) Notebook 完成的,iPython Notebook 是执行 Python 语句的交互式环境。iPython Notebook 可以很方便地在网上找到或下载到你的本地计算机。

相关热词搜索:只需 机器 资源

上一篇:微课:Flash引导动画的制作
下一篇:作业批改及时化、智能化的实现

分享到: 收藏