上海交通大学ACM班创办人俞勇教授团队编写,"西瓜书"作者周志华力荐的机器学习入门书:《动手学机器学习》出版啦!
动手学机器学习

本书系统介绍了机器学习的基本内容及其代码实现,是一本着眼于机器学习教学实践的图书。
本书包含4个部分:第一部分为机器学习基础,介绍了机器学习的概念、数学基础、思想方法和简单的机器学习算法;第二部分为参数化模型,讲解线性模型、神经网络等算法;第三部分为非参数化模型,主要讨论支持向量机和决策树模型及其变种;第四部分为无监督模型,涉及聚类、降维、概率图模型等多个方面。本书将机器学习理论和实践相结合,以大量示例和代码带领读者走进机器学习的世界,让读者对机器学习的研究内容、基本原理有基本认识,为后续进一步涉足深度学习打下基础。
本书适合对机器学习感兴趣的专业技术人员和研究人员阅读,同时适合作为人工智能相关专业机器学习课程的教材。
系统梳理机器学习的主干知识

专业评论:
本书从机器学习的基本概念入手,结合sklearn机器学习算法库,以大量示例和代码带领读者走进机器学习的世界。 |
本书每一章都由一个Python Notebook组成,Notebook中包括机器学习相关概念定义、理论分析、算法过程和可运行代码。读者可以根据自己的需求白行选择感兴趣的部分阅读。例如,只想学习各个算法的整体思想而不关注具体实现细节的读者,可以只阅读除代码以外的文字部分;已经了解算法原理,只想要动手进行代码实践的读者,可以只关注代码的具体实现部分。
本书面向的读者主要是对机器学习感兴趣的高校学生(不论是本科生还是研究生)、教师、企业研究员及工程师。在阅读本书之前,读者需要掌握一些基本的数学概念和数理统计基础知识(如矩阵运算、概率分布和数值分析方法等)。
本书包含4个部分。第一部分为机器学习基础,主要讲解机器学习的基本概念以及两个最本书包含4个部分.第一部分为机器学习基础,主要讲解机器学习的基本概念以及两个最基础的机器学习算法,即KNN和线性回归,并基于这两个算法讨论机器学习的基本思想和实验原则。这一部分涵盖了机器学习最基础、最主要的原理和实践内容,完成此部分学习后就能在大部分机器学习实践场景中上手解决问题。第二部分为参数化模型,主要讨论监督学习任务的参数化模型,包括线性模型、双线性模型和神经网络。这类方法主要基于数据的损失函数对模型参数求梯度,进而更新模型,在代码实现方面具有共通性。第三部分为非参数化模型,主要关注监督学习的非参数化模型,包括支持向量机、树模型和梯度提升树等。把非参数化模型单独作为一个部分来讨论,能更好地帮助读者从原理和代码方面体会参数化模型和非参数化模型之间的区别和优劣。第四部分为无监督模型,涉及聚类、PCA降维、概率图模型、EM算法和自编码器,旨在从不同任务、不同技术的角度讨论无监督学习,让读者体会无监督学习和监督学习之间的区别。本书的4个部分皆为机器学习的主干知识,希望系统掌握机器学习基本知识的读者都应该学习这些内容。
本书为机器学习的入门读物,也可以作为高校机器学习课程教学中的教材或者辅助材料。
本书提供的代码都是基于Python 3编写的,读者需要具有一定的Python编程基础。我们对本书用到的Python工具库都进行了简要说明。每一份示例代码中都包含可以由读者白行设置的变量,方便读者进行修改并观察相应结果,从而加深对算法的理解。木书的源代码可在仓库https://github.com/boyu-ai/Hands-on-ML中下载。书中会尽可能对一些关键代码进行注释,但我们也深知无法将每行代码都解释清楚,还望读者在代码学习过程中多思考,甚至翻阅一些其他资料,以做到完全理解。
在入门机器学习的基础上,如果读者有兴趣以动手学的形式进一步了解深度学习,推荐阅读《动手学深度学习》;

如果读者有兴趣以动手学的形式进一步了解强化学习,推荐阅读《动手学强化学习》。

评论留言