前言

近十年来,大数据、人工智能和深度学习开始流行,与它们相关联的机器学习技术也已经被人们所熟知。

机器学习算法并非只有数据分析师才需要理解并在工作中应用,软件工程师和项目管理人员等也会用到。因此,本书将为大家讲解各种机器学习算法。

刚开始接触机器学习的人可能会对不熟悉的数学公式和统计术语感到头疼。这时,我们可以借助图来理解,这有助于我们把握机器学习的全貌。为了帮助非科班出身的机器学习初学者理解,本书在讲解时尽可能少地使用数学公式,主要使用的是图,所以各种算法的特征和不同一目了然。

如果你在尝试学习机器学习时因不熟悉数学公式和统计术语而受挫,那么一定要读一读本书。

本书代码是使用 Python 实现的。Python 是极具人气的编程语言,它有丰富的机器学习和统计相关的库。请务必一边实际地运行代码,一边阅读本书。

目标读者

本书的目标读者如下。

  • 对机器学习感兴趣,并且已开始学习的人。
  • 了解一些机器学习算法,想学习更多机器学习算法的人。
  • 不擅长数学公式,在阅读机器学习专业书时感到吃力的人。
  • 希望能够根据要解决的问题选择恰当的机器学习算法的人。
  • 有一定的编程经验,能够运行示例代码的人。

本书不会详细解释机器学习的数学背景知识以及进行调优计算时的具体步骤。如果读者想深入理解,请阅读参考文献或相关图书。

本书的主要内容

各章内容如下。

首先,第 1 章是对机器学习基础知识的说明。如果想先了解一下机器学习的整体情况,请从第 1 章开始按顺序阅读。

第 2 章和第 3 章讲解了一些机器学习算法。如果读者对机器学习有一定程度的了解或者想学习某个算法,可以从这两章的算法开始读起。

第 4 章综合介绍了机器学习的评估方法。在实际使用机器学习时,这一章的内容一定会对读者有所帮助。

第 5 章介绍了 Python 的环境搭建方法。

关于数学公式和符号

针对本书涉及的数学公式和符号,说明如下。

  • 向量

    向量用小写字母粗斜体表示。向量的第 个元素表示为

     

  • 矩阵

    矩阵用大写字母粗斜体表示。矩阵第 行第 列的元素表示为

     

  • 总和

    元素的总和用∑符号表示。计算 个值 的总和的数学式表示为:

本书的示例代码

  • 本书示例代码的运行环境

    经过验证,本书各章的示例代码可以在以下环境正常运行。

    • Python:3.7
    • scikit-learn:0.20.3

     

  • 示例代码的下载地址

    本书的示例代码可从图灵社区本书主页1下载。

     

  • 免责声明

    我们已确认在正常使用示例代码时不会发生任何问题,但是对于应用本书示例代码所产生的一切损失,作译者和出版方概不负责。

1请至“随书下载”处下载本书示例代码文件。——编者注