- 机器学习中的统计思维(Python实现)
- 董平编著
- 691字
- 2024-12-27 19:19:26
0.4 如何使用本书
我想发表的是什么?伦纳德·萨维奇(L.J.Savage,1962年)用这个问题表达了他的困惑。无论他选择讨论什么主题,也无论他选择哪种写作风格,他都肯定会被批评没有选择另一种。就这一点来说他并不孤独。我们只能祈求读者对我们的个人差异能多一点容忍。
——杰恩斯(E.T.Jaynes,《概率论沉思录》)
这是我的第一本书,但不是最后一本书。写作让我打开了一个新的领域,使得我将所有的创作想法毫无保留地对读者开放。每当想到有人愿意打开书页认真阅读本书时,我都心甚喜之,愿读者可以与我产生共鸣。
本书重点介绍机器学习中监督学习所涉及的方法与模型,分为主体书与一本小册子。主体书将从根本思想出发,以与读者共同探索的形式呈现,配合算法、例题和Python代码多方位理解模型的构成原理;小册子重点介绍辅助模型所需的数字概念与方法。我将在主体书中的必要位置标注相应知识内容在小册子中的页码,以便于读者查阅。若读者有着扎实的数学和统计学基础,小册子可略去不读。另外,尽管我已尽力保证本书中符号的一致性,但由于书中数学符号繁多,仍有可能出现过载情形,因此,每个符号的含义请以各章节中的具体解释为准。因模型之间存在关联,为使读者对每个模型方法的理解更加深刻,建议读者先略过公式通读本书,细读时再推导公式。
主体书一共包含11章,书中所介绍的K近邻算法、朴素贝叶斯算法、C4.5算法、CART算法、支持向量机算法、EM算法、AdaBoost算法入选至“数据挖掘十大算法”。监督学习算法导图如下页所示。本着求知的精神,本书中每章都将围绕着一系列的问号展开。另外,每章都将给出思维导图,以方便读者学习及复习使用。
(1) 本书中的一个虚拟人物。他将贯穿全书地陪伴大家的学习。
第1章 监督学习算法导图