内容简介

本书主要内容包括机器学习介绍,NumPy、Pandas、SciPy库、Matplotlib(可视化)四个基础模块,Scikit-learn算法、模型、拟合、过拟合、欠拟合、模型性能度量指标、数据标准化、非线性转换、离散化,以及特征抽取和降维的各种方法,包括特征哈希、文本特征抽取、特征聚合等。全书通过实用范例和图解形式讲解,选材典型,案例丰富,适合从事大数据、数据挖掘、机器学习等人工智能领域开发的各类人员。