- 机器学习实战:基于Scikit-Learn、Keras和TensorFlow(原书第3版)
- (法)奥雷利安·杰龙
- 13字
- 2024-09-11 17:32:58
第一部分 机器学习的基础知识
第1章 机器学习概览
不久前,如果你拿起手机问它回家的路,它会不理你,人们会质疑你的理智。但机器学习不再是科幻小说:每天都有数十亿人在使用它。事实上,它已经在一些专业应用程序中存在了几十年,例如光学字符识别(Optical Character Recognition,OCR)。第一个真正成为主流、改善数亿人生活的ML应用程序在20世纪90年代风靡全球:垃圾邮件过滤器。它不完全是一个具有自我意识的机器人,但它在技术上确实称得上是机器学习:它实际上学得非常好,以至于你很少需要再将电子邮件标记为垃圾邮件。紧随其后的是数百个ML应用程序,它们现在悄悄地为你经常使用的数百种产品和功能提供支持:语音提示、自动翻译、图像搜索、产品推荐等。
机器学习从哪里开始,又在哪里结束呢?机器进行学习到底意味着什么?如果我下载了所有维基百科文章的副本,我的计算机就真的学会了什么吗?它突然变聪明了吗?在本章中,我将首先阐明什么是机器学习,以及你为什么想要使用它。
在我们开始探索机器学习大陆之前,我们先看一看地图并了解这片大陆上的主要区域和最显著的地标:监督学习与无监督学习及其变体、在线学习与批量学习、基于实例与基于模型的学习。然后,我们将了解典型机器学习项目的工作流程,讨论你可能面临的主要挑战,并介绍如何评估和微调机器学习系统。
本章将介绍每个数据科学家都应该牢记的许多基本概念(和专业术语)。虽然本章是概述(这是唯一没有太多代码的一章),相对简单,但我的目标是确保在我们继续阅读本书的其余部分之前,一切对你来说都是非常清楚的。所以喝杯咖啡,开始学习吧!
如果你已经熟悉机器学习基础知识,你可以直接跳到第2章。如果你不确定,可以尝试回答本章末尾列出的所有问题,然后再继续。