1.2 监督学习是什么

在机器学习中,通常可根据是否包含数据标注信息而被分为监督学习和无监督学习,有时也会包括半监督学习、主动学习和强化学习。监督(Supervise)一词意味着为保证任务符合规定而采取的监管行为。在英国大学中,“supervisor”指的就是“导师”的含义。因此,当数据样本不仅仅有着属性特征变量,还有着相应的类别或数值标签时,就表明通过学习过程,这些属性特征变量预测出的标注信息是受真实观测到的标注信息监管的,这就是将其称之为监督学习的原因。

定义1.1(监督学习) 监督学习(Supervised Learning)是指从标注数据中学习预测模型的机器学习问题,学习输入输出之间的对应关系,预测给定的输入产生相应的输出。

机器学习的目的,就是希望制作一台数据机器,从输入管投入原材料,从输出管产出想要的结果。对于监督学习而言,产出的结果逃不出输出空间。也就是说,输出空间是所有可能输出结果的集合。根据输出空间的不同,还可以将监督学习分为回归(Regression)问题和分类(Classification)问题,如果输出空间是由连续数值构成的,一般为回归问题,如果输出空间是由离散数值构成的,一般为分类问题。无论是回归问题还是分类问题,都是经典统计学研究的对象,所以说,监督学习的本质是学习从输入到输出的映射的统计规律。监督学习的数据机器示意图见图1.3。

图1.3 监督学习的数据机器示意图

举个例子,小明喜欢玩积木,现在有若干块三角形碎片积木。小明将这些积木按照位置坐标摆放,以颜色作为标注信息,分为黄色、蓝色、红色三类,绘制在图1.4中。这是一张来自彩色世界的图片,根据颜色标注就能轻松地将其分离。小明又做了些工作,应用监督学习中的线性判别方法在图1.4中标出两条黑色决策直线,这样三个类别的区域就确定下来了。

图1.4 分类问题

与监督学习相对的,则是不存在标注信息的学习过程,也就是无监督学习。无监督学习希望通过算法得到隐含在内部结构中的信息,输出结果更具有多样性。比如,小明还有一组碎片积木,形状、大小及个数完全相同,不过这些积木没有上色。换言之,这些积木都没有颜色类别的标注信息,每块积木只有对应的位置坐标信息,如图1.5所示。小明发现,这就如同回到了20世纪50年代,只能看到黑白电视的样子。这次,小明用无监督学习中的聚类方法,根据每块积木的位置,将这些积木划分为多个簇。结果出现了多种情况,比如分为2个簇,也有分为3个簇、4个簇的时候,甚至更多个簇。

图1.5 聚类问题