第2讲 数据的形态描述

第1讲介绍了概率、概率分布函数、概率密度函数等,机器学习的本质是通过数据来寻找规律,所以分布就是描述数据形态的数学语言。通过分布我们找到数据的规律,发现其具有的特性,然后便可以加以利用。目前已知的分布有几十种,本章主要介绍几种和机器学习相关的分布,如图2-1所示。虽然下面的分布公式看起来比较复杂,结合具体的例子以及几个分布之间的关系,希望能让大家跳出公式来看实质。

图2-1