900字范文 > 吴恩达机器学习学习笔记之一监督学习和无监督学习

吴恩达机器学习学习笔记之一监督学习和无监督学习

时间：2021-03-15 23:00:02

一、

1-1 welcome

1-2 什么是机器学习——Machine Learning

机器学习尚无明确定义，现有的定义有：

（1）Field of study that gives computers the ability to learn about being explicity (明确地) programmed. ——Arthur Samuel 机器学习做什么

机器学习是一个学习领域，并在没有明确训练的情况下，交给计算机学习的能力。

注：该定义之所以成名，是因为Samuel编写了一个跳棋程序。该程序使计算机自己与自己下棋，通过成百上千次的训练、观察，逐渐学会哪些是好的布局，最终计算机成为一个跳棋高手，尽管其创作者Samuel并不擅长跳棋游戏。

（2）A computer program is said to learn from experience E with respect to some task T and some performance measure P , if its performance on T , as measured by P , improved with experience E. —— Tom Mitchell 良好的学习问题是什么

计算机程序从经验E中学习任务T，并用度量P来衡量性能。条件是它（由P衡量的）关于T的性能随着经验E而提高。

对于跳棋游戏，经验E就是计算机与自己玩10次，1000次的跳棋；任务T就是玩跳棋的任务；性能度量P就是与新对手玩跳棋时赢的概率。

后面将会讲不同类型的学习算法，主要有两类：监督学习（Supervised learning）和非监督学习（Unsupervised learning）。

监督学习：我们教计算机如何做事情。

非监督学习：计算机自己学习。

其他的学习算法，例如增强学习（Reinforcement learning）和推荐系统（recommender systems）。

1-3 监督学习——Supervised Learning

本节讲述机器学习的最普通类型是什么，哪些是监督学习。

例1：预测房屋价格

例子，假设想要预测房屋价格，绘制了下面这样的数据集。水平轴上，不同房屋的尺寸是平方英尺，在竖直轴上，是不同房子的价格，单位时（千万$）。给定数据，假设一个人有一栋房子，750平方英尺，他要卖掉这栋房子，想知道能卖多少钱。

那么学习算法能做的事是什么呢？可能是根据数据画一条直线或者说用一条直线拟合数据。看上去，可能会卖150K美元。

但是，这不是唯一的学习算法，可能有更好的。例如，不是用一条直线拟合数据，而是用一个二次函数或二阶多项式来拟合数据，这样效果可能会更好。在这种情况下，该房子可能会卖到200K美元。

后面要讨论的就是如何选择，决定用直线还是二次函数进行拟合。

这是监督学习的很好的例子，监督学习是指我们给算法一个数据集，并且给定正确答案。也就是说，我们给定一个房屋数据集，在这个数据集中的每个例子，我们都给出正确的价格，也即这个房子卖出的实际价格。算法的目的就是给出更多的正确答案，例如对待售房子，假如想要给待售的房子估价，这也称为回归问题（Regression ： Predict continuous value output——price）。之所以称为回归问题，是因为其预测连续的输出值，即价格。

例2：估计肿瘤性质

另一个例子，假设想要看医疗记录，并且想设法预测乳腺癌是恶性的还是良性的。假设某人发现了一个乳腺瘤，在乳腺上有个z肿块，恶性瘤是危险的、有害的；良性瘤是无害的。

假设在数据集中，水平轴是瘤的尺寸，竖直轴是1或0，也可以是Y或N。在已知肿瘤样例中，恶性的标为1，良性的标为0。那么，如下，蓝色的样例便是良性的，红色的是恶性的。

假设一个人得了乳腺癌（即图中紫红色箭头指示的样例），机器学习的任务就是估计该肿瘤的性质，是恶性的还是良性的。

引入一个更专业的术语，这就是一个分类问题（calssification problem）。

Classification refers to the fact that here we're trying to predict a discrete value output : zero or one , malignant or benign .

分类是指预测一个连续的输出值，0或1，恶性或良性。

在分类问题中，可以输出多于两个值。在实际例子中，可能有三中类型的乳腺癌。因此，要预测离散值0,1,2,3，其中0是良性的。1、2、3分别代表癌症1，癌症2，癌症3。可以用另一种方法来表示这些数据，用不同的符号集来绘制这组数据。假设瘤的尺寸是用来预测恶性或良性的特征。用不同的符号表示良性或恶性，或说反例和正例。我们可以用圈表示良性，继续用红叉表示恶性，把数据集映射到这条实线上。