Machine Learning — 监督学习与非监督学习

斯坦福大学的Machine Learning课程(讲师是Andrew Ng)公开课是学习机器学习的“圣经”,以下内容是听课笔记。

一、何谓机器学习

Machine Learning is field of study that gives computers the ability to learn without being explicitly programmed.

也就是说机器学习不需要制定具体的模型,而是让计算机根据庞大的数据量自己训练模型,与之相对的,例如CFD软件,是建立在物理模型之上的,例如输运方程等。

二、监督学习(Supervised learning)

数据集中的每个样本有相应的“正确答案”,根据这些样本做出预测,分有两类:回归问题和分类问题

(1)回归问题

例如预测房价,根据样本集拟合出一条连续曲线

(2)分类问题

例如:根据肿瘤特征判断良性还是恶性,得到的是结果是“良性”或者“恶性”,是离散的

 二、非监督学习(Unsupervised learning)

非监督学习的数据集跟监督学习不同,没有任何标签,即没有相应的“正确答案”。从数据集中可以通过非监督学习得到数据的某种结构,可能是把数据分成两个不同的聚集簇,称为聚类算法。

例如:

 

posted @ 2017-05-10 11:15  S的数据之路  阅读(6880)  评论(0编辑  收藏  举报