机器学习笔记-1

监督学习(Surpervised learning)  

在监督学习中,给定一组数据,我们知道正确的输出结果应该是什么样子,并且知道在输入和输出之间有着一个特定的关系.

回归问题(Regression)  

通常是预测一个值.
eg.预测某个面积的房屋价格

分类问题(Classification)  

预测一个离散值,试图将输入变量与离散的类别对应起来.
eg.预测某个大小的肿瘤是良性还是恶性
有时分类问题可能会有多种输出,可能不止两种.

无监督学习(Unsupervised learning)  

在无监督学习中,我们基本上不知道结果会是什么样子,但我们可以通过聚类的方式从数据中提取一个特殊的结构.在无监督学习中给定的数据是和监督学习中给定的数据是不一样的.在无监督学习中给定的数据没有任何标签.
eg.Google News 会自动将网上的新闻分类,例如XX油井发生火灾的分类里面的页面都是互联网上关于这场火灾的报道.

线性回归模型(Linear regression)  

$$ h_\theta(x)=\theta_0+\theta_1x $$
(单变量线性回归)
h即为假设(hypothess),是拟合的函数.

代价函数(Cost function)/平方误差函数(Square error function)  

$$ J(\theta_0,\theta_1)=\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x^i)-y^i)^2 $$