本站原创文章,转载请说明来自《老饼讲解-机器学习》ml.bbbdata.com
《老饼讲解-机器学习》--一个免费、专业、全面的机器学习网站http://ml.bbbdata.com/
目录
线性回归中一般使用均方差作为损失函数,那均方差的背景意义是什么呢?
本文从概率的角度讲解,线性回归中均方差损失函数的实际意义。
一、线性回归模型简单回顾
01.模型思想
线性回归模型以一条直线拟合数据
02.模型表达式
线性回归的模型表达式为:
03.模型损失函数
线性回归的损失函数为均方差
二、线性回归的误差
理想中 y与x的关系为,
但由于 除 外,还受一些未知的因素的影响,
因此,与 并不完全相等,
它们存在误差
现假设误差 服从正态随机分布。
从这个假设可知,某个样本的误差为 时的概率为
三、最大似然函数
那么,根据最大似然函数的思想,
令所有样本同时出现的概率最大化即可。
可以易得,最大似然函数如下:
P的意义是,如果y=wx,P就是采到当前这种误差特征的样本集的概率。
我们希望这个概率越大越好,
线性回归的问题也就变成求一w使得P最大的纯数学问题。
四、最大似然函数与均方差的关系
直接求一w使得P最大,不太好求,
P中含有大量连乘,可以对P加上对数来去除连乘运算,
因为加对数后的ln(P)与 P在同一w取得最大值,
因此上述问题可以转为求一w使得ln(P)最大。
要令
最大
实际只需令
最小可知,
线性回归中以均方差
作为损失函数,
实际上就是最大化样本的最大似然函数。
五、总结
所以,线性回归中,令 最小的本质意义,
是假设未知因素带来的误差服从正态分布,
求一个w,
使得采集到当前(这样的误差特征的)样本数据的概率最大。
参考文章
《机器学习一问一答(1):线性回归》:https://zhuanlan.zhihu.com/p/75217411?from=singlemessage
相关文章
本文含有隐藏内容,请 开通VIP 后查看