贝叶斯估计

发布于:2024-07-01 ⋅ 阅读:(20) ⋅ 点赞:(0)

       本篇文章是博主在人工智能等领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对人工智能等领域的一些理解而记录的学习摘录和笔记,若有不当和侵权之处,指出后将会立即改正,还望谅解。文章分类在AI学习笔记

      AI学习笔记(16)---《贝叶斯估计》

贝叶斯估计

目录

1.前言

2.贝叶斯估计基本概念

2.1贝叶斯定理

2.2贝叶斯估计的基本思想

2.3贝叶斯估计的特点

2.4最大后验概率

2.5参数风险最小估计问题

2.6贝叶斯估计应用领域

3.贝叶斯估计的基本步骤

4.编程实现

4.1欧式距离计算MATLAB代码

4.2数据集


1.前言

        理解并掌握贝叶斯估计相关知识,编程实现使用已有训练样本进行学习从而获得类概率,在实践中对贝叶斯估计有一个深刻认识。


2.贝叶斯估计基本概念

2.1贝叶斯定理

        贝叶斯定理是贝叶斯估计的基础,它描述了条件概率之间的关系。给定两个事件A和B,贝叶斯定理可以表示为:

[ P(A|B) = \frac{P(B|A)P(A)}{P(B)} ]

其中:

  • ( P(A|B) ) 是事件B发生后事件A发生的概率,即后验概率(posterior probability)。
  • ( P(B|A) ) 是事件A发生后事件B发生的概率,即似然函数(likelihood function)。
  • ( P(A) ) 是事件A发生的概率,即先验概率(prior probability)。
  • ( P(B) ) 是事件B发生的概率,即证据因子(marginal likelihood)或标准化常量(normalizing constant)。

2.2贝叶斯估计的基本思想

        在贝叶斯估计中,我们首先对未知参数设定一个先验分布(prior distribution),该分布反映了在观察数据之前对参数的信念。然后,根据观察到的数据,我们使用贝叶斯定理更新先验分布,得到后验分布(posterior distribution)。后验分布综合了先验信息和数据信息,反映了在观察数据后对参数的信念。

2.3贝叶斯估计的特点

  • 结合先验信息:贝叶斯估计能够结合先验信息和数据信息,对未知参数进行更准确的推断。
  • 易于处理复杂模型:贝叶斯估计可以处理复杂的非线性模型和非参数模型,而不需要像频率派方法那样进行复杂的近似或假设。
  • 易于进行预测:贝叶斯估计可以直接使用后验分布进行预测,而不需要像频率派方法那样进行额外的假设或近似。
  • 对样本量的依赖性较小:在样本量较小或数据稀疏的情况下,贝叶斯估计通常比频率派方法更加稳健。

2.4最大后验概率

        用一组样本集X(N)={x1​,x2​,...,xN​}估计未知参数 θ,其中未知参数 θ视为随机变量,先验分布为p(θ),而在一直样本集X(N)出现的条件下的后验概率为p(θ∣X(N)),最大后验概率估计(Maximum a posteriori,MAP)为:

2.5参数风险最小估计问题

        参数估计的条件风险:给定x条件下,估计量的条风险

参数估计的风险:

贝叶斯估计:是风险最小的估计 

        因此我们可以知道,贝叶斯估计的思想是:所求得的θ的估计值θ^应使估计损失的期望最小,这种使R或等价的使R(θ^∣X(N))取最小值的θ的估值θ^称为θ的贝叶斯估计。

2.6贝叶斯估计应用领域

        贝叶斯估计在机器学习、自然语言处理、图像处理、金融、生物信息学等领域都有广泛的应用。例如,在机器学习中,贝叶斯估计可以用于分类、回归、聚类等问题;在自然语言处理中,贝叶斯估计可以用于文本分类、情感分析、命名实体识别等任务。


3.贝叶斯估计的基本步骤

  1. 设定先验分布:根据对未知参数的先验知识或假设,设定一个先验分布。
  2. 计算似然函数:根据观察到的数据和参数,计算似然函数。似然函数描述了给定参数时数据出现的概率。
  3. 计算后验分布:使用贝叶斯定理,将先验分布和似然函数结合,计算后验分布。后验分布是参数在给定数据下的条件概率分布。
  4. 提取估计值:从后验分布中提取参数的估计值。常用的估计值包括后验分布的均值、中位数、众数或最高后验密度区间(HPDI)。

贝叶斯估计公式步骤:


4.编程实现

4.1欧式距离计算MATLAB代码

load data X;     % 加载样本数据
u = 3.4;        % 总体分布密度的均值
sigma = 2.1;     % 总体分布密度的标准差
u0 = 3.6;       	% 未知参数分布的均值
sigma0 = 0.4;    	  % 位置参数分布的标准差
num = 100;      	 % 样本个数
Xmu = sum(X)/num;		% 样本均值

%% 计算贝叶斯估计值
u1 = num*sigma0^2*Xmu/(num*sigma0^2+sigma^2)+sigma^2*u0/(num*sigma0^2+sigma^2);

%% 输出贝叶斯估计值
fprintf('贝叶斯估计值为:%f\n', u1)
u2 = abs(u1-u)/u;
fprintf('与真实值的相对误差为:%f',u2);

4.2数据集

data.mat

4.167983062196423	6.234539381372496	2.4871356515182015	6.38246642544228	4.305936967504019	3.8948560918121076	2.42504046218728	3.585337805426096	4.693100094102957	-0.2071004137346204	3.3835225509135154	3.16160572412044	1.8412996343691084	1.625112903902987	3.145859073853583	6.328295166073646	8.474706247567585	2.8268973464015836	3.047469524461643	1.742564844144624	2.3472929186228435	3.386815647463195	8.914211075137885	3.55835096271622	2.4749792046647854	5.6706734273860455	4.279709025449018	5.970282358423448	1.493822502483431	2.7703693866332246	1.1840745337114589	0.895097439279458	6.235699832286631	-0.09016492376748486	3.5329071119365243	4.506793913526547	4.1640999644244445	4.344635614532367	1.0270526850339308	6.153037063907495	1.2601072905896702	1.090162879491539	3.377550240261528	1.392524962282875	7.946434521403955	3.729533619445359	2.6564572534829263	3.5082376769922394	2.306640230040103	1.5434246823185411	1.6767062491479232	4.281451748366938	1.8463784705282824	5.142661681266719	0.9149157939117938	5.414718870878357	6.042391911654972	3.1174770537278347	2.169457703214002	0.29596047612616827	0.13946176497057294	4.516589785160132	5.559731152409801	5.419362337056535	3.408631720329787	0.9145030252951916	3.7556146366943146	4.84207013929333	3.3404622213704354	4.421642212902409	2.7187687793871502	6.017534084137088	-0.7315734978224628	2.968962112852342	2.4843460987506214	6.051147991940162	7.177547027611765	3.627344545368597	5.223658728938682	3.2731515004197203	7.967143399566384	3.4728891504034456	1.7751241959509925	4.661794232609458	3.913804634194605	1.4980519768066363	0.03960849819464096	5.751798780172036	2.171206244988035	4.520102347037545	0.09638011417085535	4.583255222871107	1.5942832677776422	-0.11934371982788017	4.887001301354608	3.627799275861265	5.041679715055801	2.363392858761424	3.701610161946016

      文章若有不当和不正确之处,还望理解与指出。由于部分文字、图片等来源于互联网,无法核实真实出处,如涉及相关争议,请联系博主删除。如有错误、疑问和侵权,欢迎评论留言联系作者,或者私信联系作者。