本文最后更新于:2025年10月21日 晚上
最小错误率贝叶斯决策是统计决策的核心方法之一,其核心目标是在已知类先验概率和类条件概率密度的前提下,通过贝叶斯公式将先验概率转化为后验概率,选择后验概率最大的类别作为决策结果,从而使分类的总体错误率最小。
一、核心思想与理论基础
分类决策的本质是对样本所属类别进行概率判断:
- 若样本特征为x,类别空间为{ω1,ω2,…,ωc}(c为类别数),需比较样本属于各类别的后验概率P(ωi∣x);
- 后验概率反映"已知特征x时,样本属于ωi类"的置信度,由先验概率P(ωi)(类别ωi在总体中出现的概率)和类条件概率密度p(x∣ωi)(类别ωi中特征x的分布密度)通过贝叶斯公式推导得出。
二、关键公式与推导
1. 贝叶斯公式:先验概率与后验概率的转换
根据概率论中的贝叶斯公式,后验概率P(ωi∣x)的计算公式为:
P(ωi∣x)=p(x)p(x∣ωi)P(ωi)(i=1,2,…,c)(2-9)
其中:
2. 最小错误率决策规则
由于分母p(x)对所有类别ωi相同,比较后验概率P(ωi∣x)的大小等价于比较分子p(x∣ωi)P(ωi)的大小。因此,最小错误率贝叶斯决策规则可表示为以下3种等价形式:
(1)后验概率最大准则
若某类别ωk的后验概率大于其他所有类别,则将样本归为ωk:
若 P(ωk∣x)=j=1,2,…,cmaxP(ωj∣x)⟹x∈ωk(2-10)
(2)联合概率最大准则
直接比较p(x∣ωi)P(ωi)(类条件概率密度与先验概率的乘积,即联合概率密度的核心部分):
若 p(x∣ωk)P(ωk)=j=1,2,…,cmaxp(x∣ωj)P(ωj)⟹x∈ωk(2-11)
(3)似然比准则(两类问题专用)
对于两类问题(c=2),定义似然比l(x)=p(x∣ω2)p(x∣ω1)(反映特征x属于ω1与ω2的似然度比值),决策规则可转化为与阈值λ=P(ω1)P(ω2)比较:
若 l(x)≷λ⟹x∈{ω1ω2(2-12)
- 当l(x)>λ时,P(ω1∣x)>P(ω2∣x),决策为ω1;
- 当l(x)<λ时,决策为ω2。
(4)对数似然比准则(数值计算优化)
为避免乘积运算溢出,对似然比取负对数(负对数为单调递减函数,不改变决策结果),定义对数似然比h(x)=−lnl(x),决策规则变为:
若 h(x)≤lnP(ω2)P(ω1)⟹x∈{ω1ω2(2-13)
三、错误率的定义与计算
1. 错误率的本质
错误率P(e)是所有样本分类错误的概率期望,反映分类器的总体性能。对于两类问题,错误率由两部分组成:
- P1(e):将ω1类样本误判为ω2的概率;
- P2(e):将ω2类样本误判为ω1的概率。
2. 错误率计算公式
两类问题的平均错误率为:
P(e)=P(ω1)P1(e)+P(ω2)P2(e)(2-15)
其中:
- P1(e)=∫ℜ2p(x∣ω1)dx(ℜ2为ω2类的决策区域,即ω1类样本落入ℜ2的概率);
- P2(e)=∫ℜ1p(x∣ω2)dx(ℜ1为ω1类的决策区域)。
决策区域ℜ1与ℜ2由决策边界划分,满足P(ω1∣x)=P(ω2∣x)(或p(x∣ω1)P(ω1)=p(x∣ω2)P(ω2))。
四、多类问题的扩展
当类别数c>2时,最小错误率贝叶斯决策规则保持一致:
- 对每个类别ωi,计算后验概率P(ωi∣x)(或p(x∣ωi)P(ωi));
- 选择后验概率最大的类别作为决策结果,数学表达为:
若 P(ωk∣x)=j=1,2,…,cmaxP(ωj∣x)⟹x∈ωk(2-17a)
或等价地:
若 p(x∣ωk)P(ωk)=j=1,2,…,cmaxp(x∣ωj)P(ωj)⟹x∈ωk(2-17b)
多类问题的决策边界为相邻两类决策区域的分界面,满足P(ωi∣x)=P(ωj∣x)(i=j)。
五、核心总结
| 核心概念 |
数学表达/规则 |
作用 |
| 贝叶斯公式 |
P(ωi∣x)=p(x)p(x∣ωi)P(ωi) |
连接先验概率与后验概率,为决策提供依据 |
| 最小错误率决策规则(两类) |
1. P(ω1∣x)>P(ω2∣x)⟹x∈ω1; 2. p(x∣ω1)P(ω1)>p(x∣ω2)P(ω2)⟹x∈ω1; 3. l(x)>λ⟹x∈ω1 |
确保单次决策错误率最小 |
| 平均错误率(两类) |
P(e)=P(ω1)∫ℜ2p(x∣ω1)dx+P(ω2)∫ℜ1p(x∣ω2)dx |
衡量分类器总体性能 |
最小错误率贝叶斯决策的前提是已知P(ωi)和p(x∣ωi),若这两个参数未知,则需通过样本估计(见第3章概率密度估计)。