本文最后更新于:2025年10月21日 晚上
最小风险贝叶斯决策的核心是考虑分类错误带来的损失差异,在贝叶斯决策框架下追求"期望风险最小",而非单纯的"错误率最小",是最小错误率贝叶斯决策的扩展(后者可视为前者的特例)。
一、核心概念与符号约定
1. 基本要素定义
- 样本:x∈Rd(d维特征向量)
- 状态空间:Ω={ω1,ω2,…,ωc}(c个类别,即c种自然状态)
- 决策空间:Δ={α1,α2,…,αk}(k种可能决策,k可不等于c,如含"拒绝决策")
- 损失函数:λ(αi,ωj)(对真实状态为ωj的样本采取决策αi时的损失)
2. 决策表示例(损失函数λ(αi,ωj)的一般决策表)
| 决策\状态 |
ω1 |
ω2 |
… |
ωj |
… |
ωc |
| α1 |
λ(α1,ω1) |
λ(α1,ω2) |
… |
λ(α1,ωj) |
… |
λ(α1,ωc) |
| α2 |
λ(α2,ω1) |
λ(α2,ω2) |
… |
λ(α2,ωj) |
… |
λ(α2,ωc) |
| ⋮ |
⋮ |
⋮ |
⋱ |
⋮ |
⋱ |
⋮ |
| αi |
λ(αi,ω1) |
λ(αi,ω2) |
… |
λ(αi,ωj) |
… |
λ(αi,ωc) |
| ⋮ |
⋮ |
⋮ |
… |
⋮ |
⋱ |
⋮ |
| αk |
λ(αk,ω1) |
λ(αk,ω2) |
… |
λ(αk,ωj) |
… |
λ(αk,ωc) |
- 通常约定:正确决策损失最小(如λ(αi,ωi)=0),错误决策损失更大(如λ(αi,ωj)>0,i=j)。
二、核心公式推导
1. 条件风险(给定样本x时的期望损失)
对样本x,已知其属于各类的后验概率P(ωj∣x)(由贝叶斯公式P(ωj∣x)=p(x)p(x∣ωj)P(ωj)计算),采取决策αi的条件风险定义为:
R(αi∣x)=j=1∑cλ(αi,ωj)P(ωj∣x)(2-26)
- 含义:在样本x的特征信息下,采取决策αi时,所有可能自然状态(类别)对应的损失加权和(权重为后验概率)。
2. 期望风险(全局平均风险)
对所有可能样本x,条件风险的加权平均(权重为样本x的概率密度p(x)),即期望风险:
R=∫RdR(α(x)∣x)p(x)dx(2-28)
- 含义:全局范围内采取决策规则α(x)(对不同x选择不同αi)的平均损失,是衡量决策性能的全局指标。
3. 最小风险决策规则
要使期望风险R最小,需对每个样本x单独最小化其条件风险(因p(x)≥0,全局积分最小等价于逐点最小),即:
α∗=argi=1,2,…,kminR(αi∣x)(2-27)
- 含义:对每个样本x,选择条件风险最小的决策α∗,该决策即为当前样本的最优决策。
三、两类问题的简化形式(无拒绝决策)
当问题为两类(ω1,ω2)且决策仅为"判为ω1"(α1)或"判为ω2"(α2)时,公式可简化:
1. 关键损失约定
- λ11=λ(α1,ω1)(正确决策:ω1判为ω1的损失)
- λ12=λ(α1,ω2)(错误决策:ω2判为ω1的损失)
- λ21=λ(α2,ω1)(错误决策:ω1判为ω2的损失)
- λ22=λ(α2,ω2)(正确决策:ω2判为ω2的损失)
通常取λ11=λ22=0,且λ12>0、λ21>0。
2. 条件风险简化
- 决策α1(判为ω1)的条件风险:
R(α1∣x)=λ12P(ω2∣x)(2-28a)
- 决策α2(判为ω2)的条件风险:
R(α2∣x)=λ21P(ω1∣x)(2-28b)
3. 两类问题的决策规则
比较R(α1∣x)与R(α2∣x),选择风险更小的决策:
若 λ12P(ω2∣x)≤λ21P(ω1∣x)⟹x∈ω1若 λ12P(ω2∣x)>λ21P(ω1∣x)⟹x∈ω2(2-29)
4. 似然比形式(与贝叶斯公式结合)
将后验概率P(ωj∣x)=p(x)p(x∣ωj)P(ωj)代入式(2-29),消去公共项p(x),可得似然比决策规则:
定义似然比l(x)=p(x∣ω2)p(x∣ω1),阈值λ=λ21P(ω1)λ12P(ω2),则:
若 l(x)≥λ⟹x∈ω1若 l(x)<λ⟹x∈ω2(2-31)
四、与最小错误率贝叶斯决策的关系
当两类错误损失相等(λ12=λ21=1)且正确决策损失为0(λ11=λ22=0)时,最小风险决策规则退化为最小错误率决策规则:
- 条件风险简化为错误概率:R(α1∣x)=P(ω2∣x)(错误率),R(α2∣x)=P(ω1∣x)(错误率);
- 决策规则变为:若 P(ω1∣x)>P(ω2∣x)⟹x∈ω1,即最小错误率准则。
五、示例
已知条件(例2.1延伸):
- 先验概率:P(ω1)=0.9(正常细胞),P(ω2)=0.1(异常细胞);
- 类条件密度:p(x∣ω1)=0.2,p(x∣ω2)=0.4;
- 损失表:λ11=0,λ12=6,λ21=1,λ22=0。
步骤1:计算后验概率(例2.1结果)
P(ω1∣x)=0.818,P(ω2∣x)=0.182
步骤2:计算条件风险
R(α1∣x)R(α2∣x)=λ12P(ω2∣x)=6×0.182=1.092=λ21P(ω1∣x)=1×0.818=0.818
步骤3:决策
因R(α2∣x)<R(α1∣x),故决策为ω2(异常细胞)—— 与最小错误率决策(判为ω1)结果相反,体现了"损失差异"对决策的影响。
六、核心结论
- 最小风险贝叶斯决策的关键是损失函数设计,需结合领域知识(如"漏诊癌症"损失远大于"误诊正常");
- 决策过程需先计算后验概率,再计算条件风险,最终选择风险最小的决策;
- 最小错误率决策是最小风险决策的特例(损失均等时),更适用于"错误损失无差异"的场景。