2.2 错误率与贝叶斯决策

本文最后更新于:2025年10月21日 晚上

最小错误率贝叶斯决策是统计决策的核心方法之一,其核心目标是在已知类先验概率和类条件概率密度的前提下,通过贝叶斯公式将先验概率转化为后验概率,选择后验概率最大的类别作为决策结果,从而使分类的总体错误率最小。

一、核心思想与理论基础

分类决策的本质是对样本所属类别进行概率判断:

  • 若样本特征为xx,类别空间为{ω1,ω2,,ωc}\{\omega_1, \omega_2, \dots, \omega_c\}cc为类别数),需比较样本属于各类别的后验概率P(ωix)P(\omega_i | x)
  • 后验概率反映"已知特征xx时,样本属于ωi\omega_i类"的置信度,由先验概率P(ωi)P(\omega_i)(类别ωi\omega_i在总体中出现的概率)和类条件概率密度p(xωi)p(x | \omega_i)(类别ωi\omega_i中特征xx的分布密度)通过贝叶斯公式推导得出。

二、关键公式与推导

1. 贝叶斯公式:先验概率与后验概率的转换

根据概率论中的贝叶斯公式,后验概率P(ωix)P(\omega_i | x)的计算公式为:

P(ωix)=p(xωi)P(ωi)p(x)(i=1,2,,c)(2-9)P(\omega_i | x) = \frac{p(x | \omega_i) P(\omega_i)}{p(x)} \quad (i=1,2,\dots,c) \tag{2-9}

其中:

  • 分母p(x)p(x)总体密度,是所有类别特征xx的混合密度,满足:

    p(x)=j=1cp(xωj)P(ωj)p(x) = \sum_{j=1}^c p(x | \omega_j) P(\omega_j)

    其作用是对后验概率进行归一化,确保所有类别后验概率之和为1(即i=1cP(ωix)=1\sum_{i=1}^c P(\omega_i | x) = 1)。

2. 最小错误率决策规则

由于分母p(x)p(x)对所有类别ωi\omega_i相同,比较后验概率P(ωix)P(\omega_i | x)的大小等价于比较分子p(xωi)P(ωi)p(x | \omega_i) P(\omega_i)的大小。因此,最小错误率贝叶斯决策规则可表示为以下3种等价形式:

(1)后验概率最大准则

若某类别ωk\omega_k的后验概率大于其他所有类别,则将样本归为ωk\omega_k

若 P(ωkx)=maxj=1,2,,cP(ωjx)    xωk(2-10)\text{若 } P(\omega_k | x) = \max_{j=1,2,\dots,c} P(\omega_j | x) \implies x \in \omega_k \tag{2-10}

(2)联合概率最大准则

直接比较p(xωi)P(ωi)p(x | \omega_i) P(\omega_i)(类条件概率密度与先验概率的乘积,即联合概率密度的核心部分):

若 p(xωk)P(ωk)=maxj=1,2,,cp(xωj)P(ωj)    xωk(2-11)\text{若 } p(x | \omega_k) P(\omega_k) = \max_{j=1,2,\dots,c} p(x | \omega_j) P(\omega_j) \implies x \in \omega_k \tag{2-11}

(3)似然比准则(两类问题专用)

对于两类问题(c=2c=2),定义似然比l(x)=p(xω1)p(xω2)l(x) = \frac{p(x | \omega_1)}{p(x | \omega_2)}(反映特征xx属于ω1\omega_1ω2\omega_2的似然度比值),决策规则可转化为与阈值λ=P(ω2)P(ω1)\lambda = \frac{P(\omega_2)}{P(\omega_1)}比较:

若 l(x)λ    x{ω1ω2(2-12)\text{若 } l(x) \gtrless \lambda \implies x \in \begin{cases} \omega_1 \\ \omega_2 \end{cases} \tag{2-12}

  • l(x)>λl(x) > \lambda时,P(ω1x)>P(ω2x)P(\omega_1 | x) > P(\omega_2 | x),决策为ω1\omega_1
  • l(x)<λl(x) < \lambda时,决策为ω2\omega_2

(4)对数似然比准则(数值计算优化)

为避免乘积运算溢出,对似然比取负对数(负对数为单调递减函数,不改变决策结果),定义对数似然比h(x)=lnl(x)h(x) = -\ln l(x),决策规则变为:

若 h(x)lnP(ω1)P(ω2)    x{ω1ω2(2-13)\text{若 } h(x) \leq \ln \frac{P(\omega_1)}{P(\omega_2)} \implies x \in \begin{cases} \omega_1 \\ \omega_2 \end{cases} \tag{2-13}

三、错误率的定义与计算

1. 错误率的本质

错误率P(e)P(e)是所有样本分类错误的概率期望,反映分类器的总体性能。对于两类问题,错误率由两部分组成:

  • P1(e)P_1(e):将ω1\omega_1类样本误判为ω2\omega_2的概率;
  • P2(e)P_2(e):将ω2\omega_2类样本误判为ω1\omega_1的概率。

2. 错误率计算公式

两类问题的平均错误率为:

P(e)=P(ω1)P1(e)+P(ω2)P2(e)(2-15)P(e) = P(\omega_1) P_1(e) + P(\omega_2) P_2(e) \tag{2-15}

其中:

  • P1(e)=2p(xω1)dxP_1(e) = \int_{\Re_2} p(x | \omega_1) dx2\Re_2ω2\omega_2类的决策区域,即ω1\omega_1类样本落入2\Re_2的概率);
  • P2(e)=1p(xω2)dxP_2(e) = \int_{\Re_1} p(x | \omega_2) dx1\Re_1ω1\omega_1类的决策区域)。

决策区域1\Re_12\Re_2决策边界划分,满足P(ω1x)=P(ω2x)P(\omega_1 | x) = P(\omega_2 | x)(或p(xω1)P(ω1)=p(xω2)P(ω2)p(x | \omega_1) P(\omega_1) = p(x | \omega_2) P(\omega_2))。

四、多类问题的扩展

当类别数c>2c > 2时,最小错误率贝叶斯决策规则保持一致:

  1. 对每个类别ωi\omega_i,计算后验概率P(ωix)P(\omega_i | x)(或p(xωi)P(ωi)p(x | \omega_i) P(\omega_i));
  2. 选择后验概率最大的类别作为决策结果,数学表达为:

若 P(ωkx)=maxj=1,2,,cP(ωjx)    xωk(2-17a)\text{若 } P(\omega_k | x) = \max_{j=1,2,\dots,c} P(\omega_j | x) \implies x \in \omega_k \tag{2-17a}

或等价地:

若 p(xωk)P(ωk)=maxj=1,2,,cp(xωj)P(ωj)    xωk(2-17b)\text{若 } p(x | \omega_k) P(\omega_k) = \max_{j=1,2,\dots,c} p(x | \omega_j) P(\omega_j) \implies x \in \omega_k \tag{2-17b}

多类问题的决策边界为相邻两类决策区域的分界面,满足P(ωix)=P(ωjx)P(\omega_i | x) = P(\omega_j | x)iji \neq j)。

五、核心总结

核心概念 数学表达/规则 作用
贝叶斯公式 P(ωix)=p(xωi)P(ωi)p(x)P(\omega_i \mid x) = \frac{p(x \mid \omega_i) P(\omega_i)}{p(x)} 连接先验概率与后验概率,为决策提供依据
最小错误率决策规则(两类) 1. P(ω1x)>P(ω2x)    xω1P(\omega_1 \mid x) > P(\omega_2 \mid x) \implies x \in \omega_1
2. p(xω1)P(ω1)>p(xω2)P(ω2)    xω1p(x \mid \omega_1) P(\omega_1) > p(x \mid \omega_2) P(\omega_2) \implies x \in \omega_1
3. l(x)>λ    xω1l(x) > \lambda \implies x \in \omega_1
确保单次决策错误率最小
平均错误率(两类) P(e)=P(ω1)2p(xω1)dx+P(ω2)1p(xω2)dxP(e) = P(\omega_1) \int_{\Re_2} p(x \mid \omega_1) dx + P(\omega_2) \int_{\Re_1} p(x \mid \omega_2) dx 衡量分类器总体性能

最小错误率贝叶斯决策的前提是已知P(ωi)P(\omega_i)p(xωi)p(x | \omega_i),若这两个参数未知,则需通过样本估计(见第3章概率密度估计)。


2.2 错误率与贝叶斯决策
https://hellowydwyd.github.io/2025/10/21/2-2-错误率与贝叶斯决策/
作者
YuDong Wang
发布于
2025年10月21日
许可协议