朴素贝叶斯法笔记

date

Sep 25, 2022

Last edited time

Sep 25, 2022 05:11 AM

status

Published

slug

朴素贝叶斯法笔记

符号定义

设输入空间为维向量的集合，输出空间为类标记集合) 。输入为特征向量，输出为类标记(class label) 。是定义在输入空间上的随机向量, 是定义在输出空间上的随机变量。是和的联合概率分布。

训练数据集由独立同分布产生。, 是第个样本的第个特征，, 是第个特征可能取的第个值，，，。

朴素贝叶斯先使用极大似然估计学习先验概率分布：

以及条件概率分布：

条件概率分布有指数级数量的参数，其估计实际是不可行的。朴素贝叶斯法对条件概率分布作了条件独立性的假设。由于这是一个较强的假设，朴素贝叶斯法也由此得名。具体地，条件独立性假设是：

那么，根据极大似然估计计算条件概率：

于是学习到联合概率分布。朴素贝叶斯法实际上学习到生成数据的机制，所以属于生成模型。

朴素贝叶斯法分类时，对给定的输入,通过学习到的模型计算后验概率分布 , 将后验概率最大的类作为的类输出。后验概率计算根据贝叶斯定理进行:

使用条件独立性假设：

那么，分类器为找到后验概率最大的类：

由于分母对于所有给定的无关：

朴素贝叶斯法将实例分到后验概率最大的类中。这等价于期望风险最小化。假设选择0-1损失函数:

式中是分类决策函数。这时，期望风险函数为

为了使期望风险最小化，只需对逐个极小化，由此得到:

这样一来，根据期望风险最小化准则就得到了后验概率最大化准则:

用极大似然估计可能会出现所要估计的概率值为0的情况。这时会影响到后验概率的计算结果，使分类产生偏差。解决这一问题的方法是采用贝叶斯估计。具体地，条件概率的贝叶斯估计是

式中。等价于在随机变量各个取值的频数上赋予一个正数。当时就是极大似然估计。常取 , 这时称为拉普拉斯平滑(Laplacian smoothing) 。

同样，先验概率的贝叶斯估计是：