暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

朴素贝叶斯原理及作用

云南高校数据化运营管理工程中心 2019-04-29
663

目录






1.贝叶斯定理

2.朴素贝叶斯原理

3.朴素贝叶斯作用及其优势







编辑:

校对:

版本:

zhang

zhang

python3

贝叶斯定理


在引出贝叶斯定理之前,先学习几个定义:

边缘概率(又称先验概率):某个事件发生的概率。边缘概率是这样得到的:在联合概率中,把最终结果中那些不需要的事件通过合并成它们的全概率,而消去它们(对离散随机变量用求和得全概率,对连续随机变量用积分得全概率),这称为边缘化(marginalization)。

比如A的边缘概率表示为P(A),B的边缘概率表示为P(B)。联合概率表示两个事件共同发生的概率。A与B的联合概率表示为P(A∩B)或者P(A,B)。

条件概率(又称后验概率):事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为P(A|B),读作“在B条件下A的概率”,。

接着,考虑一个问题:P(A|B)是在B发生的情况下A发生的可能性。

首先,事件B发生之前,我们对事件A的发生有一个基本的概率判断,称为A的先验概率,用P(A)表示;

其次,事件B发生之后,我们对事件A的发生概率重新评估,称为A的后验概率,用P(A|B)表示;

类似的,事件A发生之前,我们对事件B的发生有一个基本的概率判断,称为B的先验概率,用P(B)表示;样,事件A发生之后,我们对事件B的发生概率重新评估,称为B的后验概率,用P(B|A)表示。

贝叶斯定理便是基于下述贝叶斯公式:

 



朴素贝叶斯原理


朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。

朴素贝叶斯 (naive Bayes) 是一种非常简单而又有效的分类方法. 如果因 变量的类为 c1,c2,...,cK, 朴素贝叶斯假定在给定ck的条件下自变量(x = (x1,x2,...,xn)) 都是独立的, 而且给定类别 (比如 ck) 之后假定了 它们的条件分布 p(xi|ck) 的类型, 比如正态、多项或 Bernoulli 分布等. 

说白了, 朴素贝叶斯的目的就是要计算在给定数据 x 的条件下属于类 ck 的概率 (后验概率)p(ck|x), 并且求使后验概率最大的类 ck. 根据贝叶斯定理, 后验分布 (给定数据 x 的条件下属于类 ck 的概率) 


朴素贝叶斯作用及其优势


朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。

但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响。

我们会选择高概率对应的类别。这就是贝叶斯决策理论的核心思想,即选择具有最高概率的决策。


思考——学而不思则罔

那么朴素贝叶斯有什么可以改进的地方吗?先想想哦,我们下次揭晓!

理解编程语言,探索数据奥秘

每日练习|干货分享|新闻资讯|公益平台。

每天学习一点点,你将会见到全新的自己。

长按识别二维码关注

文章转载自云南高校数据化运营管理工程中心,如果涉嫌侵权,请发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论